如何使用 Python Pandas 更新行和列

让我们来了解如何使用PythonPanda来更新行和列。在现实世界中,我们大部分时间都没有准备好分析数据集。可能有很多不一致,无效的值,不合适的标签,等等。 说到这一点,更新这些值以实现数据的统一性是麻烦的。 在本教程中,我们将专注于如何在Python中使用Panda来更新行和列。


创建一个 Pandas 数据框架

在整个教程中,我们将使用我们现在将创建的数据框架,这将为您提供更新数据操作的想法。

要创建数据框架,panda 提供了函数名称 pd.DataFrame,这有助于您从一些数据中创建数据框架。

1#create a dictionary 
2
3import pandas as pd
4
5fruit_data = {"Fruit": ['Apple','Avacado','Banana','Strawberry','Grape'],"Color": ['Red','Green','Yellow','Pink','Green'],
6"Price": [45, 90, 60, 37, 49]
7}
8
9fruit_data

在这里,我们创建了一个 Python 字典,其中包含一些数据值,现在我们被要求将这个字典转化为一个 Pandas 数据框架。

1#Dataframe 
2
3data = pd.DataFrame(fruit_data)
4data

Fruitdata

使用 pandas 的 pd.DataFrame 函数,您可以轻松地将字典变成 pandas 数据框架。

** 阅读更多:** [如何使用 Pandas 更改列排序]( / 社区 / 教程 / 更改列排序使用 Pandas)


2、更新列表

有时,列或特征的名称会不一致. 它可能与字母的案例等等. 有一个统一的设计有助于我们有效地与特征工作。

因此,作为第一步,我们将看到我们如何更新/更改数据中的列或功能名称。

1#update the column name
2
3data.rename(columns = {'Fruit':'Fruit Name'})

Update 1

就像上面所示一样简单. 您甚至可以同时更新多个列名称. 为了做到这一点,您必须在弯曲框底下添加其他列名称,这些列名称由一个字符串分开。

1#multile column update
2
3data.rename(columns = {'Fruit':'Fruit Name','Colour':'Color','Price':'Cost'})

就像这样,您可以同时更新所有列。


3、更新列名案例

您可能在使用具有多个列的数据集时遇到列名不一致。

在我们的数据中,您可以观察到,所有列名都有首个字母的封面. 总是建议为所有列名有一个共同的封面。

好吧,你可以将它们转换为上方案例或下方案例。

1#lower case
2
3data.columns.str.lower()
4data

Update 2

现在,我们所有的列都在较低的情况下。


四、更新价值观

就像更新列一样,行值更新也是非常简单的,您必须先找到行值,然后可以用新的值更新该行。

您可以使用 pandas loc 函数来找到行。

1#updating rows
2
3data.loc[3]
1Fruit Strawberry
2Color Pink
3Price 37
4Name: 3, dtype: object

我们已经发现了第三行,其中有水果的细节,草莓. 现在,我们必须更新这个行与一个新的水果名为和它的细节。

让我们滚吧!

1#update
2
3data.loc[3] = ['PineApple','Yellow','48']
4data

Update Rows and Columns

我希望你也很容易更新数据中的行值. 现在,假设你只需要在行中更新几个细节,而不是整个细节。

1#update specific values
2
3data.loc[3, ['Price']]
1Price 48
2Name: 3, dtype: object

我们只需要更新位于第三行中的水果的价格,我们得知该水果的当前价格为48个,但我们必须更新到65个。

1#updating 
2
3data.loc[3, ['Price']] = [65]
4data

Update Rows and Columns

太棒了 :P

我们已经更新了水果胡萝卜的价格为65只用一行Python代码。


5. 根据条件更新行和列

是的,我们现在将根据某些条件更新行值,最后,我们想要一些有意义的值,这些值应该对我们的分析有帮助。

让我们定义我们的条件。

1#Condition
2
3updated = data['Price'] > 60
4updated

我们在这里要做的是,更新成本高于60的水果的价格作为昂贵。

10 False
21 True
32 False
43 True
54 False
6Name: Price, dtype: bool

根据产量,我们有2个水果,其价格超过60个,让我们把这些水果列为数据中昂贵的。

1#Updating
2
3data.loc[updated, 'Price'] = 'Expensive'
4data

Update Rows and Columns

相信我,你太棒了:)

你以惊人的方式和完美地做到这一点,在整个教程中,我从来没有使用过超过2行代码。我能给出的最好的建议是,尽可能多地尝试学习熊猫。


Wrapping Up - 更新列和列

更新数据中的行和列是我们应该在任何分析之前专注的主要事情之一. 使用简单的函数和代码,我们可以使数据更有意义,在这个过程中,我们肯定会对数据质量和任何进一步的要求获得一些见解。

我希望您以一种或另一种方式发现本教程有用,并且不要忘记在分析工作中实施这些做法。

现在就这样了!快乐的Python!!!

** 更多阅读:** Pandas DataFrame

Published At
Categories with 技术
Tagged with
comments powered by Disqus