处理Pandas数据框架中的行和列问题

处理Pandas数据框架中的行和列问题

数据框架是一种二维数据结构,即数据以表格的方式排列在行和列中。我们可以对行/列进行基本操作,如选择、删除、添加和重命名。在这篇文章中,我们使用的是nba.csv文件。

处理Pandas数据框架中的行和列问题

处理列的问题

为了处理列,我们对列进行基本操作,如选择、删除、添加和重命名。
处理Pandas数据框架中的行和列问题

列的选择:
为了在Pandas DataFrame中选择一个列,我们可以通过调用列的名称来访问这些列。

# Import pandas package
import pandas as pd
  
# Define a dictionary containing employee data
data = {'Name':['Jai', 'Princi', 'Gaurav', 'Anuj'],
        'Age':[27, 24, 22, 32],
        'Address':['Delhi', 'Kanpur', 'Allahabad', 'Kannauj'],
        'Qualification':['Msc', 'MA', 'MCA', 'Phd']}
  
# Convert the dictionary into DataFrame 
df = pd.DataFrame(data)
  
# select two columns
print(df[['Name', 'Qualification']])

输出:
处理Pandas数据框架中的行和列问题
更多的例子请参考《如何在pandas数据框架中选择多列》。

列的增加:
为了在Pandas DataFrame中添加一个列,我们可以声明一个新的列表作为一个列并添加到现有的Dataframe中。

# Import pandas package 
import pandas as pd
  
# Define a dictionary containing Students data
data = {'Name': ['Jai', 'Princi', 'Gaurav', 'Anuj'],
        'Height': [5.1, 6.2, 5.1, 5.2],
        'Qualification': ['Msc', 'MA', 'Msc', 'Msc']}
  
# Convert the dictionary into DataFrame
df = pd.DataFrame(data)
  
# Declare a list that is to be converted into a column
address = ['Delhi', 'Bangalore', 'Chennai', 'Patna']
  
# Using 'Address' as the column name
# and equating it to the list
df['Address'] = address
  
# Observe the result
print(df)

输出:
处理Pandas数据框架中的行和列问题
更多的例子请参考在Pandas中为现有的DataFrame添加新的列。

列的删除:
为了在Pandas DataFrame中删除一个列,我们可以使用drop()方法。通过删除带有列名的列来删除列。

# importing pandas module
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name" )
  
# dropping passed columns
data.drop(["Team", "Weight"], axis = 1, inplace = True)
  
# display
print(data)

输出:
如输出图片所示,新的输出并没有通过的列。这些值被丢弃了,因为axis被设置为1,并且由于inplace是True,所以在原始数据框中做了修改。

丢弃列之前的数据框架
处理Pandas数据框架中的行和列问题

删除列后的数据框架
处理Pandas数据框架中的行和列问题
更多例子请参考使用Pandas.drop()从DataFrame中删除列。

处理行的问题

为了处理行,我们可以对行进行基本操作,如选择、删除、添加和重命名。

行选择 :
Pandas提供了一个独特的方法来检索数据框架中的行。DataFrame.loc[]方法被用来从Pandas DataFrame中检索行。行也可以通过传递整数位置给iloc[]函数来选择。

# importing pandas package
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name")
  
# retrieving row by loc method
first = data.loc["Avery Bradley"]
second = data.loc["R.J. Hunter"]
  
  
print(first, "\n\n\n", second)

输出:
如输出图像所示,由于两次都只有一个参数,所以返回了两个系列。
处理Pandas数据框架中的行和列问题
更多的例子请参考Pandas使用.loc[]提取行。

行数增加:
为了在Pandas DataFrame中增加一个行,我们可以将旧的数据框架与新的数据框架连接起来。

# importing pandas module 
import pandas as pd 
    
# making data frame 
df = pd.read_csv("nba.csv", index_col ="Name") 
  
df.head(10)
  
new_row = pd.DataFrame({'Name':'Geeks', 'Team':'Boston', 'Number':3,
                        'Position':'PG', 'Age':33, 'Height':'6-2',
                        'Weight':189, 'College':'MIT', 'Salary':99999},
                                                            index =[0])
# simply concatenate both dataframes
df = pd.concat([new_row, df]).reset_index(drop = True)
df.head(5)

输出:

添加行前的数据框
处理Pandas数据框架中的行和列问题

添加行后的数据框
处理Pandas数据框架中的行和列问题

更多的例子请参考《在pandas DataFrame的顶部添加一行》。

删除的行:
为了在Pandas DataFrame中删除一条记录,我们可以使用drop()方法。通过删除索引标签的行来删除行。

# importing pandas module
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name" )
  
# dropping passed values
data.drop(["Avery Bradley", "John Holland", "R.J. Hunter",
                            "R.J. Hunter"], inplace = True)
  
# display
data

输出:
如输出图像所示,新的输出没有通过的值。这些值被丢掉了,由于inplace是True,所以在原始数据框中进行了修改。

丢弃值之前的数据框架
处理Pandas数据框架中的行和列问题

丢掉数值后的数据框
处理Pandas数据框架中的行和列问题

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程