pandas 创建空dataframe
在使用 pandas 进行数据处理时,有时候我们需要创建一个空的 DataFrame 来存储数据。本文将详细介绍如何使用 pandas 创建一个空的 DataFrame,并且演示一些常见操作。
什么是 DataFrame
DataFrame 是 pandas 中的一个重要数据结构,类似于 Excel 表格,是一个二维的、大小可变的数据结构,每一列可以是不同的数据类型。DataFrame 既有行索引也有列索引,可以进行各种数据操作和分析。
创建空的 DataFrame
要创建一个空的 DataFrame,可以使用 pandas 的 DataFrame()
函数,并指定列名。以下是一个简单的示例:
import pandas as pd
# 创建一个空的 DataFrame
df = pd.DataFrame(columns=['A', 'B', 'C'])
print(df)
运行以上代码,得到的输出为:
Empty DataFrame
Columns: [A, B, C]
Index: []
从结果可以看出,我们成功创建了一个空的 DataFrame,并指定了列名为 ‘A’、’B’、’C’。但是这个 DataFrame 中并没有任何数据。
添加数据
在创建了空的 DataFrame 之后,我们通常需要往其中添加数据。以下是添加数据的几种常见方法:
方法一:使用 loc
添加一行数据
# 使用 loc 添加一行数据
df.loc[0] = [1, 2, 3]
print(df)
运行以上代码,得到的输出为:
A B C
0 1 2 3
通过 loc
方法,我们成功在空的 DataFrame 中添加了一行数据。
方法二:使用 append
添加多行数据
# 使用 append 添加多行数据
new_data = pd.DataFrame([[4, 5, 6], [7, 8, 9]], columns=['A', 'B', 'C'])
df = df.append(new_data, ignore_index=True)
print(df)
运行以上代码,得到的输出为:
A B C
0 1 2 3
1 4 5 6
2 7 8 9
通过 append
方法,我们成功在原有的 DataFrame 中添加了两行数据。
方法三:使用 at
或 iat
指定位置添加数据
# 使用 at 指定位置添加数据
df.at[2, 'A'] = 10
df.iat[2, 1] = 11
print(df)
运行以上代码,得到的输出为:
A B C
0 1 2 3
1 4 5 6
2 10 11 NaN
通过 at
或 iat
方法,我们成功在指定位置添加了数据。
删除数据
除了添加数据,有时候我们也需要删除 DataFrame 中的数据。以下是删除数据的几种常见方法:
方法一:使用 drop
删除指定行或列
# 删除指定行
df = df.drop(index=2)
# 删除指定列
df = df.drop(columns='C')
print(df)
运行以上代码,得到的输出为:
A B
0 1 2
1 4 5
通过 drop
方法,我们成功删除了 DataFrame 中的指定行和列。
方法二:使用 drop_duplicates
删除重复行
# 添加重复的数据
df = df.append(pd.DataFrame([[1, 2], [4, 5]], columns=['A', 'B']))
# 删除重复行
df = df.drop_duplicates()
print(df)
运行以上代码,得到的输出为:
A B
0 1 2
1 4 5
通过 drop_duplicates
方法,我们成功删除了 DataFrame 中的重复行。
总结
通过以上的介绍,我们学习了如何使用 pandas 创建一个空的 DataFrame,并对其进行添加和删除数据的操作。DataFrame 是 pandas 中非常重要的数据结构,可以方便地进行数据处理和分析。