pandas dataframe修改列名
在pandas中,可以通过df.columns属性来修改DataFrame的列名。DataFrame是pandas中的一个重要数据结构,类似于Excel中的表格,用来存储二维数据。
1. 查看当前列名
在修改列名之前,我们先查看一下当前DataFrame的列名。可以通过df.columns
属性来获取列名。
import pandas as pd
data = {'A': [1, 2, 3],
'B': [4, 5, 6],
'C': [7, 8, 9]}
df = pd.DataFrame(data)
print(df.columns)
运行以上代码,可以得到当前DataFrame的列名:
Index(['A', 'B', 'C'], dtype='object')
2. 修改列名
要修改DataFrame的列名,可以直接对df.columns
属性赋新值。
df.columns = ['X', 'Y', 'Z']
print(df.columns)
运行以上代码,可以看到列名已经被成功修改为新的值:
Index(['X', 'Y', 'Z'], dtype='object')
3. 使用rename方法修改列名
除了直接赋值修改列名外,还可以使用rename()
方法来修改列名。rename()
方法可以接收一个字典作为参数,键为原始列名,值为新列名。
df.rename(columns={'X': 'AA', 'Y': 'BB', 'Z': 'CC'}, inplace=True)
print(df.columns)
运行以上代码,可以看到列名被成功修改为新的值:
Index(['AA', 'BB', 'CC'], dtype='object')
4. 修改部分列名
有时候我们只需要修改部分列名,可以使用字典形式的rename()
方法参数。
df.rename(columns={'AA': 'AAA', 'BB': 'BBB'}, inplace=True)
print(df.columns)
运行以上代码,可以看到指定列名被修改为新的值,而未指定的列名保持不变:
Index(['AAA', 'BBB', 'CC'], dtype='object')
5. 小结
通过以上几种方法,我们可以轻松地修改DataFrame的列名。在数据处理过程中,修改列名是一个常见的操作,能够使数据更清晰易懂。记得在修改列名后,检查一下是否修改成功,以确保数据准确无误。