pandas 改列名

在数据分析和处理过程中,经常需要对数据集的列名进行修改,以使其更加清晰、规范或适应特定的需求。pandas 是一个功能强大的数据处理库,它提供了丰富的方法和工具来操作数据集,包括改变列名的能力。本文将详细介绍如何使用 pandas 对数据集的列名进行修改。
1. pandas 修改列名的方法概览
pandas 提供了多种方法来修改数据集的列名。下面是几种常用的方法:
- 使用
rename()方法:通过指定字典或函数来重命名列名。 - 直接赋值:通过直接修改
columns属性来改变列名。
本文将依次介绍这两种方法的详细用法和示例。
2. 使用 rename() 方法修改列名
rename() 方法允许我们通过指定字典或函数来重命名列名。下面是该方法的详细用法:
DataFrame.rename(mapper=None, index=None, columns=None, axis=None, copy=True, inplace=False, level=None)
参数解释:
mapper:一个字典或函数,用于指定新旧列名的映射关系。index:一个字典或函数,用于指定新旧索引的映射关系。columns:一个字典或函数,用于指定新旧列名的映射关系。axis:可选参数,指定需要修改的轴。默认为None,表示按列名修改。copy:可选参数,指定是否创建副本。默认为True。inplace:可选参数,指定是否在原地进行修改。默认为False。level:可选参数,用于指定多级索引的级别。
下面是几个使用 rename() 方法修改列名的示例:
2.1 使用字典重命名列名
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)
df.rename(columns={'A': 'Column1', 'B': 'Column2'}, inplace=True)
print(df)
运行结果:
Column1 Column2
0 1 4
1 2 5
2 3 6
2.2 使用函数重命名列名
import pandas as pd
data = {'A': ['1', '2', '$3'], 'B': ['4%', '5%', '6%']}
df = pd.DataFrame(data)
df.rename(columns=lambda x: x.lower(), inplace=True)
print(df)
运行结果:
a b
0 1 4%
12 5%
2 $3 6%
3. 直接赋值修改列名
除了使用 rename() 方法外,我们还可以直接通过修改 columns 属性来改变列名。下面是该方法的示例:
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)
df.columns = ['Column1', 'Column2']
print(df)
运行结果:
Column1 Column2
0 1 4
1 2 5
2 3 6
4. 总结
本文介绍了使用 pandas 修改数据集列名的方法。通过 rename() 方法可以根据字典或函数的映射关系重命名列名,而直接赋值则可以直接改变列名。根据实际需求选择合适的方法来修改列名,可以使数据集更加清晰、规范和适应特定的分析需求。
极客教程