Python Pandas ŌĆō 从多列中查找唯一值
要从多列中查找唯一值,请使用unique()方法。假设您的Pandas DataFrame中有“EmpName”和“Zone”的员工记录。名称和区域可能会重复,因为两个员工可以拥有相似的名称,一个区域可能有多个员工。在这种情况下,如果您想要唯一的员工名称,则使用DataFrame的unique()方法。
首先,导入所需的库。这里将pd设置为别名 –
import pandas as pd
首先,创建一个DataFrame。这里我们有两列 –
dataFrame = pd.DataFrame(
{
"EmpName": ['约翰', '泰德', '雅各布', '斯嘉丽特', '艾米', '泰德', '斯嘉丽特'],"区域": ['北部', '南部', '南部', '东部', '西部', '东部', '北部']
}
)
从DataFrame列“EmpName”和“Zone”中获取唯一的员工名称和区域 –
{pd.concat([dataFrame['EmpName'],dataFrame['Zone']]).unique()}
示例
下面是完整的代码 –
import pandas as pd
# 创建DataFrame
dataFrame = pd.DataFrame(
{
"EmpName": ['约翰', '泰德', '雅各布', '斯嘉丽特', '艾米', '泰德', '斯嘉丽特'],"区域": ['北部', '南部', '南部', '东部', '西部', '东部', '北部']
}
)
print("DataFrame ...\n",dataFrame)
# 从多列中获取唯一的值
print(f"\n从两列中获取唯一值并将它们连接起来 :\n \
{pd.concat([dataFrame['EmpName'],dataFrame['Zone']]).unique()}")
输出
这将输出以下内容 –
DataFrame ...
EmpName Zone
0 约翰 北部
1 泰德 南部
2 雅各布 南部
3 斯嘉丽特 东部
4 艾米 西部
5 泰德 东部
6 斯嘉丽特 北部
从两列中获取唯一值并将它们连接起来 :
['约翰' '泰德' '雅各布' '斯嘉丽特' '艾米' '北部' '南部' '东部' '西部']
极客教程