Python Pandas ŌĆō 从多列中查找唯一值

Python Pandas ŌĆō 从多列中查找唯一值

要从多列中查找唯一值,请使用unique()方法。假设您的Pandas DataFrame中有“EmpName”和“Zone”的员工记录。名称和区域可能会重复,因为两个员工可以拥有相似的名称,一个区域可能有多个员工。在这种情况下,如果您想要唯一的员工名称,则使用DataFrame的unique()方法。

首先,导入所需的库。这里将pd设置为别名 –

import pandas as pd

首先,创建一个DataFrame。这里我们有两列 –

dataFrame = pd.DataFrame(
   {
      "EmpName": ['约翰', '泰德', '雅各布', '斯嘉丽特', '艾米', '泰德', '斯嘉丽特'],"区域": ['北部', '南部', '南部', '东部', '西部', '东部', '北部']
   }
)

从DataFrame列“EmpName”和“Zone”中获取唯一的员工名称和区域 –

{pd.concat([dataFrame['EmpName'],dataFrame['Zone']]).unique()}

示例

下面是完整的代码 –

import pandas as pd

# 创建DataFrame
dataFrame = pd.DataFrame(
   {
      "EmpName": ['约翰', '泰德', '雅各布', '斯嘉丽特', '艾米', '泰德', '斯嘉丽特'],"区域": ['北部', '南部', '南部', '东部', '西部', '东部', '北部']
   }
)

print("DataFrame ...\n",dataFrame)

# 从多列中获取唯一的值
print(f"\n从两列中获取唯一值并将它们连接起来 :\n \
{pd.concat([dataFrame['EmpName'],dataFrame['Zone']]).unique()}")

输出

这将输出以下内容 –

DataFrame ...
    EmpName   Zone
0     约翰   北部
1     泰德   南部
2   雅各布   南部
3  斯嘉丽特   东部
4       艾米   西部
5       泰德   东部
6  斯嘉丽特   北部

从两列中获取唯一值并将它们连接起来 :
['约翰' '泰德' '雅各布' '斯嘉丽特' '艾米' '北部' '南部' '东部' '西部']

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程