Pandas 多列中的唯一值

Pandas 多列中的唯一值

在本文中,我们将介绍如何使用Pandas查找多列中唯一值的方法。

Pandas是基于NumPy的一个数据操作库,它提供了一组灵活且高效的数据结构来处理表格数据。当我们需要筛选数据中不同列中唯一的值时,Pandas提供了两个方法——unique()nunique()

阅读更多:Pandas 教程

unique()

unique()方法用于返回给定数据中的唯一值,不同于单列unique()的是,多列中唯一值需要使用apply()函数来实现。下面是一个示例:

import pandas as pd

df = pd.DataFrame({
    'col1': ['a', 'b', 'a', 'c'],
    'col2': [1, 2, 2, 3]
})

print(df.apply(lambda x: x.unique()))
Python

结果如下:

col1    [a, b, c]
col2    [1, 2, 3]
dtype: object
Python

nunique()

nunique()方法用于返回给定数据中的唯一值的数量,与unique()不同,它默认逐列进行计算。下面是一个示例:

import pandas as pd

df = pd.DataFrame({
    'col1': ['a', 'b', 'a', 'c'],
    'col2': [1, 2, 2, 3]
})

print(df.nunique())
Python

运行结果:

col1    3
col2    3
dtype: int64
Python

多列中唯一值的合并

当我们需要将多列中的唯一值合并时,可以使用set()方法配合union()实现。下面是一个示例:

import pandas as pd

df = pd.DataFrame({
    'col1': ['a', 'b', 'a', 'c'],
    'col2': [1, 2, 2, 3]
})

unique_values = set().union(*[df[col].unique() for col in df.columns])
print(unique_values)
Python

运行结果:

{1, 2, 3, 'a', 'b', 'c'}
Python

以上就是如何使用Pandas查找多列中唯一值的方法。如果您有任何问题或建议,请随时提出。

总结

在本文中,我们介绍了Pandas中查找多列中唯一值的方法。unique()方法可返回不同列中的唯一值,而nunique()则返回唯一值的数量。同时,我们还通过set()union()的组合将不同列中的唯一值合并。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册