Pandas 多列中的唯一值
在本文中,我们将介绍如何使用Pandas查找多列中唯一值的方法。
Pandas是基于NumPy的一个数据操作库,它提供了一组灵活且高效的数据结构来处理表格数据。当我们需要筛选数据中不同列中唯一的值时,Pandas提供了两个方法——unique()和nunique()。
阅读更多:Pandas 教程
unique()
unique()方法用于返回给定数据中的唯一值,不同于单列unique()的是,多列中唯一值需要使用apply()函数来实现。下面是一个示例:
import pandas as pd
df = pd.DataFrame({
'col1': ['a', 'b', 'a', 'c'],
'col2': [1, 2, 2, 3]
})
print(df.apply(lambda x: x.unique()))
结果如下:
col1 [a, b, c]
col2 [1, 2, 3]
dtype: object
nunique()
nunique()方法用于返回给定数据中的唯一值的数量,与unique()不同,它默认逐列进行计算。下面是一个示例:
import pandas as pd
df = pd.DataFrame({
'col1': ['a', 'b', 'a', 'c'],
'col2': [1, 2, 2, 3]
})
print(df.nunique())
运行结果:
col1 3
col2 3
dtype: int64
多列中唯一值的合并
当我们需要将多列中的唯一值合并时,可以使用set()方法配合union()实现。下面是一个示例:
import pandas as pd
df = pd.DataFrame({
'col1': ['a', 'b', 'a', 'c'],
'col2': [1, 2, 2, 3]
})
unique_values = set().union(*[df[col].unique() for col in df.columns])
print(unique_values)
运行结果:
{1, 2, 3, 'a', 'b', 'c'}
以上就是如何使用Pandas查找多列中唯一值的方法。如果您有任何问题或建议,请随时提出。
总结
在本文中,我们介绍了Pandas中查找多列中唯一值的方法。unique()方法可返回不同列中的唯一值,而nunique()则返回唯一值的数量。同时,我们还通过set()和union()的组合将不同列中的唯一值合并。
极客教程