从Pandas数据框架的某一列中获取唯一值
让我们讨论一下如何从Pandas DataFrame的某一列中获取唯一值。
创建一个简单的数据框架,其中有列表的字典,比如列名是A、B、C、D、E,有重复的元素。
现在,让我们来获取这个数据框架中某一列的唯一值。
例子#1:获取’B’列的唯一值
# Import pandas package
import pandas as pd
# create a dictionary with five fields each
data = {
'A':['A1', 'A2', 'A3', 'A4', 'A5'],
'B':['B1', 'B2', 'B3', 'B4', 'B4'],
'C':['C1', 'C2', 'C3', 'C3', 'C3'],
'D':['D1', 'D2', 'D2', 'D2', 'D2'],
'E':['E1', 'E1', 'E1', 'E1', 'E1'] }
# Convert the dictionary into DataFrame
df = pd.DataFrame(data)
# Get the unique values of 'B' column
df.B.unique()
输出:
例子#2:获取’E’列的唯一值
# Import pandas package
import pandas as pd
# create a dictionary with five fields each
data = {
'A':['A1', 'A2', 'A3', 'A4', 'A5'],
'B':['B1', 'B2', 'B3', 'B4', 'B4'],
'C':['C1', 'C2', 'C3', 'C3', 'C3'],
'D':['D1', 'D2', 'D2', 'D2', 'D2'],
'E':['E1', 'E1', 'E1', 'E1', 'E1'] }
# Convert the dictionary into DataFrame
df = pd.DataFrame(data)
# Get the unique values of 'E' column
df.E.unique()
输出:
例子#3:获取一列中唯一值的数量
# Import pandas package
import pandas as pd
# create a dictionary with five fields each
data = {
'A':['A1', 'A2', 'A3', 'A4', 'A5'],
'B':['B1', 'B2', 'B3', 'B4', 'B4'],
'C':['C1', 'C2', 'C3', 'C3', 'C3'],
'D':['D1', 'D2', 'D2', 'D2', 'D2'],
'E':['E1', 'E1', 'E1', 'E1', 'E1'] }
# Convert the dictionary into DataFrame
df = pd.DataFrame(data)
# Get number of unique values in column 'C'
df.C.nunique(dropna = True)
输出: