Python Pandas Series.Diplicated()
Pandas系列是一个带有轴标签的一维ndarray。标签不需要是唯一的,但必须是一个可散列的类型。该对象支持整数和基于标签的索引,并提供了大量的方法来执行涉及索引的操作。
Pandas Series.Diplicated()函数表示重复的系列值。重复的值在结果系列中被表示为真值。既可以表示所有的重复值,也可以表示除第一个以外的所有重复值,还可以表示除最后一个以外的所有重复值。
语法: Series.duplicated(keep=’first’)
参数:
keep : {‘first’, ‘last’, False}, default ‘first’ 。
返回: pandas.core.series.Series
示例#1:使用Series.diplicated()函数来查找给定系列对象中的重复值。
# importing pandas as pd
import pandas as pd
# Creating the Series
sr = pd.Series([80, 25, 3, 25, 24, 6])
# Create the Index
index_ = ['Coca Cola', 'Sprite', 'Coke', 'Fanta', 'Dew', 'ThumbsUp']
# set the index
sr.index = index_
# Print the series
print(sr)
输出 :
现在我们将使用Series.diplicated()函数来查找给定系列对象的基础数据中的重复值。
# detect duplicates
result = sr.duplicated()
# Print the result
print(result)
输出 :
正如我们在输出中看到的,Series.diplicated()函数已经成功地检测到了给定系列对象中的重复值。False表示相应的值是唯一的,而True表示相应的值是给定系列对象中的重复值。
示例#2 :使用Series.diplicated()函数来查找给定系列对象中的重复值。
# importing pandas as pd
import pandas as pd
# Creating the Series
sr = pd.Series([11, 11, 8, 18, 65, 18, 32, 10, 5, 32, 32])
# Create the Index
index_ = pd.date_range('2010-10-09', periods = 11, freq ='M')
# set the index
sr.index = index_
# Print the series
print(sr)
输出 :
现在我们将使用Series.diplicated()函数来查找给定系列对象的基础数据中的重复值。
# detect duplicates
result = sr.duplicated()
# Print the result
print(result)
输出 :
正如我们在输出中看到的,Series.diplicated()函数已经成功地检测到了给定系列对象中的重复值。False表示相应的值是唯一的,而True表示相应的值是给定系列对象中的重复值。