Python Pandas TimedeltaIndex.drop_duplicates
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。_Pandas _是这些包中的一个,使导入和分析数据变得更加容易。Pandas TimedeltaIndex.drop_duplicates()函数返回去除重复值的索引。该函数提供了灵活性,可以选择哪些重复值要保留,其余的要删除。
语法: TimedeltaIndex.drop_duplicates(keep=’first’)
参数:keep : {‘first’, ‘last’, False}, default ‘first’ – > ** first : 除第一次出现外,删除重复的内容。– > ** last : 除了最后出现的以外,删除重复的内容。**- > ** False : 删除所有重复的内容。
返回 :重复数据:索引
示例#1:使用TimedeltaIndex.drop_duplicates()函数,从给定的TimedeltaIndex对象中删除所有重复的值。只保留第一次出现的值。
# importing pandas as pd
import pandas as pd
# Create the TimedeltaIndex object
tidx = pd.TimedeltaIndex(data =['06:05:01.000030', '+23:59:59.999999',
'22 day 2 min 3us 10ns', '+23:59:59.999999',
'+23:29:59.999999', '+12:19:59.999999'])
# Print the TimedeltaIndex object
print(tidx)
输出 :
现在我们将使用TimedeltaIndex.drop_duplicates()函数来删除所有重复的值,同时保留第一次出现的值。
# drop all duplicates and keep the first occurrence
tidx.drop_duplicates(keep ='first')
Output :
正如我们在输出中看到的,TimedeltaIndex.drop_duplicates()函数返回了一个新的对象,该对象已经删除了所有的重复值,除了第一次出现的。
示例#2:使用TimedeltaIndex.drop_duplicates()函数从给定的TimedeltaIndex对象中删除所有重复的值。保留最后一个重复的值。
# importing pandas as pd
import pandas as pd
# Create the TimedeltaIndex object
tidx = pd.TimedeltaIndex(data =['1 days 02:00:00', '1 days 06:05:01.000030',
'1 days 02:00:00', '1 days 02:00:00', '21 days 06:15:01.000030'])
# Print the TimedeltaIndex object
print(tidx)
输出 :
现在我们将使用TimedeltaIndex.drop_duplicates()函数来删除所有重复的值,同时保留最后出现的值。
# drop all duplicates and keep the first occurrence
tidx.drop_duplicates(keep ='last')
输出 :
正如我们在输出中看到的,TimedeltaIndex.drop_duplicates()函数返回了一个新的对象,该对象已经删除了所有的重复值,除了最后出现的。