Python Pandas Index.factize()

Python Pandas Index.factize()

Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。

Pandas Index.factize()函数将对象编码为一个枚举类型或分类变量。这个方法对于获得一个数组的数字表示非常有用,当所有重要的是识别不同的值时。 factorize既可以作为顶级函数pandas.factize(),也可以作为方法Series.factize()和 Index.factize()。

语法: Index.factorize(sort=False, na_sentinel=-1)

参数 :
sort :对uniques进行排序,并对标签进行洗牌以保持关系。
na_sentinel :标记 “未找到 “的值。

返回 : 一个整数的ndarray,它是进入uniques的索引器。uniques.take(labs)将有与values相同的值。

例子#1:使用Index.factize()函数将给定的指数值编码为分类形式。

# importing pandas as pd
import pandas as pd
  
# Creating the Index
idx = pd.Index(['Labrador', 'Beagle', 'Labrador',
                     'Lhasa', 'Husky', 'Beagle'])
  
# Print the Index
idx

输出 :
Python Pandas Index.factize()

让我们对给定的指数进行因式分解。

# convert it into categorical values.
idx.factorize()

输出 :
Python Pandas Index.factize()
正如我们在输出中看到的,Index.factorize()函数已经将索引中的每个标签转换为一个类别,并为它们分配了数值。

例子#2:使用Index.factize()函数,根据索引值的排序顺序对其进行因子化。

# importing pandas as pd
import pandas as pd
  
# Creating the Index
idx = pd.Index(['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun',
               'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec'])
  
# Print the Index
idx

输出 :
Python Pandas Index.factize()

让我们根据排序的顺序对其进行因式分解。只有在对索引中的值进行排序后,才会分配数值。

# Factorize the sorted labels
idx.factorize(sort = True)

输出 :
Python Pandas Index.factize()
正如我们在输出中看到的,在给指数值分配数值之前,已经对其进行了排序。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程