如何在Pandas中自动转换为最佳数据类型
在pandas中,数据类型默认为int, float和objects。当我们在pandas中加载或创建任何系列或数据框架时,pandas默认会给列和系列分配必要的数据类型。
我们将使用pandas convert_dtypes()函数将默认分配的数据类型自动转换为最佳数据类型。使用convert_dtypes()有一个很大的好处–它支持新的缺失值类型pd.NA和NaN。它在pandas 1.1.4版本中被支持。
语法:
For Series:
For DataFrame:
下面是对系列和数据框架的实现。
转换一个系列的数据类型:
- Import module
- 创建一个系列
- 现在使用convert_dtypes()函数来自动转换数据类型
示例:
输出:
转换一个数据框架的数据类型:
- Import module
- 创建数据框架
- 检查数据类型
- 使用convert_dtypes().dtypes函数转换数据类型
列的数据类型也相应改变。但数据框架的数据类型将保持为对象,因为它包含多列,每一列都有不同的数据类型。
示例:
输出:
通过系列创建数据框架并指定数据类型:
- Import module
- 通过系列创建数据框架,并同时指定数据类型
- 检查数据类型
- 使用convert_dtypes().dtypes函数进行转换
示例:
输出: