如何用Pandas在Python中创建虚拟变量

如何用Pandas在Python中创建虚拟变量

一个数据集可能包含各种类型的值,有时它包括分类值。因此,为了有效地使用这些分类值进行编程,我们创建了虚拟变量。虚拟变量是一个二进制变量,表示一个单独的分类变量是否具有特定的值。

解释:

如何用Pandas在Python中创建虚拟变量?

正如你所看到的,我们为温度属性的三个分类值创建了三个虚拟变量。我们可以使用get_dummies()方法在python中创建虚拟变量。

用法: pandas.get_dummies(data, prefix=None, prefix_sep=’_’,)

参数:

  • data= 输入数据,即包括pandas数据框。 list . set . numpy数组等。
  • prefix= 初始值
  • prefix_sep= 数据值分离。

返回类型:虚拟变量。

一步一步实现:

  • 导入必要的模块
  • 考虑一下数据
  • 对数据进行操作以获得假象

示例 1:

# import required modules
import pandas as pd
import numpy as np
 
# create dataset
df = pd.DataFrame({'Temperature': ['Hot', 'Cold', 'Warm', 'Cold'],
                   })
 
# display dataset
print(df)
 
# create dummy variables
pd.get_dummies(df)

输出:

如何用Pandas在Python中创建虚拟变量?

示例 2:

考虑用List数组来获得假人

# import required modules
import pandas as pd
import numpy as np
 
# create dataset
s = pd.Series(list('abca'))
 
# display dataset
print(s)
 
# create dummy variables
pd.get_dummies(s)

输出:

如何用Pandas在Python中创建虚拟变量?

示例 3:

下面是另一个例子,以获得虚拟变量。

# import required modules
import pandas as pd
import numpy as np
 
# create dataset
df = pd.DataFrame({'A': ['hello', 'vignan', 'geeks'],
                   'B': ['vignan', 'hello', 'hello'],
                   'C': [1, 2, 3]})
 
# display dataset
print(df)
 
# create dummy variables
pd.get_dummies(df)

输出:

如何用Pandas在Python中创建虚拟变量?

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

Numpy教程