Pandas中的Python数据比较和选择

Pandas中的Python数据比较和选择

Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。

在数据分析中,最重要的是比较数值和选择相应的数据。==”操作符也适用于Pandas数据框架中的多个值。下面两个例子将展示如何从Pandas数据框架中比较和选择数据。

例一:比较数据
在下面的例子中,一个数据框架是由一个csv文件制成的。在性别栏中,只有3种类型的值(”男”、”女 “或NaN)。性别列的每一行都要与 “男性 “进行比较,然后返回一个布尔系列。

# importing pandas package
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("employees.csv")
  
# storing boolean series in new
new = data["Gender"] == "Male"
  
# inserting new series in data frame
data["New"]= new
  
# display
data
Python

输出:
如输出图片所示,对于Gender=”Male”,New Column的值是True,而对于 “Female “和NaN的值则是False。

Pandas中的Python数据比较和选择

例2:选择数据
在下面的例子中,布尔系列被传递到数据中,只有Gender=”Male “的行被返回。

# importing pandas package
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("employees.csv")
  
# storing boolean series in new
new = data["Gender"] != "Female"
  
# inserting new series in data frame
data["New"]= new
  
# display
data[new]
  
# OR 
# data[data["Gender"]=="Male"]
# Both are the same
Python

输出:
如输出图片所示,返回的数据框中有性别=”男”。

Pandas中的Python数据比较和选择

注意:对于NaN值,布尔值为False。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册