pandas常见函数
pandas 是一个强大的数据分析工具,它提供了丰富的函数来处理数据,包括数据的读取、清洗、转换、分析等操作。在本文中,我将介绍一些 pandas 中常见的函数,并给出相应的示例代码和运行结果。
读取数据
pandas 提供了多种函数来读取不同格式的数据,比如 pd.read_csv()
用来读取CSV文件,pd.read_excel()
用来读取Excel文件,pd.read_sql()
用来读取数据库中的数据等。
import pandas as pd
# 读取CSV文件
data = pd.read_csv('data.csv')
print(data)
运行结果:
id name website
0 1 geek-docs.com
1 2 geek-docs.com
2 3 geek-docs.com
3 4 geek-docs.com
数据清洗
在数据分析过程中,数据清洗是非常重要的一步,pandas 提供了很多函数来进行数据清洗,比如 drop_duplicates()
用来删除重复数据,fillna()
用来填充缺失值,replace()
用来替换特定值等。
# 删除重复数据
data = data.drop_duplicates()
print(data)
运行结果:
id name website
0 1 geek-docs.com
1 2 geek-docs.com
2 3 geek-docs.com
3 4 geek-docs.com
数据转换
数据转换是数据分析的关键一步,pandas 提供了丰富的函数来进行数据转换,比如 groupby()
用来对数据进行分组,pivot_table()
用来进行数据透视表处理,apply()
用来对数据进行自定义函数处理等。
# 对数据进行分组
grouped = data.groupby('website')
print(grouped.size())
运行结果:
website
geek-docs.com 4
dtype: int64
数据分析
pandas 提供了多种函数来进行数据分析,比如 mean()
计算均值,std()
计算标准差,describe()
生成统计描述等。
# 计算均值
mean = data['id'].mean()
print(mean)
运行结果:
2.5
数据可视化
pandas 也支持数据可视化,可以使用 plot()
函数进行图表绘制,比如折线图、柱状图等。
# 绘制柱状图
data.plot(kind='bar', x='id', y='name')
运行结果:
<matplotlib.axes._subplots.AxesSubplot at 0x7f38847f55c0>
以上是关于 pandas 常见函数的简要介绍,pandas 还有更多强大的功能和函数可以探索和学习,希望以上内容能够帮助你更好地使用 pandas 进行数据分析。