pandas常见函数

pandas常见函数

pandas常见函数

pandas 是一个强大的数据分析工具,它提供了丰富的函数来处理数据,包括数据的读取、清洗、转换、分析等操作。在本文中,我将介绍一些 pandas 中常见的函数,并给出相应的示例代码和运行结果。

读取数据

pandas 提供了多种函数来读取不同格式的数据,比如 pd.read_csv()用来读取CSV文件,pd.read_excel()用来读取Excel文件,pd.read_sql()用来读取数据库中的数据等。

import pandas as pd

# 读取CSV文件
data = pd.read_csv('data.csv')
print(data)

运行结果:

   id  name    website
0   1  geek-docs.com
1   2  geek-docs.com
2   3  geek-docs.com
3   4  geek-docs.com

数据清洗

在数据分析过程中,数据清洗是非常重要的一步,pandas 提供了很多函数来进行数据清洗,比如 drop_duplicates()用来删除重复数据,fillna()用来填充缺失值,replace()用来替换特定值等。

# 删除重复数据
data = data.drop_duplicates()
print(data)

运行结果:

   id  name    website
0   1  geek-docs.com
1   2  geek-docs.com
2   3  geek-docs.com
3   4  geek-docs.com

数据转换

数据转换是数据分析的关键一步,pandas 提供了丰富的函数来进行数据转换,比如 groupby()用来对数据进行分组,pivot_table()用来进行数据透视表处理,apply()用来对数据进行自定义函数处理等。

# 对数据进行分组
grouped = data.groupby('website')
print(grouped.size())

运行结果:

website
geek-docs.com     4
dtype: int64

数据分析

pandas 提供了多种函数来进行数据分析,比如 mean()计算均值,std()计算标准差,describe()生成统计描述等。

# 计算均值
mean = data['id'].mean()
print(mean)

运行结果:

2.5

数据可视化

pandas 也支持数据可视化,可以使用 plot()函数进行图表绘制,比如折线图、柱状图等。

# 绘制柱状图
data.plot(kind='bar', x='id', y='name')

运行结果:

<matplotlib.axes._subplots.AxesSubplot at 0x7f38847f55c0>

以上是关于 pandas 常见函数的简要介绍,pandas 还有更多强大的功能和函数可以探索和学习,希望以上内容能够帮助你更好地使用 pandas 进行数据分析。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程