Python 读取CSV文件|极客教程

Python 读取CSV文件

CSV（Comma-Separated Values）是一种常见的文件格式，用来存储简单的表格数据。在Python中，我们可以使用pandas库来读取和处理CSV文件。本文将详细讲解如何使用Python读取CSV文件，并展示一些示例代码。

1. 安装pandas库

首先，我们需要安装pandas库。你可以通过以下命令在命令行中安装pandas：

pip install pandas

2. 读取CSV文件

接下来，我们将展示如何使用pandas库读取CSV文件。假设我们有一个名为data.csv的CSV文件，内容如下：

Name,Age,City
Alice,25,New York
Bob,30,Los Angeles
Charlie,35,Chicago
David,40,Houston

我们可以使用以下代码读取data.csv文件：

import pandas as pd

data = pd.read_csv('data.csv')

print(data)

运行以上代码，将会输出CSV文件的内容：

      Name  Age      City
0    Alice   25  New York
1      Bob   30  Los Angeles
2  Charlie   35   Chicago
3    David   40   Houston

代码解释：

导入pandas库，并使用pd.read_csv()函数读取CSV文件。
将读取的数据存储在data变量中，并打印出来。

3. 处理CSV文件数据

我们也可以对读取的CSV文件数据进行处理。以下是对读取的数据进行一些简单处理的示例代码：

# 输出第一行数据
print(data.head(1))

# 输出数据的描述统计信息
print(data.describe())

运行以上代码，将会输出以下内容：

    Name  Age      City
0  Alice   25  New York
    Age
count   4.000000
mean   32.500000
std     6.454972
min    25.000000
25%    28.750000
50%    32.500000
75%    36.250000
max    40.000000

代码解释：

data.head(1)用于输出数据集的前1行数据。
data.describe()用于输出数据的描述统计信息，包括计数、均值、标准差、最小值、25%分位数、中位数、75%分位数和最大值。

4. 选择特定列数据

我们还可以选择特定列的数据。以下是选择Name和City列数据的示例代码：

print(data[['Name', 'City']])

运行以上代码，将会输出选定的两列数据：

      Name      City
0    Alice  New York
1      Bob  Los Angeles
2  Charlie   Chicago
3    David   Houston

5. 条件筛选数据

我们可以根据某些条件筛选数据。以下是根据Age大于30的条件筛选数据的示例代码：

filtered_data = data[data['Age'] > 30]
print(filtered_data)

运行以上代码，将会输出符合条件的数据：

      Name  Age      City
2  Charlie   35   Chicago
3    David   40   Houston

6. 写入CSV文件

最后，我们还可以将处理后的数据写入新的CSV文件。以下是将筛选后的数据写入filtered_data.csv文件的示例代码：

filtered_data.to_csv('filtered_data.csv', index=False)

运行以上代码后，将会生成一个新的CSV文件filtered_data.csv，内容如下：

Name,Age,City
Charlie,35,Chicago
David,40,Houston

结论

在本文中，我们学习了如何使用Python中的pandas库读取和处理CSV文件。通过以上示例代码，你可以更好地理解如何在Python中操作CSV文件，并对数据进行分析和处理。

Python 读取CSV文件