如何使用Pandas从现有的CSV文件创建多个CSV文件
在这篇文章中,我们将学习如何使用Pandas从现有的CSV文件创建多个CSV文件。当我们的代码进入生产时,我们需要处理编辑数据文件的问题。由于数据文件很大,我们会遇到更多的问题,所以我们根据一些标准把这个文件分成一些小文件,比如分成行、列、列的特定值等等。
首先,让我们创建一个简单的CSV文件,并在文章下面的所有例子中使用它。使用pandas的dataframe方法创建数据集,然后将其保存到 “Customs.csv “文件中,或者我们可以使用Pandas的read_csv()函数加载现有数据集。
输出:
从现有的CSV文件创建多个CSV文件
为了完成我们的工作,我们将讨论不同的方法,具体如下。
方法1:基于行的拆分
在这个方法中,我们将根据行数把一个CSV文件分成多个CSV。
输出:
方法2:基于列的拆分
示例 1:
使用Pandas的groupby()方法,我们可以创建多个CSV文件。要创建一个文件,我们可以使用Pandas的to_csv()方法。这里根据性别列的 “男 “和 “女 “值创建了两个文件。
输出:
Male.csv
Female.csv
示例 2:
我们可以对两个以上的列进行分组,并可以在两个列值的独特值的组合基础上创建多个文件。以性别和年收入列为例。
输出:
所有九个CSV文件
示例 3:
我们将根据特定的列名Gender来过滤其值(男性和女性)。然后使用pandas中的to_csv将其转换为CSV文件。
输出:
方法3:同时基于行和列进行分割
使用Pandas的groupby()方法,我们可以按行创建多个CSV文件。要创建一个文件,我们可以使用Pandas的to_csv()方法。这里创建了两个文件,都是基于支出分数的特定性别列的行值 “男性 “和 “女性 “的值。
输出: