将Pandas数据框架导出到CSV文件中
假设你正在进行一个数据科学项目,你处理了最重要的任务之一,即数据清洗。在数据清洗之后,你不想失去你清洗过的数据框架,所以你想把你清洗过的数据框架保存为CSV文件。让我们看看如何将Pandas数据框架导出为CSV文件。
Pandas通过其内建的to_csv()函数使我们能够做到这一点。
首先,让我们创建一个样本数据框
# importing the module
import pandas as pd
# making the data
scores = {'Name': ['a', 'b', 'c', 'd'],
'Score': [90, 80, 95, 20]}
# creating the DataFrame
df = pd.DataFrame(scores)
# displaying the DataFrame
print(df)
输出 :

现在让我们把这个DataFrame导出为一个CSV文件,命名为your_name.csv。
# converting to CSV file
df.to_csv("your_name.csv")
输出
文件成功保存

如果你得到一个UnicodeEncodeError,只需传递带有’utf-8’值的编码参数。
# converting to CSV file
df.to_csv("your_name.csv", encoding = 'utf-8')
Possible Customizations
1.包括索引号
你可以选择是否要添加自动索引。默认值是真。要把它设置为 “假”。
# converting to CSV file
df.to_csv('your_name.csv', index = False)
输出 :

2.只输出选定的列
如果你只想导出几个选定的列,你可以在to_csv()中以’columns = [“col1”, “col2″‘的方式传递。]
# converting to CSV file
df.to_csv("your_name.csv", columns = ['Name'])
输出 :

3.出口标头
你可以通过设置标题参数为True或False来选择是否要导出你的列名。默认值是True。
# converting to CSV file
df.to_csv('your_name.csv', header = False)
输出 :

4.处理NaN
如果你的数据框有NaN值,你可以选择用一些其他的字符串来替换它。默认值是”.
# converting to CSV file
df.to_csv("your_name.csv", na_rep = 'nothing')
5.与其他东西分开
如果不用’逗号’来分隔这些值,我们可以用自定义值来分隔它。
# converting to CSV file
# separated with tabs
df.to_csv("your_name.csv", sep ='\t')
输出 :

极客教程