Python Pandas IO工具
Pandas I/O API 是一组顶级的读取函数,像 pd.read_csv() 一样被访问,通常返回一个Pandas对象。
读取文本文件(或平面文件)的两个主要函数是 read_csv() 和 read_table() 。 它们都使用相同的解析代码来智能地将表格数据转换为 DataFrame 对象:
下面是csv文件数据的样子 −
将这些数据保存为 temp.csv ,并对其进行操作。
将这些数据保存为 temp.csv 并对其进行操作。
read.csv
read.csv 从csv文件中读取数据并创建一个DataFrame对象。
其 输出 情况如下—
自定义索引
这指定了csv文件中的一个列,以使用 index_col 来定制索引。
其 输出结果 如下 –
转换器
列的 dtype 可以作为一个dict来传递。
其 输出结果 如下 –
默认情况下,Salary列的 dtype 是 int ,但是结果显示为 float ,因为我们已经明确地转换了这个类型。
因此,数据看起来像float –
header_names
使用names参数指定头的名称。
其 输出结果 如下 –
观察一下,头的名字被附加上了自定义的名字,但是文件中的头并没有被消除。现在,我们使用header参数来删除它。
如果文件头在第一行以外的地方,把行号传给header。这将跳过前面的行。
其 输出结果 如下 –
跳过行
skiprows跳过指定的行数。
其 输出结果 如下 –