R语言 如何将CSV文件导入R中
CSV文件用于以类似表格的格式存储内容,它以行和列的形式组织。每一行中的列值都由一个分隔符串分开。CSV文件可以被加载到工作空间,并使用内置的方法和外部包的导入来工作。
方法1:使用 read.csv()方法
基础R中的read.csv()方法用于将一个.csv文件加载到现在的脚本中并进行处理。csv的内容可以被存储到变量中并进一步操作。多个文件也可以在不同的变量中访问。输出结果会以数据框的形式返回,其中行号被分配为从1开始的整数。
语法: read.csv(path, header = TRUE, sep = “,” )
参数 :
- path : 要导入的文件的路径
- header :默认情况下:TRUE。是否导入列标题的指标。
- sep = “,” : 每一行中数值的分隔符。
代码
输出
如果标题设置为FALSE,列名将被忽略,从V1开始的每一列将显示默认的变量名称。
输出
方法2:使用read_csv()方法
R中的 “readr “包用于将大型平面文件读入工作空间,以提高速度和效率。
read_csv()方法读取一个csv文件,每次读取一行。使用该方法读取的数据是以tibble的形式进行的,其尺寸与存储在.csv文件中的表格相同。屏幕上只显示tibble的10行,其余的在扩展后可以使用,这增加了大文件的可读性。这个方法更有效率,因为它返回更多的列类型信息。如果启用了进度参数,它还会显示当前读入系统的文件百分比的进度跟踪器,因此更加稳健。与基本的 R read.csv() 方法相比,这个方法也更快。
语法: read_csv (file-path , col_names , n_max , col_types , progress )
参数 :
- file-path : 要导入的文件的路径
- col_names : 默认情况下,它是TRUE。如果是FALSE,列名将被忽略。
- n_max :要读取的最大行数。
- col_types :如果任何一列屈服于NULL,那么col_types可以以紧凑的字符串格式指定。
- progress : 一个进度表,用于分析读入系统的文件的百分比。
代码
输出