R语言 只从CSV中导入选定的数据列
在这篇文章中,我们将研究两种不同的方法,从R编程语言中的CSV文件中导入选定的数据列。
方法1:U sing read.table()函数
在这种只导入CSV文件数据的选定列的方法中,用户需要调用read.table()函数,这是R编程语言的一个内置函数,然后在其参数中传递选定的列,以导入数据中的特定列。在这里,用户必须向参数传递空值,以避免导入该特定列。
read.table() 函数读取一个表格格式的文件,并从中创建一个数据框架,案例对应文件中的行,变量对应字段。
语法
read.table(file, header, nrows, skip, colClasses, sep)
参数
- file: 指定文件的名称。
- header: header是一个逻辑标志,表示第一行是否为包含数据的标题行。
- nrows: 指定数据集中的行数。
- skip: 帮助从头开始跳过行。
- colClasses: 它是一个字符向量,表示数据集中每一列的类别。
- sep: 它是一个字符串,表示列的分隔方式,即用逗号、空格、冒号、制表符等。
使用中的数据集
例子
gfg_data <- read.table("gfg_data.csv", header = TRUE, sep = ",",
colClasses = c("numeric", "NULL", "NULL",
"numeric", "NULL"))
gfg_data
输出
方法2: 从data.table包中唱出fread()函数。
在这种方法中,为了只将选定的列导入到R编程语言中,用户首先需要在R控制台中安装并导入data.table包,然后调用read()函数,这是data.table包的函数,在该函数的select参数中包含文件位置和要导入的选定列。此外,这将导致所选列的导入
fread() 函数是快速和更方便的控制,如sep、colClasses和nrows被自动检测。
语法
fread(file, sep, colClasses, nrows)
参数
- file: 指定文件的名称。
- colClasses: 它是一个字符向量,表示数据集的每一列的类别。
- sep: 是一个字符串,表示用逗号、空格、冒号、制表符等方式分隔各列。
- nrows: 指定数据集中的行数。
例如
library("data.table")
gfg_data <- fread("gfg_data.csv",
select = c("A", "C", "E"))
gfg_data
输出: