R语言 把CSV文件读入数据框架
在这篇文章中,我们将学习如何在R编程语言中导入或读取CSV文件到数据框中。
使用中的数据集
第1步:设置或改变工作目录
为了将给定的CSV文件导入或读取到我们的数据框中,我们首先需要检查我们当前的工作目录,并确保CSV文件与我们的R工作室所在的目录相同,否则可能会显示 “未找到文件错误”。
要检查当前的工作目录,我们需要使用getwd()函数,而要把当前的工作目录改为其他的工作目录,我们需要使用stewd()函数。
getwd()返回一个绝对文件路径,代表R进程的当前工作目录。
语法
getwd()
setwd(dir) 用来设置工作目录为dir。
语法 :
setwd(path)
例子
# gives the current working directory
getwd()
# changes the location
setwd("C:/Users/Vanshi/Desktop/gfg")
输出
C:/Users/Vanshi/Documents
第2步:读取CSV文件
现在我们已经设定了工作路径,我们将把CSV文件导入数据框,并把我们的数据框命名为sdata。
在这里,我们使用read.csv命令将名为 “SampleData “的.csv文件读入我们的R工作室,这意味着我们将数值输入到R工作室,从中提取一些重要信息。
read.csv()函数读取了一个表格格式的文件,并从中创建了一个数据框架,案例对应于文件中的行,变量对应于字段。
语法: read.csv(file, header = TRUE, sep = ",", quote = "\"", dec = ".", fill = TRUE, comment.char = "", ...)
参数
- file: 要读取数据的文件名。
- header: 一个逻辑值,表示文件的第一行是否包含变量的名称。如果缺失,该值由文件格式决定:当且仅当第一行包含的字段比列数少一个时,header被设置为TRUE。
- sep: 字段分隔符。文件中每一行的值都由这个字符分开。如果sep=””(read.table的默认值),则分隔符为 “空白”,即一个或多个空格、制表符、换行符或回车符。
- quote: 引号字符的集合。
- dec: 文件中用于小数点的字符。
- fill: 逻辑上的。如果为 “true”,那么在行的长度不相等的情况下,将隐含地添加空白区域。
- comment.char:_ 字符:长度为1的字符向量,包含单个字符或一个空字符串。
- … : 要传递的其他参数。
例子
sdata <- read.csv("SampleData.csv", header = TRUE, sep = ",")
sdata
# views the data frame formed from the csv file
View(sdata)
输出
现在,我们已经创建了我们的数据框架,我们可以对它进行一些操作。根据使用情况,从数据框架中读取数据。下面是两个例子,根据他们的要求读取数据。
例子1 :
sdata <- read.csv(
"SampleData.csv", header = TRUE, sep = ",")
highspeed <- subset(
sdata, sdataspeed == max(sdataspeed))
# views the subsetted value in
# tabular form
View(highspeed)
输出
例2 :
sdata <- read.csv(
"SampleData.csv", header = TRUE, sep = ",")
highfreq <- subset(
sdata, sdata$cyc_freq == "Several times per week")
# views the information, of the above
# condition in tabular format
View(highfreq)
输出