如何在R编程中从文件中导入数据
事实的集合被称为数据。数据可以是不同的形式。要使用R编程语言分析数据,首先应将数据导入R,它可以是不同的格式,如txt、CSV或任何其他分隔符的文件。导入数据后,再对其进行操作、分析和报告。
用R编程语言从文件中导入数据
在这篇文章中,我们将看到如何在R编程语言中导入不同的文件。
将CSV文件导入R语言
方法1:使用read.csv()方法
这里我们将使用R语言中的read.csv()方法导入csv文件。
语法: read.csv(path, header = TRUE, sep = “,” )
参数 :
- path : 要导入的文件的路径
- header :默认情况下:TRUE。是否导入列标题的指标。
- sep = “,” : 每行中数值的分隔符。
# specifying the path
path <- "/gfg.csv"
# reading contents of csv file
content <- read.csv(path)
# contents of the csv file
print (content)
输出
ID Name Post Age
1 5 H CA 67
2 6 K SDE 39
3 7 Z Admin 28
方法2:使用read.table()方法
这里我们将使用read.table()方法将CSV文件导入R编程语言中。
# simple R program to read csv file using read.table()
x <- read.csv2("D://Data//myfile.csv", header = TRUE, sep=", ")
# print x
print(x)
输出
Col1.Col2.Col3
1 100, a1, b1
2 200, a2, b2
3 300, a3, b3
从文本文件中导入数据
我们可以使用基本的R函数 read.table() 轻松地导入或读取 .txt 文件 。 read.table()是用来读取一个表格格式的文件。这个函数很容易使用而且很灵活。
语法
# read data stored in .txt file
x<-read.table(“file_name.txt”, header=TRUE/FALSE)
# Simple R program to read txt file
x<-read.table("D://Data//myfile.txt", header=FALSE)
# print x
print(x)
输出
V1 V2 V3
1 100 a1 b1
2 200 a2 b2
3 300 a3 b3
如果header参数设置为TRUE,如果文件中存在列名,则读取列名。
从带分隔符的文件中导入数据
R有一个函数 read.delim() 来读取带分隔符的文件到列表中。文件默认由一个制表符分隔,制表符用sep=””表示,分隔符可以是逗号(, ),美元符号($)等。
语法: read.delim(“file_name.txt”, sep=””, header=TRUE)
x <- read.delim("D://Data//myfile.csv", sep="|", header=TRUE)
# print x
print(x)
# print type of x
typeof(x)
输出
X.V1.V2.V3
1 1, 100, a1, b1
2 2, 200, a2, b2
3 3, 300, a3, b3
[1] "list
在R中导入JSON文件
在这里,我们将使用 rjson 包将JSON文件导入R编程语言中。
# Read a JSON file
# Load the package required to read JSON files.
library("rjson")
# Give the input file name to the function.
res <- fromJSON(file = "E:\\exp.json")
# Print the result.
print(res)
输出
$ID
[1] "1" "2" "3" "4" "5"
$Name
[1] "Mithuna" "Tanushree" "Parnasha" "Arjun" "Pankaj"
$Salary
[1] "722.5" "815.2" "1611" "2829" "843.25"
在R中导入XML文件
为了导入XML文件,我们将在R编程语言中使用XML包。
XML文件用于脱敏
<RECORDS>
<STUDENT>
<ID>1</ID>
<NAME>Alia</NAME>
<MARKS>620</MARKS>
<BRANCH>IT</BRANCH>
</STUDENT>
<STUDENT>
<ID>2</ID>
<NAME>Brijesh</NAME>
<MARKS>440</MARKS>
<BRANCH>Commerce</BRANCH>
</STUDENT>
<STUDENT>
<ID>3</ID>
<NAME>Yash</NAME>
<MARKS>600</MARKS>
<BRANCH>Humanities</BRANCH>
</STUDENT>
<STUDENT>
<ID>4</ID>
<NAME>Mallika</NAME>
<MARKS>660</MARKS>
<BRANCH>IT</BRANCH>
</STUDENT>
<STUDENT>
<ID>5</ID>
<NAME>Zayn</NAME>
<MARKS>560</MARKS>
<BRANCH>IT</BRANCH>
</STUDENT>
</RECORDS>
读取XML文件
可以在安装软件包后读取,然后用 xmlparse()函数 进行解析。
# loading the library and other important packages
library("XML")
library("methods")
# the contents of sample.xml are parsed
data <- xmlParse(file = "sample.xml")
print(data)
输出
1
Alia
620
IT
2
Brijesh
440
Commerce
3
Yash
600
Humanities
4
Mallika
660
IT
5
Zayn
560
IT
将SPSS sav文件导入R语言
在这里,我们将在R编程语言中读取SPSS .sav文件。为此,我们将使用 haven 包。为了在R语言中读取SPSS文件,我们使用read_sav()函数,该函数在havan包中。
语法: read_sav(“FileName.sav”)
# import haven library package
library("haven")
# Use read_sav() function to read SPSS file
dataframe <- read_sav("SPSS.sav")
dataframe
输出
极客教程