R语言 Excel文件
Microsoft Excel是最广泛使用的电子表格程序,它将数据存储在.xls或.xlsx格式中。R可以使用一些专门的Excel包直接从这些文件中读取数据。常用的包有XLConnect、xlsx、gdata等。我们将使用xlsx包。通过这个包,R还可以将数据写入Excel文件中。
安装xlsx包
您可以在R控制台中使用以下命令来安装“xlsx”包。它可能会要求您安装一些依赖于此包的附加包。请使用所需包的名字重复相同的命令来安装附加包。
install.packages("xlsx")
验证和加载“xlsx”包
使用以下命令验证和加载“xlsx”包。
# Verify the package is installed.
any(grepl("xlsx",installed.packages()))
# Load the library into R workspace.
library("xlsx")
运行脚本后我们得到如下输出。
[1] TRUE
Loading required package: rJava
Loading required package: methods
Loading required package: xlsxjars
以XLSX文件输入
打开Microsoft Excel。将以下数据复制并粘贴到名为sheet1的工作表中。
id  name      salary    start_date  dept
1   Rick        623.3     1/1/2012     IT
2   Dan       515.2     9/23/2013    Operations
3   Michelle  611        11/15/2014 IT
4   Ryan        729      5/11/2014     HR
5   Gary        43.25     3/27/2015     Finance
6   Nina        578       5/21/2013    IT
7   Simon       632.8     7/30/2013    Operations
8   Guru        722.5     6/17/2014    Finance
同时将以下数据复制并粘贴到另一个工作表,并将该工作表重命名为”city”。
name        city
Rick        Seattle
Dan       Tampa
Michelle  Chicago
Ryan        Seattle
Gary        Houston
Nina        Boston
Simon       Mumbai
Guru        Dallas
将Excel文件保存为“input.xlsx”,应该保存在R工作环境的当前工作目录中。
读取Excel文件
使用 read.xlsx() 函数来读取input.xlsx,如下所示。结果将以数据框形式存储在R环境中。
# Read the first worksheet in the file input.xlsx.
data <- read.xlsx("input.xlsx", sheetIndex = 1)
print(data)
当我们执行上面的代码时,会产生以下结果 –
id,   name,     salary,   start_date,   dept
1      1    Rick      623.30    2012-01-01    IT
2      2    Dan       515.20    2013-09-23    Operations
3      3    Michelle  611.00    2014-11-15    IT
4      4    Ryan      729.00    2014-05-11    HR
5     NA    Gary      843.25    2015-03-27    Finance
6      6    Nina      578.00    2013-05-21    IT
7      7    Simon     632.80    2013-07-30    Operations
8      8    Guru      722.50    2014-06-17    Finance
极客教程