发布于 2016-01-02 09:43:05 | 944 次阅读 | 评论: 0 | 来源: 网络整理
Microsoft Excel是使用最广泛的电子表格程序,其存储数据在 .xls 或 .xlsx 格式。R能够直接使用一些 excel 特定的软件包,来从文件中读取数据。很少有这样的包 - XLConnect,XLSX,GDATA等。我们将使用XLSX包。 - R语言也可以使用该软件包写入 Excel 文件。
可以使用下面的命令在R控制台来安装“XLSX”包。 它可能会要求安装一些额外的软件包此程序包依赖。按照所需的软件包名称的相同的命令来安装额外的软件包。
install.packages("xlsx")
使用以下命令来验证并加载“XLSX”包。
# Verify the package is installed.
any(grepl("xlsx",installed.packages()))
# Load the library into R workspace.
library("xlsx")
当脚本运行,我们得到如下输出。
[1] TRUE
Loading required package: rJava
Loading required package: methods
Loading required package: xlsxjars
打开Microsoft Excel中。复制并粘贴以下数据到名为工作表Sheet1工作表中。
id name salary start_date dept
1 Rick 623.3 1/1/2012 IT
2 Dan 515.2 9/23/2013 Operations
3 Michelle 611 11/15/2014 IT
4 Ryan 729 5/11/2014 HR
5 Gary 843.25 3/27/2015 Finance
6 Nina 578 5/21/2013 IT
7 Simon 632.8 7/30/2013 Operations
8 Guru 722.5 6/17/2014 Finance
下面的数据也复制并粘贴到另一个工作表,并重新命名该工作表为:“city”。
name city
Rick Seattle
Dan Tampa
Michelle Chicago
Ryan Seattle
Gary Houston
Nina Boston
Simon Mumbai
Guru Dallas
Excel 文件保存为“input.xlsx”。应该将其保存在R工作空间的当前工作目录。
所述 input.xlsx 通过使用 read.xlsx()函数来读取,如下所示。结果被存为数据帧。
# Read the first worksheet in the file input.xlsx.
data <- read.xlsx("input.xlsx", sheetIndex = 1)
print(data)
当我们上面的代码执行时,它产生以下结果:
id name salary start_date dept
1 1 Rick 623.30 2012-01-01 IT
2 2 Dan 515.20 2013-09-23 Operations
3 3 Michelle 611.00 2014-11-15 IT
4 4 Ryan 729.00 2014-05-11 HR
5 NA Gary 843.25 2015-03-27 Finance
6 6 Nina 578.00 2013-05-21 IT
7 7 Simon 632.80 2013-07-30 Operations
8 8 Guru 722.50 2014-06-17 Finance