手間のかかる外部依存*のないソリューションの場合、次のものがありますreadxl
。
readxl パッケージを使用すると、Excel から R にデータを簡単に取得できます。多くの既存のパッケージ (gdata、xlsx、xlsReadWrite など) と比較して、readxl には外部依存関係がないため、すべてのオペレーティング システムに簡単にインストールして使用できます。単一のシートに格納された表形式のデータを操作するように設計されています。
Readxl は、従来の .xls 形式と最新の xml ベースの .xlsx 形式の両方をサポートしています。.xls のサポートは、libxls C ライブラリによって可能になり、基礎となるバイナリ形式の複雑さの多くを抽象化します。.xlsx を解析するには、RapidXML C++ ライブラリを使用します。
次のようにインストールできます。
install.packages("readxl") # CRAN version
また
devtools::install_github("hadley/readxl") # development version
使用法
library(readxl)
# read_excel reads both xls and xlsx files
read_excel("my-old-spreadsheet.xls")
read_excel("my-new-spreadsheet.xlsx")
# Specify sheet with a number or name
read_excel("my-spreadsheet.xls", sheet = "data")
read_excel("my-spreadsheet.xls", sheet = 2)
# If NAs are represented by something other than blank cells,
# set the na argument
read_excel("my-spreadsheet.xls", na = "NA")
* 厳密にはそうではありません。Rcpp
パッケージが必要であり、Rtools (Windows の場合) または Xcode (OSX の場合) が必要です。これらは R の外部に依存しています。しかし、パスなどをいじる必要はありません。 Java および Perl の依存関係よりも優れています。
更新rexcelパッケージが追加されました。これにより、Excel の書式設定、関数、およびその他の多くの種類の情報を Excel ファイルから R に取得することが約束されます。