4

.xlsx(2010)用に7000を超えるExcelデータファイルがあります。私のRバージョンはR2.15.0です。xlsxをxlx、.cvs、またはtxtに変換するために手動操作を行うと、それを行うのにより多くの時間がかかります。

4

2 に答える 2

1

私は XLSconnect を使用していませんが、学生はパッケージ xlsx を使用していました。次に、関数 read.xlsx または read.xlsx2 のいずれかが xls シートを読み取ります。このパッケージには、xls 形式の読み取りと書き込みのオプションがあり、スプレッドシートと特定の領域の特定のシートを読み書きできます。

このパッケージを使用するために私が学生 (生物学の 2 年生) に与えた唯一の正式なガイダンスは、スプレッドシートは「整形式」でなければならないということです。(すべての項目は数式ではなくデータです。最初の行は小文字の変数名で、文字以外の文字は含まれていません。2 行目から ## 行目は各変数のデータがあります。同じレコードのすべてのアイテムよりもレコードの場合は同じ行にあります) *.xls を厳密にする必要はありませんが、学生がデータ ファイルを読み取る際の問題を最小限に抑えたいと考えました。

于 2012-05-08T13:51:53.370 に答える
1

パッケージ内の関数read.xlsは、ファイルを に読み込みます。私はこれを頻繁に使用します。gdataxlsxxlsR

作業する Excel ファイルがたくさんあるようですね。大量のこれらのファイル (xlsxとの両方xls) を に取り込むには、次のようにしRます。

作業を Excel ファイルの場所に直接設定する

setwd("F:\\ address of folder with all my Excel files")

作業ディレクトリ内のすべてのファイルのリストを作成します

MyFiles <- list.files()

リストをチェック

MyFiles

作業ディレクトリに含まれる xls および xlsx ファイルからのすべてのデータを含むリストを作成します。これはバッチ データ インポート機能のようなものです。

library(gdata)
Mylist <- lapply(MyFiles, read.xls) 

一部の Excel ファイルが破損している場合などに備えて、フォルダー内のすべてのファイルが読み取られていることを確認してください。結果がFALSE問題である場合は、問題があります。

identical(length(MyFiles), length(Mylist))

次にsapply、 などを実行して、ファイル内のデータに対して関数を実行します。

于 2012-05-08T14:33:55.913 に答える