0

私はアルゴリズムとデータ構造に関するコースを行っています。課題については、提出する前に多くの統計テストを行うことをお勧めします。私のテストは、主に実行時間、生成された出力のランダム性などに関するものです。データの図的表現についてRを調べていました。

R が からデータを読み取ることを好むファイルの種類と、Java で簡単に作成できるファイルを知りたいです。

多くの人が csv ファイルを R に渡しているのを見ました。そのためには、Java の openCSV ライブラリのようなものが必要になります。また、 csv-s と比較して、同じ目的で delim で区切られた .txt ファイルはどれくらい良い/悪いですか?

編集:ええと、私が好む と言ったとき、私は本当にRなどを擬人化していませんでした... ただ、私が感じたことを表現する最良の方法だと思いました. R のページのどこかで、Excel シート、特に2007 年の郵便局のものは良い選択ではないことを読みました探していたソフトウェアが 1 つ見つかり、彼女はタブ区切りのテキスト ファイルを受け取って、私が今まで欲しかったものをすべて返してくれました。本当であるには良すぎるようでした。

私は彼らの答えに感謝します.Rはデータインポートファイルタイプに公平であるようです.

4

2 に答える 2

-1

非常に大きなデータセットがある場合は、SQL バリアントを使用することをお勧めします。これにより、サブセットの選択が非常に簡単になります。もちろん、最初にデータベース形式に変換する必要があります。これを行うには、次のようにします。

LOAD DATA LOCAL INFILE 'csvTest.csv'
INTO TABLE csvImport
FIELDS TERMINATED BY ';'
ENCLOSED BY '"'
LINES TERMINATED BY '\n'
IGNORE 1 LINES

残念ながらドイツ語のチュートリアルですが、提供されているコードで十分なはずです。

編集: SQL パッケージのリンクを同封するのを忘れました: http://cran.r-project.org/web/packages/RMySQL/index.html

それ以外の場合、R はどのデータも優先しません。他の人が提案したように、読み取りプロセスを正しく構成するだけです。

于 2013-09-05T07:16:44.807 に答える