1

私は大規模なデータセットを扱っています。コマンドでそれらのいくつかを読み取ることができますが、そのようなデータセットのためにread.table引数を使用すると、 fill=TRUENA を表す空白がいくつかあります。

現在、最大35 Gbのデータベースがあるため、通常のread.tableコマンドは役に立たないため、パッケージに read.big.matrix 関数を見つけましたbigmemory。問題は、次のエラーが返されることです。

「ヘッダー行と最初のデータ行の寸法が一致しません。」空欄をNAとして読んでいないからだと思います。

どうすればこの問題を解決できるか知っていますか? ありがとう。

4

2 に答える 2

0

この古い質問に関して、私は最近、次のようなことを理解しましたfile:

somethin rowname1 rowname2
colname1 value1.1 value1.2
colname2 value2.1 value2.2

header = TRUE引数とを使用してhas.row.names = TRUEで R にファイルをロードすると、関数はフィールドが実際には存在しないことをread.big.matrix想定しているため、機能しません。somethin正確なコマンドを提供しなかったため、これがここでの問題かどうかはわかりませんが、基本的に、関数はヘッダーに実際のデータの最初の行と同じ数のフィールドがあることを確認しますが、最初の行を指定するとcolumn を行名として使用すると、データの最初の行のフィールドが 1 つ少なくなり、ヘッダーはこの数のフィールドと一致する必要があります。somethin次のようなLinuxコマンドを使用してフィールドを削除できますcat <(head -1 file | cut -d' ' -f2-) <(tail -n+2 file) > newFile

于 2020-02-11T21:04:33.300 に答える