Rでは、約42,900行の基本的なCSVファイルを読み込もうとしています(Unixのwc -lで確認済み)。関連するコードは
vecs <- read.csv("feature_vectors.txt", header=FALSE, nrows=50000)
ここで、nrowsは少し過大評価されています。でも、
>> dim(vecs)
[1] 16853 5
結果のデータフレームが17,000行のオーダーであることを示します。これはメモリの問題ですか?各行は、最大30文字のハッシュコード、最大30文字の文字列、および3つの整数で構成されているため、ファイルの合計サイズはわずか約4MBです。
関連する場合は、多くの行に欠落しているフィールドがあることにも注意する必要があります。
ご協力いただきありがとうございます!