5

を使用して末尾の区切り文字を含む CSV ファイルを読み取るreadr::read_csvと、欠落している列名が入力されたという警告が表示されます。この警告を再現するための短いサンプル CSV ファイルの内容を次に示します (次のスニペットを というファイルに保存しますexample.csv)。

A,B,C,
2,1,1,
14,22,5,
9,-4,8,
17,9,-3,

各行の終わりにある末尾のコンマに注意してください。このファイルをロードすると

read_csv("example.csv")

次の警告が表示されます。

Missing column names filled in: 'X4'

3列のみを明示的にロードしたい場合でも

read_csv("example.csv", col_types=cols_only(A=col_integer(),
                                            B=col_integer(),
                                            C=col_integer()))

それでも警告メッセージが表示されます。

これは予想される動作read_csvですか、それとも指定したものを除くすべての列を無視することになっていることを伝える方法はありますか? または、末尾の区切り文字が削除/無視されるように、この (明らかに不正な) CSV を整理する別の方法はありますか?

4

2 に答える 2

3

私はあなたができるとは思わない。私がドキュメントで見ることができるのは、cols_only()すでにロードされている R オブジェクトです。

ただし、ライブラリのfread()関数をdata.table使用すると、ファイルを読み込むときに特定の列名を選択できます。

DT <- fread("filename.csv", select = c("colA","colB"))

于 2016-12-22T10:07:49.430 に答える