問題タブ [readr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
212 参照

r - 不適切な CSV ファイル構造の読み取り

大きな csv データファイル (, で区切られている) を読み込もうとしていますが、次のような行でスタックし続けます: 生ファイルへのリンク: " http://daniels-pull.universityofdenv.netdna-cdn.com /assets/GeneralOccurrencesAll.csv "

ご覧のとおり、ファイルの区切り文字も列で使用されています。列の区切り文字を正規表現として指定してファイルを読み取る方法はありますか、または read.fwf を使用して各フィールドの最大長を調べ、それを使用してデータを解析する必要がありますか? 現在、これは私がこれまでに思いついた私のコードです:

read.fwf を使用する必要がありますか、それとも問題のある列を手動で引き出す必要がありますか? どんな助けでも大歓迎です。

編集:

ボーナス ポイントについては、csv ファイル内の不適切な列や、この場合のようにファイルの構造を台無しにする可能性のあるデータを検出する関数を構築したいと考えています。そうすれば、テキスト エディターをいじる必要がなくなり、ファイル内のこれらのエラーをプログラムで見つけることができます。このようなものを構築する方法について考えていますか?

0 投票する
1 に答える
204 参照

r - csv ファイルのバインド時に大量のインポートを行う

最大整数 (.Machine$integer.max = 2147483647) を超える列を含むデータをインポートしようとしたときに、コードに問題が発生しました。readr の read_csv を使用すると、四捨五入ではなく NA としてインポートされていると思います。複雑なのは、rbindlist を使用して複数の csv をインポートしようとすることです。

これが私の現在の設定です:

csv をインポートする最後の行を書き、「金額」列を整数ではなく文字にするにはどうすればよいですか?

ここに私が運なしで試したいくつかのことがあります...

tl;dr - 特定の列を文字形式または int64 に変更する際に、csv のリストをインポートするのに助けが必要です。

ありがとうございました。