問題タブ [readr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R へのインポート時の csv および fwf ファイルのエラー (文字化け) を修正
かつてテープとして保存されていた大きなファイル (fwf および csv) からデータをインポートしているため、テープの読み書き時にエラーが発生する可能性があります。
古いファイルは固定幅ファイル (fwf) 形式です。新しいファイルは .csv 形式です (セパレータとして ";" を使用)。
エラーは次のようになります。
fwf ファイルの場合:
- 破損した文字は、データのシーケンスのすべてを横向きにし、その時点からすべてのセルをコンテンツと一致させません。
- 行末文字の欠落
csv ファイルの場合:
- 壊れた文字
- それ以外の場合は数値列の文字または文字が破損している
- 意図しないセパレータ (予想よりも多くのセパレータにつながる (
列数 - 1)
エラー行をスキップしてこれを R にインポートする方法はありますが、後で手動でチェックできるようにエラーのログを保持しますか?
または、R の外部にある別のツールを使用する必要がありますか? この場合、どのツールですか?
非常に大きなファイル(それぞれ90GB)が約100個あるので、これにはdata.table::freadベースのソリューション、またはその他の高速なソリューションをお勧めします。
r - Silent type_convert
コンソールで使用している列の仕様を通知せずにtype_convert
、パッケージの関数を使用する方法はありますか。readr
?
ヘルプ ドキュメントの例から:
Parsed with column specification
私はその部分をなくしたいので、次のようになります:
r - \"でCSVを読み取る方法、Rの引用文字値内のシーケンス?
以下は、2 つの文字列を含む CSV ファイルです。
すべての文字値は二重引用符で囲みます。また、値の 1 つの中にシーケンスが\",
あります (エスケープされた引用符と区切り文字)。read.csvでも、readrのread_csvでも、data.tableのfreadでも、このファイルを正しく読み取ることができません。
r - readr と括弧内の負の数
readr
括弧内の数値を負の数値として解析する方法はありますか? たとえば、以下のコードでは、列B
を数値として解析し、最初の項目を -2.3 にしたいと考えています。
現在、私は単純に文字データとして読み取ってから後処理していますが、カスタム パーサーを登録することをお勧めします。