問題タブ [readr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - readr - CSV の日付列のインポート
独自の日付形式を入力してデータをインポートする方法についてアドバイスが必要readr
です。私が試している方法は次のとおりです。
しかし、それは私にエラーを与えます
" col_date("02/03/2015", "%d/%m/%Y") のエラー: 未使用の引数 ("%d/%m/%Y")
それを使用して単一の入力をテストするparse_date("02/03/2015", "%d/%m/%Y")
と、望ましい結果が得られます
誰かが私を助けてくれれば、本当に感謝しています。ここ数日間、これで立ち往生しています。
r - 引用符で囲まれた NA 値を readr に処理させるにはどうすればよいですか?
これを実行すると、次の結果が得られます。
実際には、"N/A"
値は最終的に になりますNA
が、これを処理するよりエレガントな方法はありますか? たとえば、これは問題なく実行され、望ましい動作を示しています。
r - rでreadrを使用してファイルを読み取るときの大きな整数
readr
将来、いくつかの大きなファイルで作業するので、パッケージを使用したかったのです。私の問題は、Intensity
いくつかの非常に大きな値を持つという列があることです(例:5493500000
)。私の問題は、この大きな値が最初に表示されるのは 2200 行目であり、既に列が代わりにreadr
定義されており、バッファ オーバーフローが発生することです。integer
numeric
read_tsv
(約) 40 列すべてに正しい型を提供したくないので、関数に単一の列型のみを提供する方法はありますか。
どんな助けでも大歓迎です。
r - R readr::read_fwf fwf_widths を使用して文字を無視する
R の readr パッケージの read_fwf を使用して文字をスキップする簡単な方法があるかどうかを知りたいです。
たとえば、ドキュメントの例の 1 つを変更すると、
エラーをスローします:
ただし、ベースの read.fwf 関数を使用しても問題なく動作します。
を使用してこの動作を模倣する方法はありreadr::read_fwf
ますか? (私は主にパフォーマンス上の理由から興味があります)。
r - R: data.table::fread を使用して CSV ファイルを読み取るにはどうすればよいですか。
ローカルのドイツ スタイルの数値を含む CSV ファイルをいくつか取得しました。つまり、10.380,45 のように、小数点記号としてコンマを使用し、1000 単位の区切り記号としてポイントを使用します。CSV ファイルの値は「;」で区切られます。ファイルには、文字、日付、日付と時刻、および論理クラスの列も含まれています。
read.table 関数の問題は、dec="," で小数点記号を指定できますが、3 桁区切り記号は指定できないことです。(私が間違っていたら、私を修正してください)
前処理が回避策であることは知っていますが、他の人が自分なしで使用できるようにコードを書きたいと思っています。
次の例に示すように、独自のクラスを設定することで、read.csv2 を使用して CSV ファイルを希望どおりに読み取る方法を見つけました。Rでポイントを3桁区切りとしてcsvをロードする最もエレガントな方法に基づく
私の問題は、さまざまなデータセットに最大 200 列と 350000 行があることです。上のソリューションでは、1 つの CSV ファイルをロードするのに 40 秒から 60 秒かかるため、これを高速化したいと考えています。
私の調査を通じて、パッケージfread()
から見つけましたdata.table
。これは非常に高速です。CSV ファイルの読み込みには約 3 ~ 5 秒かかります。
残念ながら、3 桁区切りを指定することもできません。だから私は自分のソリューションをcolClassesで使用しようとしましたが、個々のクラスをfreadで使用できないという問題があるようですhttps://github.com/Rdatatable/data.table/issues/491
次のテスト コードも参照してください。
だから私の質問は: fread で 10.380,45 のような数値を持つ CSV ファイルを読み取る方法はありますか?
(代わりに: そのような数値を含む CSV を読み取る最速の方法は何ですか?)
r - csv を r にインポートする際の特殊文字の処理
csv (セミコロン区切り) を R にインポートできません。問題は、一部の列に特殊文字 (セミコロンなど) を含むテキストが含まれているため、一部の行の列数が等しくないことです。
特殊文字は、「;」などのクォータで囲みます。ファイルは 2.3 GB です。このファイルを Excel で正しく開くことができます (少なくともその一部)。
readr、data.table、basic R を試しましたが失敗しました。
これは Notepad++ で行うこともできますが、R の方がよいでしょう。