問題タブ [readr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - readr を使用して因子列の空のセルの NA を防ぐことはできません
いくつかの空のセルを含むファイルを読み込もうとしていますが、空のセルの期待値を取得していますNA
。''
またはの値しか持てない特別な列がいくつかあります'+'
。したがって、これらの列を因子クラスに設定したいと思います
しかし、列にはまだNAs
これらの列があります。パラメーターreadr_tsv
を変更することで関数のグローバルな動作を変更できますが、これは私が望むものではありません。na
これを特定の列でのみ変更したい。
NAs
これらを直接に変換する方法はあり''
ますか? 後でこれを行うことはできますが、間違った方法で使用しているのではないかと思います.
編集 ここにテストファイルがあります
実際にファイルをアップロードするにはどうすればよいですか? 画像しか貼れなかった…
r - dplyr : 一部の行をスキップしながら、ヘッダー付きの tsv ファイルを読み取る方法は?
次の構造の単純なtsv
ファイルがあります。
おそらく使用して読みたいのreadr::read_tsv
ですが、ここに問題があります。
ご覧のとおり、最初の行にはヘッダーが含まれています。次に、読み取りたくない3つの行があり(Apache PIGからの非常に奇妙なデータが含まれています)、4行目でデータが始まります。ではPandas
、次のようなことをします
これにより、ヘッダーを読み取り、行1、2、3をスキップできます。
に同様のオプションはありませんreadr::read_tsv
。あれは :
df = read_tsv('/localpath/data.tsv', col_names = TRUE, skip = 4)
ヘッダーを解析しません...
何か案は?
r - 文字列ベクトル内のドイツ数字の解析
次のような文字列を持つ:
として解析したいと思います
私は試した:
私が思いついた唯一の方法:
r - R の read_csv2() にテキスト文字を正しく認識させる方法
read_csv2()
fromreadr
パッケージを使用して csv ファイルを読み込もうとしています。
問題はread_csv2()
、R のデフォルトでは正常に認識されるのに、文字が正しく認識されないことread.csv2
です。
例えば:
元の値:KOZYATAĞI
read_csv2()
認識方法:KOZYATA<'d0'>I
ヘルプ ファイルを確認し、以下のコーディングも試しました。しかし、それを実現することはできませんでした。
最初の試行: 間違った文字で終わった
2 回目の試行: エンコーディングを手動で指定します。
3 回目の試行: 上記のエラー メッセージのため、2 回目の試行に追加します。
これはエラーにはなりませんが、文字を正しく認識しません。
どうやってするの?他に必要な情報があれば教えてください。前もって感謝します。
r - readrを使用して年なしで日付を読み取るにはどうすればよいですか?
日付が年なしで指定されているデータ ファイルがあります。
こんな風に読んでみる
しかし、readr の日付パーサーは、年がないと日付を解析できないようです。一方、lubridate は次のような日付を処理できます。
readr がそのような日付を読み取ったり、lubridate を使用したりできる方法はありますか?
readr がそのような「日付」または通年の日付を処理できない場合、次のように dplyr を使用します。
r - ヘッダーに数字記号が含まれる変数を含む csv の読み取りの問題 [r]
この過去の質問と同様の問題があります: How can read 'Numeral Signs-#' as part of a column header?
私もcsvファイルの最初の変数の名前の一部としてポンド/ハッシュ/番号記号を持っています: "Seg#"
readr の「read_csv」を使用して csv を読み込むと、解析の失敗に関する警告メッセージが表示されます。このメッセージには、予想される 25 列、実際の 26 列が含まれます。データを読み取りますが、各列名が右にシフトし、データの最初の列 (以前は変数 "Seg#" の下にあったもの) が欠落しています。
read.csv を使用すると、同じデータ フレームが生成されますが、警告は表示されません。
上記のリンクの質問の推奨事項を使用して、これを解決しようとしました。
...しかし、単純に同じことを行いました: データの最初の列を削除し、すべての名前を一度右にシフトしました。
read.csv の代わりに「read.table」を実行しようとすると、次のエラー メッセージが表示されます。
どんな助けでも大歓迎です!
編集:データ例を含む
データが Excel でどのように表示されるかを次に示します。
ただし、R に読み込むと、データは次のようになります。
r - readr::read_csv の末尾の区切り文字を無視する
を使用して末尾の区切り文字を含む CSV ファイルを読み取るreadr::read_csv
と、欠落している列名が入力されたという警告が表示されます。この警告を再現するための短いサンプル CSV ファイルの内容を次に示します (次のスニペットを というファイルに保存しますexample.csv
)。
各行の終わりにある末尾のコンマに注意してください。このファイルをロードすると
次の警告が表示されます。
3列のみを明示的にロードしたい場合でも
それでも警告メッセージが表示されます。
これは予想される動作read_csv
ですか、それとも指定したものを除くすべての列を無視することになっていることを伝える方法はありますか? または、末尾の区切り文字が削除/無視されるように、この (明らかに不正な) CSV を整理する別の方法はありますか?
r - 必要な出力を受信できませんでした
Rプログラミングで固定幅ファイル形式を読み取る割り当てを行っていました。これは私のデータセットです
http://www.cpc.ncep.noaa.gov/data/indices/wksst8110.for
readrパッケージを使用してファイルを読み取り、以下に示すコードでデータを消去しました
今、私は必要な 9 列を取得しました。私の課題は 4 番目の列の合計を見つけることです。私の答えは 36540 ですが、必要な答えは 32467 です。どんな答えでも大歓迎です。事前に感謝します。