問題タブ [tidyr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - NAを使用したTidyrのgather()
幅の広いテーブルを長いテーブルに変換するためにtidyr
andを使用しています。lubridate
以下は問題なく動作します。
ただし、NA が混在している場合、日付は文字列に変換されます。
通常の文字列が NA と混在している場合も警告が表示されることに注意してください。
警告を回避してフォーマットを保持しながら、NA で tidyr を使用することは可能ですか?
r - tidyr::separate with sep="" を使用して、列を複数の列に分割します
sequence
列を 5 つの列 (文字ごとに 1 つ)に分割したいと考えています。私はそれをやろうとしましたが、空の文字列をセパレーターとして受け入れないtidyr::separate
内部的に使用します(ただし、引数は正規表現を取る必要があります)。stringi::stri_split_regex
sep
予想される出力は次のようになります。
r - tidyr での正規表現の使用に関する問題
Using data は、ここで尋ねたばかりの質問です。私はtidyr
using を使用してデータを広めたかったのextract()
です。
これは、hadley hereからの回答に基づいていました。
しかし、私はエラーが発生します:
私は通常、正規表現を使用しませんが、使い始めたいと思っているので、誰かが私が失敗している場所を理解するのを手伝ってくれれば、それは大歓迎です.
ありがとう!
r - tidyr からの収集を使用するときに属性を保持する (属性は同一ではありません)
Codd の第 3 正規形を満たすために、2 つのテーブルに分割する必要があるデータ フレームがあります。単純なケースでは、元のデータ フレームは次のようになります。
収集機能を使用すると、属性が同一ではなく、性別の要素と誕生日の潤滑油 (または実際の例では他の属性) が失われることが警告されます。各列のデータ型が失われないようにするための適切なソリューションはありますか?
同じデータ型の変数の各セットを個別に収集してからすべてのテーブルを結合する方法を想像できますが、私が見逃しているより洗練されたソリューションがあるはずです。
r - tidyr で収集した後の予期しないサブセット動作
何が起きてる?
設定
y1
およびy2
、同等の data.framesを作成します。を使用しy1
て生成され、直接読み込まれます。gather
y2
y1
そしてy2
等しい
問題
サブセットy1
化は POSIXct 列を数値に落としますがy2
、同じ方法でのサブセット化はそうではありません。
セッション情報
R バージョン 3.1.2 (2014-10-31) プラットフォーム: i386-w64-mingw32/i386 (32 ビット)
tidyr 0.2.0.9000
r - 値が欠落している dplyr クロス集計
を使用してRでクロスタブを作成したいと思いますdplyr
。table()
baseコマンドだけを使用しないのには十分な理由があります。
これはすべて順調です。group_by()
しかし、変数に欠損値があるとバラバラになるようです。
私が望むのはNA
、あなたがするときのような列のためだと思いますtable(..., useNA = "always")
。任意のヒント?
regex - R:正規表現を使用して値を列名にtidyr分割およびスイング
私はパッケージでカスタマイズしようとしていtidyr
ますが、いくつかの変数を連結した変数を持つという問題に苦しんでいます。以下の最小限の例では、変数v2
をその構成変数v3
に分割しv4
、これらをスイングして、最終的に 4 つの変数v1
-を作成しv4
ます。
v2
新しいものに分割すると、次のtemp
ようになりますv3
。
私の問題は次のとおりです。
- 1)を使用して列名として分割およびスイング
v3
ANDアップするにはどうすればよいですか?v4
tidyr
- 2)私の実際のデータでは、変数名はわかりません(またはそれらは非常に多くあります)が、それらは「var value」という構造を持っています.1)のようにそれらを自動的に識別してスイングするために正規表現を使用したいと思います。
このSO の回答に触発されましたが、変数名の正規表現コードを使用しても機能しませんでした。
更新:私の出力は次のようになります( and でv2
冗長になったため、スキップできます):v3
v4
r - R で複数の行を 1 つの列に変換する
R を使用して、次のような大きなデータ フレームがあります。
次のようになります。
データが欠落しているため、ある日は 6 回の観測があるかもしれませんが、他の日は 4 回しかないかもしれません (またはそれ以下、これは例です)。
これを、次のように、30 分間隔ごとに別の列として日付を含むデータ フレームに変換したいと思います。
df
X2 がどこにあるかのインデックスを簡単に取得して、日付を繰り越すループをNA
作成できますが、Rfor
でのループは避けたいと思います。for
Rでこれを行うにはどうすればよいですか?確かにdplyr
またはtidyr
解決策が利用可能ですが、ドキュメントの例からは作成できません。または、おそらくいくつかのバージョンのmelt
?
r - R: tidyr を使用して、構造的な欠落データや冗長データを含むデータ テーブルをクリーンアップします。
まだパッケージを手に入れようとしていtidyr
ます。次のような冗長行を含むデータセットがある場合:
id 変数v1
-v3
は多くの NA を持つ冗長な行に分割されているため (したがって、2 つの測定値も繰り返されます)、次のようなものを取得したいと考えています。
を使用してこれを取得する一般的な方法は何でしょうtidyr
か? を使用して実行できると思いますgather()
が、どうすればよいですか?