問題タブ [tidyr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - tidyR で長いデータから広いデータへ?
このようなデータがあります
私はそれを次のように再形成したい:
tidyRでそれを行うことは可能ですか?
リシェイプでできる
しかし、何か新しいことを学ぶのはいつでも良いことです。
r - R dplyr/tidyr: 他の観測からのデータで新しい列を「変異」させます
以前の関連する行のデータを使用して、dplyr/tidyr 関数を使用して 2 つの新しい変数を作成しようとしています。私の例では、ID、YEAR、および AMOUNT のデータを含む data.frame があります (以下を参照)。
dplyr/tidyr を使用して最後の 2 つの列を動的に作成したい (以下を参照) (定期的に行う方法を見つけましたが、dplyr/tidyr の最新バージョンでそれを行う方法を知りたいです)。
ここで、YtY_VARIANCE は前年度から金額を差し引いて得られ、Y_VARIANCE は初年度から金額を差し引いて得られます (常に)。
私は次のようなコードを期待します:
xxx と yyy は何でしょう?! それは可能ですか?
誰でも答えを教えたり、指摘したりできますか?
前もって感謝します!
r - R: 単一の列に連結された var-val ペアを使用してデータを整理する方法
私はすでに SO hereとhereでこれを解決しようとしました-原因は良い答えを得ましたが、これは一般的な問題であると私が信じているものの部分的な解決策にすぎないことに気付きました: 多くの場合、データは変数を持つように編成されています (最も興味深いものは明らかに) 変数ごとに 1 つの列として、次にいくつかの変数と値のペアがまとめられた最後の列として。最後の列の変数を個別の列にスイングする一般的な方法に苦労してきましたが、このデータの整理は仕事ではないtidyr
でしょうか?
ここでは、変数が「;」で区切られた連結列を持ついくつかの都市のいくつかのショップに関する情報があります。およびスペース付きの var-val。次のような出力が必要です。
一意の行が実行できるすべての行 (リンクされた SO の質問を参照)
しかし、2 行目の shoptype を "A" に変更すると、これが原因でエラーが発生します。お気に入り:
一意のIDでこれを解決しようとしました(リンクされたSOの回答を再度参照してください):
上記の目的の出力で説明したように、収集する方法がわからない構造的な欠落データが得られます。
私は本当にtidyrの範囲内にあるものを見逃していると思います(願っています!)。
r - ロングフォーマットからワイドフォーマットに変換しようとしていますが、変数のすべての組み合わせで終わります
私はこの構造から行きたいです:
これに:
サンプルデータは次のとおりです。
tidyr
このチュートリアル
を使用してみました: http://www.cookbook-r.com/Manipulating_data/Converting_data_between_wide_and_long_format/
ただし、試してみると:
すべてのチームの列が繰り返されますが、すべての組み合わせが必要なわけではありません。
r - 列を分離してデータを溶かす
df
dplyrの結果のデータフレームがありますsummarise_each
次の形式にするにはどうすればよいですか?
df
r - dplyr: サブグループ基準でグループをフィルタリングする方法
私の質問はこれと似ていますが、フィルター条件が異なります。
元のテーブルから「incm」を使用して、母親の収入が 20000 を超える家族を簡単に選択できます。
問題は、「整理された」データからどのように行うかです。
r - tidyr::spread と dplyr::summarise での暗黙の並べ替え
私のデータは順序付けされた観測であり、操作を行っている間、順序付けを可能な限り維持したいと考えています。
この質問の答えを見て、データフレームで「A」の前に「B」を置きます。結果として得られるワイド データは、列「name」でソートされます。つまり、最初に「A」、次に「B」となります。
元の順序を維持する方法はありますか? このような:
04/02 編集:dplyr::summarise
並べ替えも行われていることがわかりました。arrange(name, df$name)
注文を復元するために引き続き機能します。でも、パッケージのデザインから余計な選別が必要なのかな?
r - tidyr::gather と reshape2::melt on マトリックス
reshape2::melt
私はかなり非標準的な方法で を長年使用してきました。数値実験を実行して、結果として行列を取得しています。次に、それを溶かしていくつかの画像を作成します。
との類似性に触発されて、クラス マトリックスのオブジェクトで同一の出力を達成しようとしています。これまでのところ運が悪い:reshape2
tidyr
それらが存在する場合melt
はスマートで保持されることに注意してください。dimnames
私はそれがどのように機能するかを学んだので、次の関数をメソッドディスパッチに追加できる可能性があります。
しかし問題は、私の場合gather
と同じように行動を強制できるかどうかです。melt
と で目的の出力を生成するパラメータの組み合わせはありますmat
かmat2
?