問題タブ [tidyr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Rでこのデータフレームを再形成する最も簡単な方法は?
次のワイド/乱雑なデータフレームがあるとします。
どうすればこのデータフレームに変換できますか:
これを実現できる複数のパッケージと関数 (tidyr、reshape2、reshape 関数など) があることは知っています。それを行う最も簡単な方法と方法はどれですか? 誰かが提供できる助けに本当に感謝します。ありがとう!
r - 結果を集計する Dplyr summarise_each
私はそのようなデータフレームを持っています:
2 つのフィールドを表示していますが、他にもいくつかあります。field1 など、各フィールドでグループ化されたメトリックを合計する必要があります。
列が sum(metric1)、sum(metric2)、sum(metric3) になるフィールドごとにこれを行うことができますが、必要なテーブル出力は次のようになります。
tidyr と dplyr を使用してこれを行う方法があるに違いないと思いますが、それを理解することはできません
r - 複数の変数の反復測定をワイド形式に展開するにはどうすればよいですか?
以下に示すように、長い形式の列をワイド形式に広げようとしています。私が投資しているデータ操作ツールでこれを解決するために tidyr を使用したいのですが、この回答をより一般的にするには、他の解決策を提供してください。
ここに私が持っているものがあります:
希望するワイド形式:
各スコアに対して次のようなことを行うことでそれを行うことができます。
そして、使用し_join
ますが、それは冗長に見え、より良い方法が必要なようです。
関連する質問:
tidyr wide から long への 2 つの繰り返し
測定
r - dplyr と R の集計による中央値の計算
こんにちは: dplyr/tidyr と集計を介して生成すると、以下で作成されたようなデータ セットの中央値がわずかに異なります。誰でも違いを説明できますか?ありがとうございました!
r - 2 つの列をマージするが、特定の変数の名前を変更する
多数の欠落データがある 2 つの因子列があります。データ収集中に特定の変数の名前が変更されました。私がやろうとしているのは、2 つの列を一緒にマージすることですが、特定の古い変数の名前を新しい変数と一致するように変更します。
使った
作成するには
そして望んでいる
したがって、この例では、変数を にマージし、変数newvar
の名前を に変更しred
ますlightred
。変更する変数がいくつかありますが、1 つの変数で動作させることができれば、残りの変数をトラブルシューティングできると思います。
更新:@Veerendra Gadekarのおかげで、ここで解決策に近づきます....
以下のコードを使用しました
help$newvar= gsub('red', 'lightred', help$var1)
しかし、変数lightred
は転送されませんでしたnewvar
...出力は以下のとおりです
考え?
r - 複数の従属変数を持つ反復測定の Reshape と tidyr
2 つの従属変数 "Rapport" と "STRS" に対して 3 つの反復測定を行った 10 ケースの次のサンプル データがあります。
reshape で「melt」関数を使用し、tidyr で「gather」関数を使用しようとしましたが、どちらも「Rapport」と「STRS」という変数名が積み上げられた 1 つの列と、それらの値を含む別の列を生成します。ランダム効果モデルを使用できるように、「Rapport」値の単一の列と「STRS」値の別の列を生成する方法を理解できませんでした (注: 他の人口統計変数と共変量)。これらの 2 つの機能に関するヘルプをいただければ幸いです。
この「reshape」関数を使用して、最終的にロングフォームを取得することができました。これは非常に単純に思えますが、この方法で行うときに注意する必要があるかどうかはわかりません。
r - 複数の従属変数を持つ反復測定の Reshape と tidyr (2)
2 つの従属変数 "Rapport" と "STRS" に対して 3 つの反復測定を行った 5 つのケースの次のサンプル データがあります。
データセットをワイド フォームからロング フォームに変換するために、次のコードを実行しました。
結果は私が望んでいたものですが、列 2 の「サブ ID」の複製であるため、列 8 に追加の「id」列を追加したくありません。それを確認する必要があるかどうかも知りたいです。この機能を機能させるために、リピーター測定変数の見出しに区切り文字を入れています (例: 「Rapport.1、Rapport.2 など」)。
また、reshape pkg の「melt」機能を使用して目的の結果を生成する方法も知りたいです。および tidyr pkg の「収集」機能。以下の「メルト」を実行しようとすると、エラーが発生して実行されません。
以下の「収集」を試みると、変数名「Rapport.1…」と「STRS.1…」を含む 1 つの列と、値を含む別の列が得られます。
これらのパッケージの両方を使用することには利点があることを知っているので、「収集」機能と「溶解」機能を使用して目的の結果を生成する方法を理解したいと思います。誰でも手伝ってもらえますか?