問題タブ [dplyr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - dplyr - 集計が正しくありませんか?
dplyr と group_by 関数が期待どおりに機能しないという問題があります。集計を使用して、group_by ステートメントに入力された id と year の一意の組み合わせごとに var1 の平均を取得することを期待しています。
このコードは、id と year の組み合わせごとに var 1 の平均を集計したい、id-year 観測を含む df を作成する必要があります。ただし、これは期待どおりに機能せず、出力は id を無視し、年のみを集計します。
dplyr コード:
結果:
何が起こっているのですか?
他のパッケージが dplyr 関数を中断していないことを確認するために、以下を試して同じ結果を得ました。
r - R で %.% 演算子を使用する方法 (編集: 2014 年に廃止された演算子)
編集: %.% 演算子は非推奨になりました。magrittr の %>% を使用します。
元の質問 この%.%
オペレーターは何をしますか?? dplyr パッケージでよく使用されているのを見てきましたが、それが何であるか、またはどのように機能するかについてのサポート ドキュメントが見つからないようです。
コマンドを連鎖しているように見えますが、それは私が知る限りです...私がそうしている間、誰でも、%
記号でぶらぶらしている特別なオペレーターの策略が何をするのか、そして技術的にいつが適切な時期なのかを説明できますか?それらを使用してより良いコーディングを行いますか?
r - グループ化をやめて要約する
dplyrは素晴らしいと思います。しかし、最近パッケージを更新したところ、集計がグループごとに集計されなくなったようです。アップグレード前にグループ別に要約するために使用された次のコードに似たもの:
これは、Species と avg_petal_width を含むテーブルを出力するために使用されていました。Species 列が削除され、avg_petal_width が 1 つの値に集計されるようになりました。group_by は機能しているようなので、これは要約の問題だと思います。
ビネットの例でさえ正しく機能しません。
アドバイスをいただければ幸いです。
r - dplyr「約束ではありません」エラー
lag() 関数を使用してラグ変数を作成したパネル データセットがあります。以下の mutate コマンドを使用して各タイムポイントのデルタを計算しようとすると、「エラー: 約束ではありません」というエラー メッセージが表示されます。
r - 条件値による dplyr mutate
4 つの列を持つ大きなデータフレーム ("myfile") では、最初の 4 つの列に基づいて条件付きで値を持つ 5 番目の列を追加する必要があります。
主に大規模なデータセットでの速度のため、dplyr
との回答を優先します。mutate
私のデータフレームは次のようになります。
5 番目の列 (V5) の値は、いくつかの条件付きルールに基づいています。
mutate
ここで、関数を使用して、すべての行でこれらのルールを使用したいと考えています (低速ループを回避するため)。このようなもの (そして、はい、この方法では機能しないことはわかっています!):
これは結果になるはずです:
でこれを行う方法はdplyr
?
r - dplyr を使用して data.frame 内の完全なケースをフィルター処理します (ケースごとの削除)
dplyr を使用して完全なケースの data.frame をフィルタリングすることは可能ですか? complete.cases
もちろん、すべての変数のリストで動作します。しかし、それは a) 変数が多い場合は冗長であり、b) 変数名が不明な場合 (たとえば、任意の data.frame を処理する関数内) は不可能です。