問題タブ [dcast]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - データフレームのリストに dcast() 関数を適用する
以下にその一部を示すデータフレームのリストがあります。
私の87個のデータフレームであるこのリストの要素にカスタム関数 dcast() を使用したいと思います。必要な結果は、データ フレームごとに、列の数に応じて次のようになります。
私はさまざまなソリューションとコードを試しましたが、機能していません:
エラーが発生します:
2 番目の解決策
エラーは次のとおりです。
3番目の解決策
エラーは次のとおりです。
4番目の解決策(絶望的なもの)
再びエラーが発生します:
奇妙なことに、各データフレームの名前または ls.df.val.keep[[3]] などのリストの要素だけを入力すると、それらは機能します! このリストに対して、lapply を使用してやりたいことは他にもたくさんありますが、最初のステップで立ち往生しています。私が見ていないものはありますか?
編集済み。
@Jakeが要求したように、データフレームデータのサンプルを追加しています:
.. .. ..
r - R ffdfdply 追加エラー
「ITEM」の値を列と値(「ITEM2」)として使用して、データ(data.frame)をロングフォーマットからワイドフォーマットにキャストしたい(以下を参照):
したがって、パッケージ reshape2 の dcast-function を使用します。
これを行うと、すべて正常に動作します。
しかし、データ フレームに 7m のデータ レコードがあり、メモリの制限に苦労していました。したがって、ffdf で data.frame を変換し、パッケージ ffbase の ffdfdply-function を使用してフレームをキャストすることにしました。
すべての分割に同じ順序で同じ列があることを確認するために、事前に「ITEM」から値を抽出し、存在しない場合は列に N/A を追加し、すべての列をアルファベット順に並べます。
コード全体の下:
残念ながら、2 番目の分割の結果を最初の分割に (トレースを使用して) 追加すると、次のエラーが発生します。
追加せずに少ないレコードで 1 つの分割のみを計算すると、正常に機能します。
誰か助けてくれませんか?
ありがとうございました。
r - 関数への dcast と要約 - 引数が失われました
正常に動作する次のコードを関数に変換しようとしています。
たとえば、次のデータセットを使用するとします。
コードは、次のように、ターゲット変数に従ってデータセットを集計します。
これは私が関数を構築する方法です:
しかし、私は - Error: unknown variable to group by : column. 私はそれが基本的な質問であることを知っていますが、group_by で引数を失っている理由の手がかりはありますか?
次の実装 "group_by_" と "require("dplyr")" を使用してみましたが、それらは無関係のようです。
r - R ddply dcast の代替?
「ITEM」の値を列と値 (「ITEM2」) としてロングフォーマットからワイドフォーマットにデータ (data.frame) をキャストしたい (以下を参照):
長い形式:
ワイドフォーマット:
したがって、パッケージ reshape2 の dcast-function を使用します。
これを行うと、すべて正常に動作します。しかし、データ フレームに 7m のデータ レコードがあり、メモリの制限に苦労していました。したがって、パッケージ plyr の ddply を使用することにしました。
すべての分割に同じ順序で同じ列があることを確認するために、事前に「ITEM」から値を抽出し、存在しない場合は列に N/A を追加し、すべての列をアルファベット順に並べます。
コード全体の下:
を実行するddply
と、使用中の RAM が最大値 (12 GB) に達するまで実行時に増加します。したがって、パフォーマンスは非常に遅く、数時間後に R を終了しました。
データセット全体をキャストする別の方法はありますか?
前もって感謝します。
r - R dcast: dcast 値の計算を実行するにはどうすればよいですか?
私はこれを実行する大きなデータフレームを持っています:
これが結果です。
また、これ:
これを作ります:
事実上、私はこれをしたい:
これらの値を取得します。
引数として操作しようとしましfun.aggregate
たが、それが正しいパスかどうかわからないか、何をしているのかわかりません。誰かがこれで私を助けてくれますか? (補足: このサンプルには 2 つのカテゴリがあります。実際のデータは 40 を超えています。)