問題タブ [dcast]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
469 参照

r - データフレームのリストに dcast() 関数を適用する

以下にその一部を示すデータフレームのリストがあります。

私の87個のデータフレームであるこのリストの要素にカスタム関数 dcast() を使用したいと思います。必要な結果は、データ フレームごとに、列の数に応じて次のようになります。

私はさまざまなソリューションとコードを試しましたが、機能していません:

エラーが発生します:

2 番目の解決策

エラーは次のとおりです。

3番目の解決策

エラーは次のとおりです。

4番目の解決策(絶望的なもの)

再びエラーが発生します:

奇妙なことに、各データフレームの名前または ls.df.val.keep[[3]] などのリストの要素だけを入力すると、それらは機能します! このリストに対して、lapply を使用してやりたいことは他にもたくさんありますが、最初のステップで立ち往生しています。私が見ていないものはありますか?

編集済み。

@Jakeが要求したように、データフレームデータのサンプルを追加しています:

.. .. ..

0 投票する
0 に答える
103 参照

r - R ffdfdply 追加エラー

「ITEM」の値を列と値(「ITEM2」)として使用して、データ(data.frame)をロングフォーマットからワイドフォーマットにキャストしたい(以下を参照):

ロングフォーマット

ワイドフォーマット

したがって、パッケージ reshape2 の dcast-function を使用します。

これを行うと、すべて正常に動作します。

しかし、データ フレームに 7m のデータ レコードがあり、メモリの制限に苦労していました。したがって、ffdf で data.frame を変換し、パッケージ ffbase の ffdfdply-function を使用してフレームをキャストすることにしました。

すべての分割に同じ順序で同じ列があることを確認するために、事前に「ITEM」から値を抽出し、存在しない場合は列に N/A を追加し、すべての列をアルファベット順に並べます。

コード全体の下:

残念ながら、2 番目の分割の結果を最初の分割に (トレースを使用して) 追加すると、次のエラーが発生します。

追加せずに少ないレコードで 1 つの分割のみを計算すると、正常に機能します。

誰か助けてくれませんか?

ありがとうございました。

0 投票する
1 に答える
460 参照

r - 関数への dcast と要約 - 引数が失われました

正常に動作する次のコードを関数に変換しようとしています。

たとえば、次のデータセットを使用するとします。

コードは、次のように、ターゲット変数に従ってデータセットを集計します。

これは私が関数を構築する方法です:

しかし、私は - Error: unknown variable to group by : column. 私はそれが基本的な質問であることを知っていますが、group_by で引数を失っている理由の手がかりはありますか?

次の実装 "group_by_" と "require("dplyr")" を使用してみましたが、それらは無関係のようです。

0 投票する
0 に答える
341 参照

r - R ddply dcast の代替?

「ITEM」の値を列と値 (「ITEM2」) としてロングフォーマットからワイドフォーマットにデータ (data.frame) をキャストしたい (以下を参照):

長い形式:

ワイドフォーマット:

したがって、パッケージ reshape2 の dcast-function を使用します。

これを行うと、すべて正常に動作します。しかし、データ フレームに 7m のデータ レコードがあり、メモリの制限に苦労していました。したがって、パッケージ plyr の ddply を使用することにしました。

すべての分割に同じ順序で同じ列があることを確認するために、事前に「ITEM」から値を抽出し、存在しない場合は列に N/A を追加し、すべての列をアルファベット順に並べます。

コード全体の下:

を実行するddplyと、使用中の RAM が最大値 (12 GB) に達するまで実行時に増加します。したがって、パフォーマンスは非常に遅く、数時間後に R を終了しました。

データセット全体をキャストする別の方法はありますか?

前もって感謝します。

0 投票する
1 に答える
1100 参照

r - R dcast: dcast 値の計算を実行するにはどうすればよいですか?

私はこれを実行する大きなデータフレームを持っています:

これが結果です。

また、これ:

これを作ります:

事実上、私はこれをしたい:

これらの値を取得します。

引数として操作しようとしましfun.aggregateたが、それが正しいパスかどうかわからないか、何をしているのかわかりません。誰かがこれで私を助けてくれますか? (補足: このサンプルには 2 つのカテゴリがあります。実際のデータは 40 を超えています。)