“dcast”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

469 参照

r - データフレームのリストに dcast() 関数を適用する

以下にその一部を示すデータフレームのリストがあります。

私の87個のデータフレームであるこのリストの要素にカスタム関数 dcast() を使用したいと思います。必要な結果は、データフレームごとに、列の数に応じて次のようになります。

私はさまざまなソリューションとコードを試しましたが、機能していません:

エラーが発生します：

2 番目の解決策

エラーは次のとおりです。

3番目の解決策

エラーは次のとおりです。

4番目の解決策（絶望的なもの）

再びエラーが発生します：

奇妙なことに、各データフレームの名前または ls.df.val.keep[[3]] などのリストの要素だけを入力すると、それらは機能します! このリストに対して、lapply を使用してやりたいことは他にもたくさんありますが、最初のステップで立ち往生しています。私が見ていないものはありますか？

編集済み。

@Jakeが要求したように、データフレームデータのサンプルを追加しています:

.. .. ..

2016-11-15T14:44:41.767

0 投票する

0 に答える

103 参照

r - R ffdfdply 追加エラー

「ITEM」の値を列と値（「ITEM2」）として使用して、データ（data.frame）をロングフォーマットからワイドフォーマットにキャストしたい（以下を参照）：

ロングフォーマット

ワイドフォーマット

したがって、パッケージ reshape2 の dcast-function を使用します。

これを行うと、すべて正常に動作します。

しかし、データフレームに 7m のデータレコードがあり、メモリの制限に苦労していました。したがって、ffdf で data.frame を変換し、パッケージ ffbase の ffdfdply-function を使用してフレームをキャストすることにしました。

すべての分割に同じ順序で同じ列があることを確認するために、事前に「ITEM」から値を抽出し、存在しない場合は列に N/A を追加し、すべての列をアルファベット順に並べます。

コード全体の下:

残念ながら、2 番目の分割の結果を最初の分割に (トレースを使用して) 追加すると、次のエラーが発生します。

追加せずに少ないレコードで 1 つの分割のみを計算すると、正常に機能します。

誰か助けてくれませんか？

ありがとうございました。

r apply reshape2 ffbase dcast

2016-12-08T10:46:57.097

0 投票する

1 に答える

460 参照

r - 関数への dcast と要約 - 引数が失われました

正常に動作する次のコードを関数に変換しようとしています。

たとえば、次のデータセットを使用するとします。

コードは、次のように、ターゲット変数に従ってデータセットを集計します。

これは私が関数を構築する方法です：

しかし、私は - Error: unknown variable to group by : column. 私はそれが基本的な質問であることを知っていますが、group_by で引数を失っている理由の手がかりはありますか?

次の実装 "group_by_" と "require("dplyr")" を使用してみましたが、それらは無関係のようです。

r function dplyr dcast

2016-12-26T10:30:21.113

0 投票する

0 に答える

341 参照

r - R ddply dcast の代替？

「ITEM」の値を列と値 (「ITEM2」) としてロングフォーマットからワイドフォーマットにデータ (data.frame) をキャストしたい (以下を参照):

長い形式:

ワイドフォーマット:

したがって、パッケージ reshape2 の dcast-function を使用します。

これを行うと、すべて正常に動作します。しかし、データフレームに 7m のデータレコードがあり、メモリの制限に苦労していました。したがって、パッケージ plyr の ddply を使用することにしました。

すべての分割に同じ順序で同じ列があることを確認するために、事前に「ITEM」から値を抽出し、存在しない場合は列に N/A を追加し、すべての列をアルファベット順に並べます。

コード全体の下:

を実行するddplyと、使用中の RAM が最大値 (12 GB) に達するまで実行時に増加します。したがって、パフォーマンスは非常に遅く、数時間後に R を終了しました。

データセット全体をキャストする別の方法はありますか?

前もって感謝します。

r apply plyr ram dcast

2017-01-05T16:11:47.197

0 投票する

1 に答える

1100 参照

r - R dcast: dcast 値の計算を実行するにはどうすればよいですか?

私はこれを実行する大きなデータフレームを持っています:

これが結果です。

また、これ：

これを作ります：

事実上、私はこれをしたい：

これらの値を取得します。

引数として操作しようとしましfun.aggregateたが、それが正しいパスかどうかわからないか、何をしているのかわかりません。誰かがこれで私を助けてくれますか? (補足: このサンプルには 2 つのカテゴリがあります。実際のデータは 40 を超えています。)

r reshape2 dcast

2017-01-17T16:17:36.073

問題タブ [dcast]

r - データフレームのリストに dcast() 関数を適用する

2 番目の解決策

3番目の解決策

4番目の解決策（絶望的なもの）

編集済み。

r - R ffdfdply 追加エラー

r - 関数への dcast と要約 - 引数が失われました

r - R ddply dcast の代替？

r - R dcast: dcast 値の計算を実行するにはどうすればよいですか?

Reference