問題タブ [reshape2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R サブジェクト内のデータフレームを並べ替える
被験者間で繰り返し評価を行う大規模なデータセットがあります。どうやって行くのですか:
に:
ありがとう、
ジョン
r - R reshape2 での cast() 呼び出しのカスタム集計関数のエラー
R を使用して、一意でない行名を持つテーブルの数値データを、カスタム関数を使用して要約された値を持つ一意の行名を持つ結果テーブルに要約したいと考えています。要約ロジックは次のとおりです。最小値に対する最大値の比率が 1.5 未満の場合は値の平均を使用し、それ以外の場合は中央値を使用します。テーブルが非常に大きいため、reshape2パッケージで Melt() および cast() 関数を使用しようとしています。
上記のコードの最後の行は、エラー通知になります。
私は何を間違っていますか?集計関数が単に min() または max() を返すだけの場合は、「欠落していない引数がない」という警告メッセージが表示されますが、エラーは発生しないことに注意してください。ご提案ありがとうございます。
(私が使用したい実際のテーブルは 200x10000 のものです。)
r - 「変数」列を「文字」クラスに返すreshape2パッケージのmelt.data.frame関数を変更するにはどうすればよいですか?
Melt.data.frame のデフォルトの動作は、"factor" クラスの "variable" 列を返すことです。次に例を示します。
問題は、クラスをファクターからキャラクターに変更するパラメーターがあるかどうかです。試しoptions(stringsAsFactors = FALSE)
ましたが、うまくいきません。
r - 平均/分散の要約表を作成するための迅速でエレガントな方法
私はこのタスクを達成することができますが、それを行うための「最良の」(最も滑らかで、最もコンパクトで、最も明確なコード、最速?)方法がなければならないと感じており、これまでのところ理解していません...
指定されたカテゴリ要素のセットについて、グループごとの平均と分散のテーブルを作成したいと思います。
データを生成する:
必要な出力:
aggregate
/を使用merge
:
ddply
/を使用するsummarise
(おそらく最高ですが、それを機能させることができませんでした):
結果は
melt
/を使用しcast
ます(多分最高ですか?)
で動作しません(?)reshape2
。誰かに説明...~.
するのは難しいかもしれません!
r - データフレームをピボット/アンピボット (キャスト/メルト) する方法は?
テーブルを「アンピボット」するにはどうすればよいですか? これを表す適切な専門用語は何ですか?
更新: この用語はメルトと呼ばれます
国と各年のデータのデータフレームがあります
そして、私は次のようなものが欲しい
r - 周波数を計算し、長いものから広いものにキャストするためのより高速な方法
「week」と「id」の2つの変数のレベルの各組み合わせのカウントを取得しようとしています。結果に「id」を行、「week」を列、カウントを値にしたいと思います。
私がこれまでに試したことの例(ダミー変数= 1を追加し、それfun.aggregate = sum
を超えるなど、他の多くのことを試しました):
しかし、この関数が終了していないので、私は何か間違ったことをしているに違いありません。これを行うためのより良い方法はありますか?
入力:
出力:
r - 大きなデータ フレームでのインジケーターの生成
目的は、データ フレーム内の因子/文字列変数のインジケーターを作成することです。そのデータフレームの行数は 2mm を超えており、Windows で R を実行すると、.parallel=T で plyr を使用するオプションがありません。そこで、plyr と reshape2 を使用して「分割統治」ルートを採用しています。
メルトとキャストを実行するとメモリが不足し、
また
時間がかかります。最速のアプローチは、以下の tapply を呼び出すことです。これをスピードアップする方法はありますか?%in% ステートメントは、model.matrix 呼び出しよりも高速に実行されます。ありがとう。
r - 2 つのテーブルの組み合わせから最大値を見つける (for ループが遅すぎる)
データテーブル「the.data」があります。最初の列は測定器を示し、残りは異なる測定データを示します。
また、インストゥルメントのグループも定義しました。たとえば、グループ 1 (g1) はインストゥルメント 1 と 2 を指します。
各グループの合計がデータ型ごとに最大になる時間とその合計を調べる必要があります。
g1 時間 1: 合計 (da)=12+14=26 g1 時間 2: 合計 (da)=19+15=34
したがって、g1 と da の場合、答えは時間 2 と値 34 です。
forループ内のforループでこれを行いましたが、時間がかかりすぎます(数時間後に中断しました)。問題は、the.data の長さが約 100.000 行であり、それぞれ 2 ~ 50 のインストゥルメントを持つ約 5.000 のグループがあることです。
これを行うための良い方法は何ですか?
Stack-overflow へのすべての貢献者に心から感謝します。
更新: 例では 5 つのグループのみになりました。
/クリス
r - 溶けたデータフレームを固める?
data.frame
私がこのように見える溶けたものを持っていると仮定します:
どうすれば入手できますか:
些細なことのようですが、私は答えを空白にしています。dcast
そしてそれをacast
しないようです。私の目標は、より大きなデータセットでこれを行い、最終製品をmatrix
変数名となる列名を持つに変換することです。運が悪かったので(溶ける前に)daply
遊んでみました。laply
r - 溶ける/キャストすることが1つのステップで解決できない再形成の問題は何ですか?
reshape2
は、2つの部分からなるメルト/キャストアプローチを通じて、強力なデータ変換の配列を可能にするパッケージです。ただし、すべてのツールと同様に、処理できるケースを制限する仮定が組み込まれています。
reshape2
現在の形式では処理できないデータ再形成の問題は何ですか?
理想的な答えは次のとおりです。
- このデータ形状が一般的に見られるユースケースのタイプの説明
- サンプルデータ
- 変換を実行するためのコード(理想的には、可能な限り多くの変換を使用
reshape2
します)
例
「ワイド」データは、パネルアプリケーションで一般的です。
新しい関数は、溶けたオブジェクトを返します*cast
。
データの場所: