問題タブ [dcast]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 1 つの変数を持つ data.table dcast
例
上記の dcast は次のメッセージを返します
check_formula(formula, names(data), valnames) のエラー: 無効な数式です。キャスト式は、LHS ~ RHS の形式にする必要があります (たとえば、a + b ~ c)。
.~a
式はまたはのように書かなければなりません""~a
。次に、出力は次のようになります
.
が書き出されないように式を書く方法はありますか?を使用してそれを除外できることに気付きました[,-c(1),with=F]
。
r - 大規模なデータセットでの Dcast 関数 (reshape2) の使用
(325,928 x 2) のサイズのデータフレームがあります。
以下は、そのデータの非常に小さなサブセットです。
ここでの最終的な目標は、dcast は大量のデータを処理できないため、dcast に似たものを使用してこのデータフレームを新しいデータフレームに変換することです。
したがって、このデータフレームで試した元のコードは次のとおりです。
出力:
私が提供しているデータセットで動作しますが、ディメンションの完全なデータセットでテストすると325,928 x 2
、R がクラッシュします。同じ出力を生成できるが、より大量のデータを処理できるより良い関数はありますか? これで十分な情報が得られない場合は、これを解決できると思われる人に完全なデータセットを非公開で提供できます (StackOverflow はすべてのデータを読み取ることができないため、ここでは提供できません)。ソース。
どんな助けでも素晴らしいでしょう、ありがとう!
r - 奇妙な方法で dcast を適用する
「リード」変数に従って変数を分離したい。次の場合は x3:
私はどういうわけかこれを達成できると感じていreshape2::dcast()
ますが、合計で2つの変数に対してしか機能させることができませんでした:
しかし、これは完全な悪用かもしれませんdcast
。分割とマージを行わずに、この問題に対するエレガントな解決策はありdf
ますか?
編集:これを行うのは恐ろしい考えであり、おそらくそのようなことをすべきではないという人もいます。これがいつ意味を持つのかを詳しく説明しましょう。
Imaginex3
は、特定のアルゴリズムのスイッチです。この場合a
、 andb
がオプションです。さらにx1
、 とx2
は、両方のアルゴリズムが取ることができるパラメーターです。残念ながら、両方のアルゴリズムは と の同じパラメーター設定でまったく異なる動作をするためx1
、x2
相関関係がないことを考慮して、それらを別個の機能として扱うことは理にかなっています。
r - R で dcast を実行して、特定の複数列の出力を取得する
次のようなデータフレームがあります。
L1 が ID 列、アルゴリズム、および pvalue の両方のスイング (pvalue の下に 3 つの変数と 3 つのアルゴリズム) を形成するようにキャストする必要があります。スイング pvalue によって 3 つの新しい列の下に配置される値は、列 'value' から取得され、スイング アルゴリズムによって 3 つの新しい列の下に配置される値は、列 HR_CI から取得する必要があります。
私は次のことを試しました
しかし、それは私にエラーを与えます
アドバイスをいただければ幸いです
r - r forループでdcastを使用して複数の列の平均を見つけ、それらを新しいデータフレームにコンパイルする
他のデータセットを溶かして得たデータフレーム (DF_melted) があります。DF_melted データフレームには、列「月」、「A」、「B」、「C」、「D」、「E」、「F」があります。dcast を使用した次のコードから、「A」と「月」の組み合わせごとに変数の平均値を含むデータフレームを取得できます。これはすべて正常に動作し、期待どおりです。
質問- 上記のコードの行で、 for ループを実行して、 month+A、month+B、month+C、month+D の関係のデータセットを (dcast を使用して) 自動的に取得したいと考えています。'A' (または B、C、D) をパラメトリックに置き換える方法がわかりません。
DF_melted の列番号に従って A、B、C、D を参照する次のコードを試してみましたが、機能します。
上記は機能しますが、データフレームの列番号を参照せずに上記を行うよりスマートな方法があるかどうか疑問に思っていますか?
最終的に私の意図は、データフレーム 'FinalDF' を取得して、それを使用して A、B、C、D の各カテゴリの月対変数グラフをプロットできるようにすることです。したがって、このデータの再形成を自動的に行うことは非常に役立ちます。
r - 変数のレベルを個別の変数にする
別のソフトウェアで使用できるように、データ形式を変換しようとしています。私の場合、各 respID の手がかりのリストを保持しながら、resp のレベルを個別の変数に変換する必要があります。私のデータは次のとおりです
私は使用しようとしまし(!!table(cbind(df[1],stack(df[1])[2])))
たが、どこかで順序が間違っていると思います。また、libary(caret)
成功せずに使用しようとしました。
r - R、reshape2: dcast はデフォルトで欠落している組み合わせに対して 0 を埋めます -- 通常の動作ですか?
次の長いテーブルがあります。
最初の 5 行を切り取って short.table を作成しました。
dcast(table, case ~ index)
テーブルごとに使用すると、異なる動作が得られます。長い場合、インデックス値の整数値の列が取得され、欠落している組み合わせはゼロで埋められます。ただし、短いケースでは、インデックス値の数値列を取得し、欠落している組み合わせは NA で埋められます。
質問: 非常に長いテーブルのデフォルトの動作は変わりますか?