問題タブ [reshape]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - openAir、96x31の時間/日付データをスタックデータに
1日の15分間ごと、およびその月の各日の可変フローを示す表があります。例:
これを形にしたい
等々。試しreshape
ましたが、「変動」を指定して失敗メッセージが表示され続ける方法がわかりません。
stata - 「チェーン」形式でのデータの再形成(stata .DTAファイル)
治療「ロック」を受ける被験者と、各「ロック」から採用される被験者または「リンク」がある「チェーン」形式のデータがあります。したがって、私のデータは広く長い形になっています-実行中のモデル用に形を変えるためにStata .DTAプログラムを作成するにはどうすればよいですか?私のデータはこのように始まります
idlock idlink1idlink2..。
1 1011..。
2 2021..。
21 3031..。
リンクは後でロックになる可能性がありますが、それでも元のロックのチェーンの一部です。したがって、21は1で始まるチェーン内のリンクです。新しいロックごとに最大5つのリンクがあります(idlink1-idlink5)
r - Rでデータをパネル形式に再形成
私にはかなり長くて(私にとって)複雑な質問があります。私は欧州連合理事会からの投票データを持っています。ここでは、各国の投票行動が名義尺度に従ってコード化されています。
データは次の形式です(データセットからの20の観測値のダンプについては、投稿の最後を参照してください)。
まず、データを月ごとに集計したいと思います。ここで、月ごとに、国ごとに0、1、2などがいくつあったかを合計します。理想的には、データは次のようになります。
これが完了したら、データを次のようなパネル形式にしたいと思います。
これが非常に時間のかかる質問である場合は申し訳ありませんが、目的の結果を得ることができずに、さまざまな適用関数によって、さまざまな適用関数を使って、ずっと遊んでいます。どんな助けでも大歓迎です!
データセットからの20の観測(dput()関数からの出力):
r - グループ化変数が要因である場合、グループごとの要約統計量を生成するにはどうすればよいですか?
mtcars
データセット(ベースRバージョン2.12.1の一部)の要約統計量を取得したいとします。以下では、車をエンジンシリンダーの数に従ってグループ化し、の残りの変数のグループごとの平均を取りますmtcars
。
しかし、私のグループ化変数がたまたま要因である場合、物事はよりトリッキーになります。ddply()
ファクターを取得できないため、ファクターのレベルごとに警告をスローしますmean()
。
ですから、要約統計量を間違った方法で生成しようとしているのではないかと思います。
通常、因子別またはグループ別の要約統計量(平均、標準偏差など)のデータ構造をどのように生成しますか?他のものを使用する必要がありddply()
ますか?を使用できる場合ddply()
、グループ化係数の平均をとろうとしたときに発生するエラーを回避するにはどうすればよいですか?
r - R reshape2 での cast() 呼び出しのカスタム集計関数のエラー
R を使用して、一意でない行名を持つテーブルの数値データを、カスタム関数を使用して要約された値を持つ一意の行名を持つ結果テーブルに要約したいと考えています。要約ロジックは次のとおりです。最小値に対する最大値の比率が 1.5 未満の場合は値の平均を使用し、それ以外の場合は中央値を使用します。テーブルが非常に大きいため、reshape2パッケージで Melt() および cast() 関数を使用しようとしています。
上記のコードの最後の行は、エラー通知になります。
私は何を間違っていますか?集計関数が単に min() または max() を返すだけの場合は、「欠落していない引数がない」という警告メッセージが表示されますが、エラーは発生しないことに注意してください。ご提案ありがとうございます。
(私が使用したい実際のテーブルは 200x10000 のものです。)
r - R:複数のパンチ質問データを積み重ねる
調査に2つの質問があるとします。1つは、個人が会社を推薦する可能性についてです(簡単にするために2つの会社があるとしましょう)。
したがって、この質問には2つの列を持つ1つのdata.frameがあります。
また、回答者に、会社に「適合する」と信じている属性の横にあるボックスにチェックマークを付けるように求める別の質問があるとします。
したがって、この質問には4列の別のdata.frameがあります。
さて、私がやりたいのは、すべての企業(会社に依存しない)について、属性1と2が質問を推奨する可能性のあるスケールにどのように関連しているかを確認することです。たとえば、推奨する可能性が非常に高い人々と属性1の間にどのような慣性があるのかを知るためだけに。
それで、私は2つの質問を結びつけることから始めます:
私の問題は、列が次のようになるようにこれらのデータをスタックする方法を理解しようとしています。
この例は大幅に簡略化されています。私の実際の問題では、34の会社と24の属性があります。
すべてのc()ステートメントを入力せずに、それらを効果的にスタックする方法を考えられますか?
注:可能性の列パターンはCo1、Co2、Co3、Co4 ...であり、属性のパターンはAt1.Co1、At2.Co1、At3.Co1 ... At1.Co34、At2.Co34...です。
r - Rで積み上げエリアプロットを取得する
この質問は、私が尋ねた前の質問の続きです。
現在、Prop を含むカテゴリ列もある場合があります。そのため、データセットは次のようになります。
この場合、R で積み上げ面プロットを作成し、これらの異なるカテゴリのパーセンテージを日ごとに作成する必要があります。したがって、結果は次のようになります。
だから今、私は各時間の各カテゴリのシェアを取得し、これを次のような積み上げ面プロットにプロットします。x 軸は時間で、y 軸は各カテゴリの Prop2 のパーセンテージを異なる色で示しています
r - Rで列を行に変換する方法は?
私はちょっと同じ問題を抱えています。私はこの種の順序でデータを持っています: ;=列
そして、私はそれを次のようにするのが好きです:
D1に関して並べ替えて、形を変えたいですか?誰にもアイデアがありますか?D1 の 7603 値に対してこれを行う必要があります。
r - 複数の変数と時不変を使用して、データフレームをワイドからパネルに再形成します
これは、Stataが1つのステップで処理するデータ分析の基本的な問題です。
2000年と2005年の時不変データ(x0)と時不変データ(x1、x2)を使用してワイドデータフレームを作成します。
st
パネルのように形を整えて、データが次のようになるようにします。
私はreshape
stでこれを行うことができます
私の主な懸念は、数十の変数がある場合、上記のコマンドが非常に長くなることです。1stata
つは単に入力します:
Rにそのような単純な解決策はありますか?
r - Rで最速のトールワイドピボット
私はフォームの単純なテーブルを扱っています
ペア (日付、変数) は一意です。このテーブルをワイドフォームに変換したいと思います。
そして、1e6 レコードのテーブルに対して繰り返し操作を繰り返さなければならないので、可能な限り最速の方法でそれを実行したいと考えています。R ネイティブ モードではtapply()
、reshape()
との両方d*ply()
が によって速度的に支配されていると思いますdata.table
。後者のパフォーマンスを sqlite ベースのソリューション (または他の DB) に対してテストしたいと思います。これは以前に行われたことがありますか?パフォーマンスの向上はありますか? また、「ワイド」フィールド (日付) の数が可変であり、事前にわかっていない場合、sqlite でトールをワイドに変換するにはどうすればよいでしょうか?