問題タブ [panel-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R: plm と pglm を使用したパネル モデル予測のプロット
plm で線形パネル モデルを使用して 2 つの回帰モデルを作成し、pglm パッケージでポアソンを使用して一般化されたパネル モデルを作成しました。
一連の散布図に近似値をプロットして、2 つの近似をグラフィカルに比較したいと思います。できればggplot2を使用してこれらの行に沿って:
単純に ggplot2 を使用することを検討しましstat_smooth()
たが、(おそらく当然のことながら) データのパネル形式を認識していないようです。予測値を手動で抽出してpredict
も、pglm-model では機能しないようです。
このプロットで 2 つのパネル モデルの予測値を重ねるにはどうすればよいですか?
r - 個人の観察数が異なるパネルデータの相関
次のパネル データには、他の人より多くの観察結果を持つ個人がいます。
個人間の観測値の相関を計算したいと思います。R は欠落している観測を無視する必要があります。
Mike と John の相関: 時間 1 ~ 4 のみを考慮する必要があります
John と Andrea の相関関係: 時間 1 から 5 のみなど
これらの結果を達成するための最良の方法は何ですか?
r - R で経時データを再構築するときに、新しいグループ化変数をどのように作成しますか?
reshape2
R のパッケージに関するドキュメントや、ワイド フォーマットからロング フォーマットへ、またはその逆にデータを再構築するための他のパッケージを読んでいます。ただし、時間の新しい変数を作成し、ホルモン測定値を時間ごとにグループ化する必要があるため、この問題に行き詰まっています。R
以前は SPSS でこれを行っていましたが、他の多くの理由と同様に明らかな理由で SPSS に切り替えています。でこれを行う簡単な方法があるに違いないことは知っていますが、これR
を理解するのに苦労しています。
このプロジェクトのデータは、各患者について 5 つの異なる時点で 20 の異なるホルモンが測定された縦断的臨床研究からのものです (作成されたデータの例を以下に示します - a1 は来院 1 時のホルモン「a」、a2 はホルモン「a」です)。 ' 訪問 2 など)。研究には合計 20 人の患者がおり、それぞれがスプレッドシートに一意の識別子 (id) を持っています。ホルモン データ (ホルモン 'a'、ホルモン 'b' など) は、私のスプレッドシートでは次のように広い形式で配置されています。
以前に SPSS でこれを行ったとき、ソフトウェアは id 変数と縦方向の測定値を折りたたむための変数名を求めてきました。「訪問」と呼ばれる 1 から 5 までの新しい変数を作成します。これは、各ホルモンに関する 5 つの測定値に対応します。SPSS でこれを行うと、次のような長い形式で新しい出力が作成されます。
reshape を使用してみましたが、関数は機能しているように見えますが、実際のデータを見ると、ワイド フォーマットとロング フォーマットの間で数値が混同されています。私は非常に基本的な間違ったことをしているに違いありませんが、それを理解するのに苦労しています。
r - R xts: 多次元パネル データの xts オブジェクトの作成に失敗しました
多次元パネル データの xts オブジェクトを作成できません。データは次のようになります。
この投稿hereを参考にすると、私の R コードは次のようになります。
A の概要は次のようになります。私にはこれで問題ないようです。
しかし、どういうわけか、周期性が台無しになっています。
これは axTicksByTime 関数にも表示されます。
ファクター列なしでデータを入力すると、すべてが正常に機能し、周期性が四半期ごとに正しく表示されます。
Rがまだデータ形式を認識している状態で、多次元データを正しく入力するにはどうすればよいですか?
r - 特定の行数を持つ一意のID変数によるサブセットデータフレーム
この質問に対する明確な答えが見つからないので、誰かが私を正しい方向に導いてくれることを願っています!
ネストされたデータ フレーム (パネル データ) があり、複数の個人内に複数の観測値があります。少なくとも 20 行のデータを持つ個人 (id) でデータ フレームをサブセット化したいと考えています。
私は次のことを試しました:
ただし、データが 20 行未満の個人もまだ見つかります。
誰でも解決策を提供できますか?
前もって感謝します
r - Rのアンバランスパネルデータで最後のイベントからの時間を作成するには?
イベントが発生したかどうかを示すバイナリ変数を持つ不均衡なパネル データがあります。時間依存性を制御したいので、最後のイベントからの経過年数を示す変数を作成したいと考えています。データは 2 年ごとに編成されています。
これは、私が達成しようとしていることのベクトルを含む再現可能な例です。ありがとう!
˚
r - R の時系列断面データのループ
特に、すべての国と年の 1 つの列の最大値を定義する方法を見つけようとして、時系列の横断的データセットでしばらく苦労しています。for ループと if/else ループのさまざまなバージョンを試しましたが、うまくいきませんでした。手がかりがあれば教えていただけないでしょうか。
これは、私のデータ構造の再現可能な小さな例です。
最後に、特定の年と国で最も割合が高いトピックを示す新しい変数を作成したいと思います。
できれば、perc-value が最も高いトピックの正確なパーセンテージを指定する別の変数も生成することをお勧めします。
どんな助けでも大歓迎です。私が見つけたループに関するすべてのチュートリアルは、時系列の横断的な問題に取り組んでいません...ありがとう!