問題タブ [panel-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - データの訪問が 2 回未満の患者を削除する方法
訪問ごとに 1 行として構造化された縦方向のデータセットがあります。
数値の患者 ID 番号は、一意の患者を示します。
データセットから観測値が 2 未満のすべての患者を削除するにはどうすればよいですか?
したがって、この例では、患者105と110の行を削除します。
例
r - 一意の値によるパネル データのサブセット化
特定の基準に従ってパネル データをセグメント化し、各セグメントで要約統計を実行したいと考えています。データ:
上記の例から、店舗を参入者、退出者、現職者に分けたいと思います。たとえば、期間中に市場から撤退した店舗の数を調べたいとします。これは次のようになります。
市場に参入しました:
そして、その期間を通じて現職のままでした:
私はそのようなタスクを実行するのに十分なRの経験がないため、入力をいただければ幸いです。
r - plm法による予測
plm パッケージを使用して、パネル データのランダム効果モデルを推定しています。plm パッケージの予測に関するこの質問を読むと、疑問が生じます。それはどのように正確に機能しますか?私は3つの代替方法を試しましたが、それらは異なる解決策を提供します. なんで ?
stata - Stata xtcsd テスト結果をエクスポートするには?
12 のパネル データ セットの断面依存性テストの結果をテーブルにエクスポートして、異なるソフトウェアで行われた同様のテストと比較したいと考えています。以下は、ヘルプ ページの回帰およびテスト命令xtcsd
の例です (残念ながら、サンプル データセットは利用できませんが、同様のサンプル データセット tbl15-1.dtaはxttest2
ページから利用できます)。以下の指示は、私が達成しようとしていることを理解するのに役立ちます:
テスト統計を表示するには、次を使用できます
その統計の p 値を取得するにはどうすればよいですか?
コマンドを使用して推定結果をエクスポートする方法を見つけましたesttab
。テスト結果を Stata のファイルにエクスポートするにはどうすればよいですか?
以下のp値に関する@Maarten Buisのコメントに従って、低レベルのファイルアクセスを使用してテスト結果をcsvファイルにエクスポートする方法を次に示します。
r - Rで大量のデータを含むパネルデータを作成する
現在、大量のデータをパネルデータに結合する際に問題があります。「より小さな」ソリューションに役立つこのソリューションを見つけました:パネルデータですが、これを「より大きな」フォーマットに適用することはできません。
コーディング例を作成してみます: パッケージ 'datasets' から:
各データ フレームには、43 の地区ごとに異なる値が含まれています。すべての地区に一意の ID (1 ~ 43) を割り当てました。43 の地区は、データ セット WorldPhones で指定された 7 つの地域 (大陸) に匹敵します。すべてのデータフレームには、地区ごとおよび年ごとに 1 つの変数のみが含まれます。df_1 に変数 X1 が含まれ、df_2 に X2 が含まれているとします。このデータを「長い」形式にしたいのですが、次のように考えてください。
残念ながら、43回「それを書き留める」という「ブルートフォース」を除いて、これを行う方法は本当にわかりません。
r - R のパネル データ セットを使用して、毎日の株価収益率を年間収益率に変換する
R に日次の株価収益率を示すパネル データ セットがあります。データは次のようになります。
このデータを各企業の毎年の年間株式リターンに変換するにはどうすればよいですか? xts
データをオブジェクトに変換してReturn.annualized
関数を使用しようとしましたが、うまくいきませんでした。
r - パネルデータからのRデータ抽出
値を抽出したいテーブルに長い時系列があります。
パネルには毎日の観測がありますが、NA もあります。各断面から最後の非 NA 値を新しい時系列に抽出したいと思います。同じ断面に移動し、その断面内のすべての観測値を抽出された値で埋める必要があります。つまり、新しい時系列は、t ごとのデータを含む積み上げ断面で構成されます。
以下の構造の例を作成しました。ここで、x はデータを抽出したいシリーズで、NEW は作成したい新しいシリーズです。
断面と時間 ID が同じ行に指定されている pdata.frame も作成しました。
私はRが初めてなので、アドバイスをいただければ幸いです。
*テーブルの構造を編集:
r - R: 複数の期間を組み合わせる方法
パネル データがあり、データ フレームには 3 人の個体があり、それぞれに 4 期間の観測があります。
このように見えるはずです
ここで、2 つの連続する期間の平均を取得し (つまり、t=1 と t=2 を 1 つの期間として組み合わせ、その値を 2 つの期間の平均とする)、時系列を 2 つの期間に短縮したいと考えています。結果はこのようになるはずです
どうすればこれを管理できますか?
誰かがすでにstackoverflowで同じ質問をしているのを見ましたが、それはmysqlにあります(ここでは 複数のタイムスパンを組み合わせる方法)、Rに解決策があるかどうか疑問に思います(mysqlコードを読むことができません..)
よろしくお願いします。
編集: @dimitris_ps は既に問題に対する回答を提供しており、より一般的な解決策があるかどうか疑問に思っています。データ フレームが以下のようで、変数が 50 個ある場合はどうなるでしょうか。