問題タブ [stata]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
group-by - Stata の要約統計量の表に差異の列を追加します
を使用して Stata で双方向要約統計表を作成する場合、他の 2 つの列の差table
である別の列を追加できますか?
3 つの変数 ( a, b, c
) があるとします。で五分位を生成しa
、次に各五分位-五分位交点b
の平均の双方向テーブルを生成します。の各五分位の の上と下の五分位のc
平均の差である 6 番目の列を生成したいと思います。c
b
a
c
五分位点と五分位点の交点ごとに平均の表を生成できますが、差の列がわかりません。
更新:これは私がやりたいことの例です。
python - .dtaファイルをPythonで保存する
.dta
統計データ分析ソフトウェアStataの形式でnumpy配列/recarrayを保存できるPythonパッケージを知っている人はいないでしょうか。これは、私が持っているシステムのいくつかのステップを本当にスピードアップするでしょう。
ruby - Heroku Rails アプリのデータ マイニング/統計分析オプションは?
Heroku でホストされている Rails アプリがあり、ライブ データ分析を組み込みたいと考えています。理想的には、R (http://cran.r-project.org/web/packages/gbm/index.html) の両方で利用できる一般化されたブースト回帰モデルを実行する方法を見つけたいと思っています。およびStata(http://www.stata-journal.com/article.html?article=st0087)。結果の gbm ツリーを保存し、アプリ内でそれを使用して、ユーザー入力に基づいて新しい結果を予測したいと考えています。
それが不可能な場合は、他のデータ マイニング アルゴリズムを使用することにオープンです。私にとって最も重要なのは、ローカル マシンなしで実行できるように、Heroku アプリに統合できることです。
私が調べたオプション:
1) Heroku サポートは、R ライブラリを ruby gem として販売することを提案しました。私はルビーとレールに比較的慣れていませんが、これは私が実行できることですか。gem でライブラリを販売する方法について調べてみましたが、あまり見つけられませんでした。
2) ここの別のスレッド (http://stackoverflow.com/questions/6495232/statistic-engine-that-work-with-heroku) で CloudNumbers について言及されていますが、Rails アプリからサービスを呼び出すことはできないようです。
3) Heroku はケーススタディの 1 つで、機械学習に Clojure、Hadoop、および EC2 を使用する FlightCaster について言及しています (http://www.infoq.com/articles/flightcaster-clojure-rails)。Heroku が Clojure をサポートしていることはわかりましたが、Clojure (具体的には Incanter) を Rails アプリに統合する方法はありますか?
何かアイデアがあれば教えてください。
list - Stata のリスト要素へのアクセス
Stata で以下を実行する必要があると想像してください。
など、多くの変数について。フィードされるフィルターif
は変数に依存することに注意してください。
変数のリストを反復処理して、同じことをしたいと思います。何かのようなもの
`
明らかに、上記のコードは Stata では機能しません。値のリストを含むマクロを定義し、リストの各要素に明示的にアクセスする方法を理解しようとしています。
regression - Stataでのローリング回帰の高速化
rolling
ローリングリグレッションを回避して手動でコーディングする必要がありますか?または、エントリが重複している巨大なパネルを作成して使用する方がよいstatsby
でしょうか?つまり、各ウィンドウに独自のby
エントリを指定します。RIでは、データを日付フレームのリストに事前に分割できます。これにより、後続の操作が高速化されると思います。
1か月前に最初にRからStataに切り替えたとき、Statalistでこれを尋ねたところ、長い時間がかかるはずだというコンセンサスが得られました。MataでOLSをコーディングおよびコンパイルしましたが、速度の向上は見られませんでした(実際にはわずかに悪化しています)。
これはローリング回帰が一般的な手法であり、Stataはかなり洗練されているようです。ほとんどの研究者はこれらの回帰を1日以上実行していますか?それとも、これらの計算にSASを使用していますか?たとえば、1975年から2010年までのCompustatデータベースで次のように実行します(約30,000回の回帰)。これには約12時間かかります。
stata - 回帰表の出力に depvar 制御平均を追加する
これは 2 アームの無作為対照試験です。私の回帰出力では、治療グループの病気のリスクの相対的な減少を評価したいと思います。この評価を簡単にするために、従属変数の制御平均を回帰表の出力の末尾に追加したいと思います。で現在使用estadd
していestout
ます。以下は私のコードで、従属変数の平均を表示しますが、研究の 1 つのアーム (つまり、コントロール アーム) のみの depvar 平均計算を制限できる 、 など estadd
のオプションが見つかりません。estpost
reshape - Stata の行に変数、列に特定の変数の分位数を含む平均値の表を生成します
...差と t 統計量の列を追加します。
平均の分位表ごとに分位点を作成する方法と、ここに差の列/行を追加する方法を学びました(@lejohnに感謝します)。
ここで、各行を 1 つの変数の 1 つの分位数としてではなく、各行を異なる変数にし、各セルを、特定の変数の分位数の各列に含まれる個人の各変数の平均値にします。
を使用してセル エントリを簡単に計算できますtabstat
が、行の変数と列の分位数が必要です (tabstat
転置を生成します)。また、(最初の質問のように) 列を区別し、セルの違いの t 統計を計算する機能も必要です。
中間ステップは、reshape
id (ここでは acc_d)、変数名、変数値の 3 つの列を持つ長いデータにすることだと思います。しかし、私はこれを行う方法を理解できず、R パラダイムで立ち往生している可能性があります。
これが私が作りたいタイプテーブルの例です
そして、ここに私が(失敗して)いじくり回してきたいくつかのコードがあります
ありがとう!
stata - Stata/MPをテストするサンプルプログラムを探しています
最近、Linux サーバー上で動作する Stata MP12 (8 コア) ライセンスを購入しました。
Stata MP のパフォーマンスをテストするためのシミュレーション研究など、Stata プログラムを書いた人はいますか? ジョブの処理中に実際に使用されているコア数とメモリ数を監視したいと考えています。
誰かが私たちとプログラムを共有できれば幸いです。
ご協力ありがとうございました
r - Rで変数を一定に保持する予測マージン/予測
私は最近 R に切り替えましたが、気に入っています。しかし、私が最も見逃していることの 1 つは、特定の変数を事前設定されたレベル (平均、90 パーセンタイルなど) で保持する予測モデル応答を生成できることです。これは、交互作用項、変換された変数などの効果を識別しようとするときに非常に便利です。
コマンドを使用して、Stata でこれを簡単に実行できますadjust
。私はRでそれを行う方法を理解しようと試みましたが、Rという名前の言語(統計Rもあります)を使用して「調整」などの用語を検索することの大きな落とし穴の1つは、私ができることです調整された R 二乗でのみヒットを見つけるようです。それはイライラする以上です。
それで、本当に簡単な質問をする危険を冒して、誰もこれを行う方法を知っていますか? 私は予測マージンを調べましたが、それは少なくとも関連するタイプの方法のように思えますが、その実装には通常、何らかの方法で説明変数を標準化することが含まれます。
stata - Stata の「tabulate twoway」頻度カウント テーブルの 5 行 5 列の行列
tabulate twoway
次の表のように、頻度カウント テーブルの 5 行 5 列のグリッドを作成したいと考えています。
ネストされたループを使用すると、各サブテーブルを簡単に生成できforeach
ますが、長いリストの出力は、5 行 5 列のグリッドよりも解釈が難しくなります (また、冗長なエントリがあり、対称行列の両方の半分が提供されます)。
Stata でこのようなテーブルを作成することは可能ですか? 明確にするために、後でLaTeXを理解できます。明確で簡潔なコンソール出力を得ることに興味があるだけです。
ありがとう!auto
データを使用して基本を実行するが、マトリックスの代わりにリストを生成するコードを次に示します。パッケージxtile
からですegenmore