“stata”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

3162 参照

group-by - Stata の要約統計量の表に差異の列を追加します

を使用して Stata で双方向要約統計表を作成する場合、他の 2 つの列の差tableである別の列を追加できますか?

3 つの変数 ( a, b, c) があるとします。で五分位を生成しa、次に各五分位-五分位交点bの平均の双方向テーブルを生成します。の各五分位のの上と下の五分位のc平均の差である 6 番目の列を生成したいと思います。cba

c五分位点と五分位点の交点ごとに平均の表を生成できますが、差の列がわかりません。

更新：これは私がやりたいことの例です。ここに画像の説明を入力

2011-09-20T22:53:00.727

0 投票する

3 に答える

7300 参照

python - .dtaファイルをPythonで保存する

.dta統計データ分析ソフトウェアStataの形式でnumpy配列/recarrayを保存できるPythonパッケージを知っている人はいないでしょうか。これは、私が持っているシステムのいくつかのステップを本当にスピードアップするでしょう。

python numpy stata

2011-09-21T16:42:56.960

0 投票する

1 に答える

3023 参照

ruby - Heroku Rails アプリのデータマイニング/統計分析オプションは?

Heroku でホストされている Rails アプリがあり、ライブデータ分析を組み込みたいと考えています。理想的には、R (http://cran.r-project.org/web/packages/gbm/index.html) の両方で利用できる一般化されたブースト回帰モデルを実行する方法を見つけたいと思っています。およびStata（http://www.stata-journal.com/article.html?article=st0087）。結果の gbm ツリーを保存し、アプリ内でそれを使用して、ユーザー入力に基づいて新しい結果を予測したいと考えています。

それが不可能な場合は、他のデータマイニングアルゴリズムを使用することにオープンです。私にとって最も重要なのは、ローカルマシンなしで実行できるように、Heroku アプリに統合できることです。

私が調べたオプション：

1) Heroku サポートは、R ライブラリを ruby gem として販売することを提案しました。私はルビーとレールに比較的慣れていませんが、これは私が実行できることですか。gem でライブラリを販売する方法について調べてみましたが、あまり見つけられませんでした。

2) ここの別のスレッド (http://stackoverflow.com/questions/6495232/statistic-engine-that-work-with-heroku) で CloudNumbers について言及されていますが、Rails アプリからサービスを呼び出すことはできないようです。

3) Heroku はケーススタディの 1 つで、機械学習に Clojure、Hadoop、および EC2 を使用する FlightCaster について言及しています (http://www.infoq.com/articles/flightcaster-clojure-rails)。Heroku が Clojure をサポートしていることはわかりましたが、Clojure (具体的には Incanter) を Rails アプリに統合する方法はありますか?

何かアイデアがあれば教えてください。

ruby ruby-on-rails-3 r heroku stata

2011-09-25T16:06:21.563

0 投票する

2 に答える

5245 参照

list - Stata のリスト要素へのアクセス

Stata で以下を実行する必要があると想像してください。

など、多くの変数について。フィードされるフィルターifは変数に依存することに注意してください。

変数のリストを反復処理して、同じことをしたいと思います。何かのようなもの

`

明らかに、上記のコードは Stata では機能しません。値のリストを含むマクロを定義し、リストの各要素に明示的にアクセスする方法を理解しようとしています。

list foreach stata

2011-10-05T19:24:24.913

0 投票する

3 に答える

4929 参照

regression - Stataでのローリング回帰の高速化

rollingローリングリグレッションを回避して手動でコーディングする必要がありますか？または、エントリが重複している巨大なパネルを作成して使用する方がよいstatsbyでしょうか？つまり、各ウィンドウに独自のbyエントリを指定します。RIでは、データを日付フレームのリストに事前に分割できます。これにより、後続の操作が高速化されると思います。

1か月前に最初にRからStataに切り替えたとき、Statalistでこれを尋ねたところ、長い時間がかかるはずだというコンセンサスが得られました。MataでOLSをコーディングおよびコンパイルしましたが、速度の向上は見られませんでした（実際にはわずかに悪化しています）。

これはローリング回帰が一般的な手法であり、Stataはかなり洗練されているようです。ほとんどの研究者はこれらの回帰を1日以上実行していますか？それとも、これらの計算にSASを使用していますか？たとえば、1975年から2010年までのCompustatデータベースで次のように実行します（約30,000回の回帰）。これには約12時間かかります。

regression stata rolling-computation

2011-10-11T18:01:16.853

0 投票する

1 に答える

1860 参照

stata - 回帰表の出力に depvar 制御平均を追加する

これは 2 アームの無作為対照試験です。私の回帰出力では、治療グループの病気のリスクの相対的な減少を評価したいと思います。この評価を簡単にするために、従属変数の制御平均を回帰表の出力の末尾に追加したいと思います。で現在使用estaddしていestoutます。以下は私のコードで、従属変数の平均を表示しますが、研究の 1 つのアーム (つまり、コントロールアーム) のみの depvar 平均計算を制限できる、など estaddのオプションが見つかりません。estpost

stata

2011-10-18T16:07:08.010

0 投票する

2 に答える

4098 参照

reshape - Stata の行に変数、列に特定の変数の分位数を含む平均値の表を生成します

...差と t 統計量の列を追加します。

平均の分位表ごとに分位点を作成する方法と、ここに差の列/行を追加する方法を学びました（@lejohnに感謝します）。

ここで、各行を 1 つの変数の 1 つの分位数としてではなく、各行を異なる変数にし、各セルを、特定の変数の分位数の各列に含まれる個人の各変数の平均値にします。

を使用してセルエントリを簡単に計算できますtabstatが、行の変数と列の分位数が必要です (tabstat転置を生成します)。また、(最初の質問のように) 列を区別し、セルの違いの t 統計を計算する機能も必要です。

中間ステップは、reshapeid (ここでは acc_d)、変数名、変数値の 3 つの列を持つ長いデータにすることだと思います。しかし、私はこれを行う方法を理解できず、R パラダイムで立ち往生している可能性があります。

これが私が作りたいタイプテーブルの例です

ここに画像の説明を入力

そして、ここに私が（失敗して）いじくり回してきたいくつかのコードがあります

ありがとう！

reshape stata

2011-10-21T21:28:19.807

0 投票する

1 に答える

1483 参照

stata - Stata/MPをテストするサンプルプログラムを探しています

最近、Linux サーバー上で動作する Stata MP12 (8 コア) ライセンスを購入しました。

Stata MP のパフォーマンスをテストするためのシミュレーション研究など、Stata プログラムを書いた人はいますか? ジョブの処理中に実際に使用されているコア数とメモリ数を監視したいと考えています。

誰かが私たちとプログラムを共有できれば幸いです。

ご協力ありがとうございました

stata

2011-10-28T03:04:26.687

0 投票する

3 に答える

2675 参照

r - Rで変数を一定に保持する予測マージン/予測

私は最近 R に切り替えましたが、気に入っています。しかし、私が最も見逃していることの 1 つは、特定の変数を事前設定されたレベル (平均、90 パーセンタイルなど) で保持する予測モデル応答を生成できることです。これは、交互作用項、変換された変数などの効果を識別しようとするときに非常に便利です。

コマンドを使用して、Stata でこれを簡単に実行できますadjust。私はRでそれを行う方法を理解しようと試みましたが、Rという名前の言語（統計Rもあります）を使用して「調整」などの用語を検索することの大きな落とし穴の1つは、私ができることです調整された R 二乗でのみヒットを見つけるようです。それはイライラする以上です。

それで、本当に簡単な質問をする危険を冒して、誰もこれを行う方法を知っていますか? 私は予測マージンを調べましたが、それは少なくとも関連するタイプの方法のように思えますが、その実装には通常、何らかの方法で説明変数を標準化することが含まれます。

r stata predict

2011-12-15T04:50:40.980

0 投票する

1 に答える

2113 参照

stata - Stata の「tabulate twoway」頻度カウントテーブルの 5 行 5 列の行列

tabulate twoway次の表のように、頻度カウントテーブルの 5 行 5 列のグリッドを作成したいと考えています。

ここに画像の説明を入力

ネストされたループを使用すると、各サブテーブルを簡単に生成できforeachますが、長いリストの出力は、5 行 5 列のグリッドよりも解釈が難しくなります (また、冗長なエントリがあり、対称行列の両方の半分が提供されます)。

Stata でこのようなテーブルを作成することは可能ですか? 明確にするために、後でLaTeXを理解できます。明確で簡潔なコンソール出力を得ることに興味があるだけです。

ありがとう！autoデータを使用して基本を実行するが、マトリックスの代わりにリストを生成するコードを次に示します。パッケージxtileからですegenmore

stata

2012-01-09T00:31:51.660

問題タブ [stata]

Reference