問題タブ [logistic-regression]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
matlab - matlab での L1 正則化による効率的なロジスティック回帰
matlab で効率的なロジスティック回帰の実装を探しています。matlab で lassoglm を使用しました。しかし、1000 個の機能と正則化パラメーター 0.005 から 1 を使用して 10000 個の例を試してみると、非常に遅くなります。2 分割交差検証を使用します。ラムダ 0.05 以降では、非常に遅く、多くの時間がかかります。
より良い方法はありますか?
python - 画像分類用ソフトウェア
現在、特定のテスト画像セットを 5 つの定義済みカテゴリのいずれかに分類するプロジェクトに取り組んでいます。画像ごとに 240 個の特徴の特徴ベクトルを使用してロジスティック回帰を実装し、100 個の画像/カテゴリを使用してトレーニングしました。私が達成した学習精度は各カテゴリで最大 98% でしたが、500 個の画像 (100 個の画像/カテゴリ) で構成される検証セットでテストした場合、正しく分類された画像は最大 57% のみでした。
より高い精度を達成するために使用できる(できればニューラル ネットワークに基づく)いくつかのライブラリ/ツールを提案してください。
Java ベースのツール Neurophy ( neuroph.sourceforge.net ) を Windows で使用しようとしましたが、期待どおりに動作しませんでした。
編集:特徴ベクトルはすでにプロジェクトに提供されています。また、画像のより優れた特徴抽出ツールを探しています。
r - Creating a loop that will run a Logistic regression across all Independent variables
I would like to run the dependent variable of a logistic regression (in my data set it's : dat$admit) with all available variables, each regression with its own Independent variable vs dependent variable. The outcome that I wanted to get is a list of each regression summary. Using the data set submitted below there should be 3 regressions.
Here is a sample data set (where admit is the logistic regression dependent variable) :
I got an example for simple linear regression but When i tried to change the function from lm to glm I got "list()" as a result.
Here is the original code - for the iris dataset where "Sepal.Length" is the dependent variable :
How can I create the right function for a logistic regression?
r - 2 つの部分 (ハードル) 回帰モデルでのセグメント化された回帰項のコーディング
私は 2 部またはハードル モデルを使用して、モデルの負の二項部分をモデル化するために共変量のセット (ハードル部分) と別の共変量のセットが与えられた場合の飛行確率をモデル化しています。
最初に、データ内のゼロの有無を説明するために最適な予測子を繰り返し検索しました。AIC 基準に基づいて、1 つの連続予測因子と 1 つの二分予測因子が選択されました。次に、連続予測子のセグメント化された用語の使用について調べました。連続共変量の 1 つのブレークポイントにより、適合が著しく改善されました。
セグメント化されたパッケージからの出力は次のとおりです
U1.approach_km 係数の勾配は、その係数と approach_km 係数の差であり、本質的にゼロです。そのため、ブレークポイントを超える距離では、approach_km は存在または不在を予測しなくなります。
これらの変数をハードル モデルに追加するために、これらの変数をコーディングする方法を考え出しました。これは、基本的な glm 形式だけでなく、| で区切られた 2 つのセット (異なる可能性のある) coavriates を持つことが不可欠です。シンボル。
これにより、係数推定値は同じになりますが、Std は異なります。エラー。また、自由度は同じではありませんが (セグメント化されたオブジェクトの場合は 1 つ少なくなります)、同じ残留逸脱度 (両方とも 508.36) と同じ AIC スコア 516.36 になります。
Stdを取得する方法についての考え。エラーが一致するか、ハードルパッケージにこの式を入力するときに問題にならないか
r - R の multinom 関数を使用した多項回帰
Cross-Validated に質問を投稿することを考えていましたが、ここに来ることにしました。nnet パッケージの multinom() 関数を使用して、雇用、失業、または年齢と教育を条件とする労働力からの確率を推定しています。解釈の助けが必要です。
1 つの従属カテゴリ変数雇用状況 (EmpSt) と 2 つの独立カテゴリ変数、年齢 (Age) と教育レベル (Education) の次のデータセットがあります。
レベルの概要は次のとおりです。
- まず、推定式(モデル)とは
通話の推定式 (モデル) を特定したい
df$EmpSt<-relevel(df$EmpSt,ref="Employed")
multinom(EmpSt ~ Age + Education,data=df)
研究論文に書き留めることができます。私の理解では、Employed は基本レベルであり、この呼び出しのロジット モデルは次のとおりです。
ここで、i と n はそれぞれ変数の年齢と教育のカテゴリです (混乱を招く表記で申し訳ありません)。multinom() によって生成されるロジスティック モデルについての私の理解が間違っている場合は、訂正してください。出力が多いため、テストの概要は含めません。以下に、 call の出力のみを含めます>test
。
multinom() によって生成されたロジット モデルについての私の理解が正しいとすれば、係数はベース レベルが採用されている場合のログ オッズです。実際のオッズを取得するには、実際のオッズを取得する呼び出しexp(coef(test))
でアンチログします。
次の質問に移ります。
- 第二に、確率
年齢と教育の組み合わせに基づいて、失業者と雇用者の実際の確率を取得する方法があるかどうか疑問に思います。長い質問で申し訳ありません。ご協力いただきありがとうございます。追加の説明が必要な場合はお知らせください。
r - Rのzeroinflオブジェクトから予測されるゼロはありませんか?
ゼロ膨張負の二項モデルを作成し、サンプリングまたは構造ゼロに分割されたゼロの数を調査したいと考えています。R でこれを実装するにはどうすればよいですか。zeroinfl ページのサンプル コードは明確ではありません。
これは何を言っているのですか?
データに対して同じことを行うと、1 の下にリストされているサンプル サイズだけが読み取られます。ありがとう
sas - SAS のデータセット内のすべての変数に対して PROC LOGISTIC を実行する方法は?
私は 300 以上の変数を持つデータセットを持っており、PROC LOGISTIC で段階的な選択を実行したいと考えています (ここでは段階的な選択は悪い考えですが、私次第ではありません)。カテゴリー。
300 以上の変数のそれぞれの名前を入力せずに、応答変数を除くデータ セット内のすべての変数がモデルになるようにモデル ステートメントを作成するにはどうすればよいでしょうか? すべてのカテゴリ変数をカテゴリ変数として扱うようにクラス ステートメントを作成するにはどうすればよいですか?