問題タブ [logistic-regression]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
scikit-learn - Scikit-learn で RandomizedLogisticRegression を使用するにはどうすればよいですか?
私は単に このクラスのドキュメントを理解できませんでした。それを使用してデータを適合させ、機能のスコアを取得することはできますが、このすべてのクラスが行うことになっているのですか?
適合したモデルを使用して実際に回帰を実行するためにそれを使用する方法がわかりません。上記のドキュメントの例は、単にクラスのインスタンスを作成しているだけなので、それがどのように役立つのかわかりません。
「変換」操作を実行するメソッドはありますが、それがどのような変換であるかについては言及されていません。
このクラスを使用して、新しいテスト データの実際の予測を取得することは可能ですか?クロス フォールド検証で使用して、使用している他の方法とパフォーマンスを比較することは可能ですか?
他の分類器で最高ランクの機能を使用しましたが、この分類器でそれ以上の機能が可能かどうかはわかりません。
更新:ドキュメントの機能選択部分でfit_transform の使用を見つけました:
データの次元を減らして別の分類器で使用することが目標の場合、変換メソッドを公開して非ゼロ係数を選択します。
私が間違っているという答えが得られない限り、この分類器は実際には予測を行わないと仮定します。自分の質問に答える前に待ちます。
python - Pythonを使用したロジスティック回帰
Pythonでゼロからロジスティック回帰を実装したい。その中の機能は次のとおりです。
- シグモイド
- 料金
- fminunc
- ロジスティック回帰の評価
私は知りたいのですが、Pythonでゼロから始めるには、これが素晴らしいスタートになるでしょう。どのように、何が良いかについてのガイダンス。私はこれらの関数の理論を知っていますが、より良いpythonicの答えを探しています.
私はオクターブを使用しましたが、問題はありませんでしたが、OCtave には作業を行うためのパッケージが既にセットアップされているため、Python で開始する方法がわかりません。
stata - Stata エラー コードのロジスティック回帰
世帯 ID と個人 ID で識別される調査データセットがあります。障害のある世帯のメンバーに関する調査に質問があります。質問の構成により、障害のある人の特徴 (年齢、学歴など) が他のメンバーのデータにエンコードされていることに気付きました。
私たちは、従属変数が変数であるロジスティック回帰を行うことを任されましたdisability
。logit
Stata で実行するerror 2000
と、観測がないというメッセージが表示されます。私はどうしたらいいですか?他のメンバーのプロファイルから「障害プロファイル」を持つ人に観察を転送する必要がありますか? これが、Stata でエラー コードが表示される理由かもしれません。
java - JAMA lib を使用した Java のロジスティック回帰のコスト関数
現在、JAMA lib を使用してロジスティック回帰のコスト関数をコーディングしています。しかし、それは機能していません。理由はわかりません。値を返すはずです:0.6743
上記のように行列 J を返すと、 0.0 が返されます。しかし、Y.times(log_hx).subtract(y_1.times(log1_hx)) を直接返すと、魔法のように値 3.3715 が返されます。これは、1/m を掛けずに正則化によって加算した場合に正しいです。
r - データの階層化分割
私は大規模なデータ セットを持っており、データの列の 1 つである都市ごとに異なるロジスティック回帰を適合させたいと考えています。次の 70/30 分割は、City グループを考慮せずに機能します。
ただし、これは各都市の 70/30 分割を保証するものではありません。
市 A と市 B があり、市 A には 100 行、市 B には 900 行、合計 1000 行があるとします。上記のコードを使用してデータを分割すると、電車の場合は 700 行、テスト データの場合は 300 行になりますが、電車のデータで都市 A の行が 70 行、都市 B の行が 630 行になるとは限りません。それ、どうやったら出来るの?
トレーニング データを都市ごとに 70/30 に分割したら、都市ごとにロジスティック回帰を実行します (トレーニング データを取得したら、これを行う方法を知っています)。
java - オクターブでの fminunc の Java 実装
fminunc
Javaでオクターブの(関数最小化の制約なし)ライブラリのJavaバージョンを見つけようとしています。目標は、ロジスティック回帰に使用することです。
現在、私はコストを最小限に抑えるために勾配降下の自作バージョンを使用しています。既存のライブラリを使用して(Javaで)それを実行できるようにしたいと考えています。これは、 Coursera Machine Learningコースから得たオクターブ コードを Java に移植するという私の取り組みに関連しています。
python - sklearn ロジスティック回帰の機能
sklearn.linear_model.LogisticRegression に独自の機能を追加する際に問題があります。とにかく、いくつかのサンプルコードを見てみましょう:
上記のコードは明確で簡単です。したがって、1,2,3,4,5(resultsNER) と呼ばれるいくつかのクラスがあります。これらは、「データ」、「人」、「組織」などのクラスに関連しています。したがって、各クラスに対して、返すカスタム機能を作成します。 true または false。この場合は 1 と 0 の数値です。例: トークンが "(S|s)unday" の場合、それはデータ クラスです。数学的には明らかです。テストする各クラス機能のトークンがあります。次に、どのクラスが機能の合計の最大値を持っているかを調べ (そのため、ブール値ではなく数値を返します)、それを選択します。つまり、argmax 関数を使用します。もちろん、要約すると、各機能にはアルファ係数があります。この場合は多クラス分類なので、sklearn.LogisticRegression に多クラス機能を追加する方法を知る必要があります。
アルファ係数の 2 つが必要であり、ロジスティック回帰に独自の機能を追加します。私にとって最も重要なのはsklearn.LogisticRegression
、クラスごとに独自の機能を追加する方法です。
勾配降下法で係数を計算できることは知っています。しかし、fit(x,y) を使用すると、LogisticRegression は何らかのアルゴリズムを使用して、attribute で取得できる係数を計算すると思います
.coef_
。
結局のところ、私の主な質問は、サンプル クラス 1,2,3,4,5 (resultNER) のさまざまなクラスにカスタム機能を追加する方法です。