問題タブ [stochastic-gradient]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - sklearn SGDClassifier モデルのしきい値はモデルのスコアとどのように関連していますか?
モデルをトレーニングし、それをデプロイしたい「しきい値」を特定しましたが、しきい値がスコアにどのように関係しているかを理解するのに苦労しています。
では、適合率と再現率としきい値をプロットして、しきい値を 0.4 にすることにします。
閾値とは?
私のモデル係数は、計算による「スコアリング」イベントであると理解していますがcoefficients['x']*event_values['x']
、合計は 29 です。しきい値は 0 から 1 の間です。
しきい値から何への変換をどのように理解すればよいでしょうか。生のスコアだと思いますか? 1
すべての機能 (すべてがバイナリ) を持つイベントは、すべての係数の合計であるため、29 の計算スコアを持ちますか?
すべてのイベントについてこの「生の」スコア メトリックを計算し、それをしきい値ではなく精度に対してプロットする必要がありますか?
編集および更新:
したがって、私の質問は、ミハイル・コロボフが以下で指摘したように、ロジスティック関数についての理解の欠如にかかっていました. 「生のスコア」に関係なく、ロジスティック関数は [0, 1] の範囲の値を強制します。
その値を探していた「生のスコア」に「アンラップ」するためにscipy.special.logit(0.8) - grad_des.intercept_
、行の「スコア」を返すことができます。
batch-processing - DBOW の単一エポック中に何が起こるかを理解する
Distributed Bag of Words (DBOW) を使用していますが、1 つのエポックで何が起こるのか知りたいですか? DBOW はすべてのドキュメント (別名バッチ) を循環しますか、それともドキュメントのサブセット (別名ミニバッチ) を循環しますか? さらに、特定のドキュメントに対して、DBOW はテキスト ウィンドウから単語をランダムにサンプリングし、重みを学習してそのターゲット単語をウィンドウ内の周囲の単語に関連付けます。これは、DBOW がドキュメント内のすべてのテキストを処理しない可能性があることを意味しますか?
GENSIM ( https://github.com/RaRe-Technologies/gensim ) コードを調べて、バッチのパラメーターがあるかどうかを確認しましたが、うまくいきませんでした。
tensorflow - Yolo Network のオンライン学習?
Yolo Network v3 を使用して、既にデータを持っている 5 つのカスタム オブジェクト クラスを検出するとします。そこで、これらのクラスのトレーニング データを使用して、トレーニング済みの重みで yolo ネットワークを再トレーニングします。
次にケースを想像してください。
しばらくして、モデルに別のクラスを追加したいと思います。ここで、モデルのアーキテクチャを変更する必要があるため、5 + 1 クラスすべてでモデルを再トレーニングする必要がありますよね?
この状況を避けるために、最初にクラスの最大数を 20 としましょう。そのため、20 クラスの Yolo アーキテクチャを構築し、データが利用可能な最初の 5 クラスでトレーニングします。新しいクラスのデータが利用可能であれば、確率的勾配降下法をオンライン学習に使用してモデルをトレーニングし、新しいクラスを検出します。
ここに私の質問があります:
- モデルは最初に 5 つのクラスを正しく学習し、他の 15 のクラスからのデータはありませんか?
- 確率的勾配降下によって新しいクラスを少しずつ学習することは可能ですか?
- 私の問題を処理する他の便利な方法はありますか?
アドバイスをありがとう!