Scikit-learn の半教師あり Naive Bayes (Bernoulli) の実装を使用したいと思います。github のこのリンクによると、1 年前にいくつかの作業と議論がありました (クラス SemisupervisedNB)。一方で別の実装(関数 fit_semi?)もあるみたいで、その後別のユーザーが磨いたらしい。ただし、現在の安定版リリースではそれらのどれも利用できません。
Semisupervised Naive Bayes を構築するために、現在のリリースの scikit-learn でこれら 2 つの実装のいずれかを使用する方法の例を誰かに教えてもらえますか? ありがとう。
PS: クラス SklearnClassifier で NLTK の scikit-learn 分類子を使用しています
編集
プロジェクトで SemiSupervisedNB のコードを試し、ラベルのないクラスのラベルを -1 から 2 に変更しました (NLTK の SKlearnClassifier を使用しており、ラベルのないクラスはラベル 2 を取得します)。ただし、切片配列に inf 値が含まれているため、d (モデルの現在のパラメーターと以前のパラメーターの差) を計算するときに、ValueError: array must not contain infs または NaNs を取得しています...これを解決する方法について何か考えはありますか?