私はnltkを始めたばかりで、本に従っています。第 6 章はテキストの分類に関するもので、何かについて少し混乱しています。例 (名前と映画のレビュー) では、分類器は 2 つの明確に定義されたラベル (男性-女性、および正負) から選択するようにトレーニングされています。しかし、ラベルが 1 つしかない場合のトレーニング方法。
映画のあらすじがたくさんあり、SF ジャンルの映画を探すことにしか興味がないとします。SF プロットのみを認識するように分類器をトレーニングできますか。たとえば、分類の信頼度が 80% を超える場合は fi を認識し、それを SF グループに入れます。それ以外の場合は無視します。
誰かが明確にできることを願っています、ありがとう、