私は Named Entity 分類器を構築してnltk
おり、場所の取得 (国から美術館、レストラン、道路まで、あらゆる種類の) に焦点を当てています。使用する機能セットと方法を変えようとしています。
今のところ、NLTK の組み込みのMaxent
、NaiveBayes
、PositiveNaiveBayes
、DecisionTrees
および を使用しましSVM
た。機能セットの 40 の異なる組み合わせを使用しています。
Maxent
最高のようですが、遅すぎます。はバイナリ分類用であり、最終的な分類子のピクルス化に問題がありましたnltk
。SVM
次に、nltk
のラッパーを試しscikit-learn SVM
ましたが、入力を受け入れませんでした。適応しようとしましたが、フロート強制の問題がありました。
現在、nltk
のラッパーをに使用することを検討してWeka
いますが、試してみる価値のある非常に異なる結果が得られるかどうかはわかりません。私の質問は、の組み込み分類子Weka
よりも優れている点は何ですか?nltk