マルチクラスのテキスト分類用に単純ベイズ分類器をトレーニングするために NLTK を使用しようとしています。しかし、私は原文にアクセスできません。提供されているのは、SVM Light 形式のファイルです (feature:value ペアの各行に 1 つのインスタンス)。このファイルをインポートし、このデータセットを使用して Naive Bayes 分類器をトレーニングおよびテストするだけです。このファイルを NLTK にインポートして、分類器のトレーニングに直接使用する方法があるかどうか疑問に思っていました。
質問する
739 次
1 に答える
2
nltk自身のドキュメントによると、これは次のように達成されます。
ドキュメントからの抜粋:
scikit-learn ( http://scikit-learn.org ) は、Python 用の機械学習ライブラリです。SVM、単純ベイズ、ロジスティック回帰 (MaxEnt)、決定木など、多くの分類アルゴリズムをサポートしています。
このパッケージは、scikit-learn 分類子のラッパーを実装します。このラッパーを使用するには、scikit-learn estimator オブジェクトを構築し、それを使用して SklearnClassifier を構築します。たとえば、線形 SVM をデフォルト設定でラップするには、次のようにします。
例:
>>> from sklearn.svm import LinearSVC
>>> from nltk.classify.scikitlearn import SklearnClassifier
>>> classif = SklearnClassifier(LinearSVC())
参照: http://www.nltk.org/api/nltk.classify.html#module-nltk.classify.scikitlearn
于 2014-03-24T03:56:42.467 に答える