2

マルチクラスのテキスト分類用に単純ベイズ分類器をトレーニングするために NLTK を使用しようとしています。しかし、私は原文にアクセスできません。提供されているのは、SVM Light 形式のファイルです (feature:value ペアの各行に 1 つのインスタンス)。このファイルをインポートし、このデータセットを使用して Naive Bayes 分類器をトレーニングおよびテストするだけです。このファイルを NLTK にインポートして、分類器のトレーニングに直接使用する方法があるかどうか疑問に思っていました。

4

1 に答える 1

2

nltk自身のドキュメントによると、これは次のように達成されます。

ドキュメントからの抜粋:

scikit-learn ( http://scikit-learn.org ) は、Python 用の機械学習ライブラリです。SVM、単純ベイズ、ロジスティック回帰 (MaxEnt)、決定木など、多くの分類アルゴリズムをサポートしています。

このパッケージは、scikit-learn 分類子のラッパーを実装します。このラッパーを使用するには、scikit-learn estimator オブジェクトを構築し、それを使用して SklearnClassifier を構築します。たとえば、線形 SVM をデフォルト設定でラップするには、次のようにします。

例:

>>> from sklearn.svm import LinearSVC
>>> from nltk.classify.scikitlearn import SklearnClassifier
>>> classif = SklearnClassifier(LinearSVC())

参照: http://www.nltk.org/api/nltk.classify.html#module-nltk.classify.scikitlearn

于 2014-03-24T03:56:42.467 に答える