machine-learning - weka 3.7 エクスプローラーはテキストを分類できません

Question

weka 3.7 エクスプローラーを使用してテキスト分類を行おうとしています。テキストローダーを使用して、2つのテキストファイル（2つのディレクトリclass1とclass2に分かれています）をarffに変換しました。そうする前に、ケースを低く標準化しました。ファイルを weka にロードし、フィルタ stringtowordvector (stopwords、usewordcount、usestoplist、stemmer - snowballstemmer など) を適用すると、変数のリストに変化が見られません。すべての変数 (words ) は、各クラスに対して 1 または 0 として与えられます。

私を助けてください。

これが私のフィルターコマンドです

weka.filters.unsupervised.attribute.StringToWordVector -R first-last -W 1000 -prune-rate -1.0 -C -N 0 -S -stemmer weka.core.stemmers.SnowballStemmer -M 1 -tokenizer "weka.core.tokenizers .WordTokenizer -delimiters \" \r\n\t.,;:\\'\\"()?!\""

score 0 · Accepted Answer

.csv から読み取って StringToWord ベクトルを使用したいときに、それが起こりました。

私の問題は、テキスト属性が文字列ではなく名義型であるということでした。クラス「NominalToString」を使用して値を文字列に変更すると、機能しました。

machine-learning - weka 3.7 エクスプローラーはテキストを分類できません

1 に答える 1

Related

Reference