0

weka 3.7 エクスプローラーを使用してテキスト分類を行おうとしています。テキストローダーを使用して、2つのテキストファイル(2つのディレクトリclass1とclass2に分かれています)をarffに変換しました。そうする前に、ケースを低く標準化しました。ファイルを weka にロードし、フィルタ stringtowordvector (stopwords、usewordcount、usestoplist、stemmer - snowballstemmer など) を適用すると、変数のリストに変化が見られません。すべての変数 (words ) は、各クラスに対して 1 または 0 として与えられます。

私を助けてください。

これが私のフィルターコマンドです

weka.filters.unsupervised.attribute.StringToWordVector -R first-last -W 1000 -prune-rate -1.0 -C -N 0 -S -stemmer weka.core.stemmers.SnowballStemmer -M 1 -tokenizer "weka.core.tokenizers .WordTokenizer -delimiters \" \r\n\t.,;:\\'\\"()?!\""

4

1 に答える 1

0

.csv から読み取って StringToWord ベクトルを使用したいときに、それが起こりました。

私の問題は、テキスト属性が文字列ではなく名義型であるということでした。クラス「NominalToString」を使用して値を文字列に変更すると、機能しました。

于 2014-09-16T15:56:52.670 に答える