java - Weka GUIの出力がJavaコードと異なるのはなぜですか？

翻译自：https://stackoverflow.com/questions/5751630 2011-04-22T02:07:03.953

590 次

Weka GUIでフィルターStringToWordVectorを実行した結果が、同等のJavaコードと異なるのはなぜですか？私はGUIで使用したのと同じ属性を使用していますが、Javaのトークナイザーは適切な仕事をしていないようです！私は博士課程の学生から、それは一般的であり、彼からのそれ以上の回答はないと言われました。

助けてください。私のプロジェクトは行き詰まっています。

これが私のコードです：

DataSource tempSource = new DataSource("/home/r_omio/Dataset.arff");
Instances temp = tempSource.getDataSet();
NumericToBinary nbTemp = new NumericToBinary();
nbTemp.setInputFormat(temp);
temp = Filter.useFilter(temp, nbTemp);
StringToWordVector stringFilterTemp = new StringToWordVector(2500);

stringFilterTemp.setOptions( 
    weka.core.Utils.splitOptions("-R 1,2,3,4 -W 2500 -prune-rate -1.0 <br>-N 1 -stemmer weka.core.stemmers.NullStemmer -M 1 -tokenizer weka.core.tokenizers.WordTokenizer -delimiters \" \\r\\n\\t.,;:\\\'\\\"()?![]_\"")
 );


stringFilterTemp.setInputFormat(temp);
temp = Filter.useFilter(temp, stringFilterTemp);

java - Weka GUIの出力がJavaコードと異なるのはなぜですか？

1 に答える 1

Related

Reference