weka で生成/トレーニングされたモデルを使用して、論文のプロトタイプを作成しています。私の論文は、テキストの感情分析に関するものです。これで、モデル/トレーニング済みモデルを使用して分類したいテスト データ/セットができました。
これは、arff ファイルを読み取り、フィルター (stringToWordVector) を持つ私の部分的なコードです。
Classify ct = new Classify(TextJ48.model); // loads model
string sample = getARFFile();
StringBuilder buffer = new StringBuilder(sample);
BufferedReader reader = new BufferedReader(new java.io.StringReader(buffer.ToString()));
weka.core.converters.ArffLoader.ArffReader arff = new weka.core.converters.ArffLoader.ArffReader(reader);
Instances dataRaw = arff.getData();
StringToWordVector filter = new StringToWordVector();
filter.setInputFormat(dataRaw);
Instances dataFiltered = Filter.useFilter(dataRaw, filter);
を表示するdataFiltered
と、単語から数値へのフィルタリングに成功しました。
これはclassify
クラスです:
public Classify(string filename)
{
try
{
classifier = (Classifier)weka.core.SerializationHelper.read(filename);
}
catch (java.lang.Exception ex)
{
lblProgress.Text = ex.getMessage();
}
loadAttributes();
this.fileName = filename;
}
loadAttributes()
私の計画で何をすべきかわかりませんにすべての属性を追加することですFastVector
。一部のソースでは、属性のサイズが固定されているため属性を簡単に追加できることがわかりましたが、私の場合、に基づいた属性の数が異なります文章。
モデルを使用して入力したテキストをどのように分類しますか。