次の形式の製品名、製品のレビューのcsvファイルがあります
今、マレットを使用して、製品レビューを含むテストデータセットが入力として与えられた場合、特定のレビューがどの製品に属しているかを教えてくれるように、分類器をトレーニングする必要があります
mallet Java APIのヘルプをいただければ幸いです
次の形式の製品名、製品のレビューのcsvファイルがあります
今、マレットを使用して、製品レビューを含むテストデータセットが入力として与えられた場合、特定のレビューがどの製品に属しているかを教えてくれるように、分類器をトレーニングする必要があります
mallet Java APIのヘルプをいただければ幸いです
これがあなたのケースに適した小さな例です:
public static void main(String[] args) throws IOException {
//prepare instance transformation pipeline
ArrayList<Pipe> pipes = new ArrayList<Pipe>();
pipes.add(new Target2Label());
pipes.add(new CharSequence2TokenSequence());
pipes.add(new TokenSequence2FeatureSequence());
pipes.add(new FeatureSequence2FeatureVector());
SerialPipes pipe = new SerialPipes(pipes);
//prepare training instances
InstanceList trainingInstanceList = new InstanceList(pipe);
trainingInstanceList.addThruPipe(new CsvIterator(new FileReader("datasets/training.txt"), "(.*),(.*)", 2, 1, -1));
//prepare test instances
InstanceList testingInstanceList = new InstanceList(pipe);
testingInstanceList.addThruPipe(new CsvIterator(new FileReader("datasets/testing.txt"), "(.*),(.*)", 2, 1, -1));
ClassifierTrainer trainer = new NaiveBayesTrainer();
Classifier classifier = trainer.train(trainingInstanceList);
System.out.println("Accuracy: " + classifier.getAccuracy(testingInstanceList));
}