プログラムをコンパイルまたは起動するときは、Stanford の JAR ファイルをクラスパスに追加する必要があります。
java -classpath stanford-postagger.jar [MyProgram]
次に、コードで関連するパッケージをインポートする必要があります。必要なもののほとんどはedu.stanford.nlp.tagger.maxent
.
new のインスタンス化についてMaxentTagger
はJavaDocで詳しく説明されていますが、ここでその一部を繰り返します。
新しいタガーを作成するには:
MaxentTagger tagger = new MaxentTagger("models/left3words-wsj-0-18.tagger");
これでタグ付けするString
にはtagger
:
String taggedString = tagger.tagString("Here's a tagged string.")
さらに、スタンフォードの NLP ツールを使用して文章を作成し、タグを付けることができます。を使用してファイルを読み取り、文を作成しますBufferedReader
。
Sentence sentence = Sentence.readOneSentence(in); // in is a BufferedReader
次に、次のように文にタグを付けますtagger
。
Sentence taggedSentence = tagger.tagSentence(sentence);