オンラインマニュアル(http://opennlp.apache.org/documentation/1.5.2-incubating/manual/opennlp.html)に従って、en-ner-person.trainという15k行のトレーニングデータドキュメントを作成しています。
私の質問は、トレーニングドキュメントにレポート全体を含めるかどうかです。または、次の名前の行のみを含めます<START:person> John Smith <END>
か?
たとえば、このレポート全体をトレーニングデータで使用しますか?
<START:person> Pierre Vinken <END> , 61 years old , will join the board as a nonexecutive director Nov. 29 .
A nonexecutive director has many similar responsibilities as an executive director.
However, there are no voting rights with this position.
Mr . <START:person> Vinken <END> is chairman of Elsevier N.V. , the Dutch publishing group .
または、トレーニングドキュメントに次の2行のみを含めますか?
<START:person> Pierre Vinken <END> , 61 years old , will join the board as a nonexecutive director Nov. 29 .
Mr . <START:person> Vinken <END> is chairman of Elsevier N.V. , the Dutch publishing group .