r - トレーニング済みデータによる固有表現認識

Question

私のテキストファイル t1.txt にはこれが含まれていました

<START:name> Ashish Sanadhya <END> , 61 years old , will join the board as a nonexecutive director Nov. 29 .
Mr . <START:name> mayank sharma <END> is chairman of Elsevier N.V. , the Dutch publishing group .

および t2.txt が含まれています

person mayank sharma
persons ashish sanadhya
organizations linkedin

画像が示すようにデータをトレーニングしましたここに画像の説明を入力が、次のように目的の結果に戻ろうとすると

>s <- paste(c("I am ashish ."))
> a2 <- annotate(s, list(sent_token_annotator, word_token_annotator))
> entity_annotator <-  Maxent_Entity_Annotator(language = "en", kind = c("person"), probs = FALSE,model ="C:\\apache-opennlp-1.5.3\\en-ner-person.bin")
>  entity_annotator(s, a2)
  [1] id    type  start end  
<0 rows> (or 0-length row.names)

そして、個人エンティティをトレーニングした後の結果を期待していました

 entity_annotator(s, a2)
 id type   start end features   
 1  entity 6    11  kind=person
 s[entity_annotator(s, a2)]
 ashish

何か助けてください、なぜ期待した結果が得られないのですか。ありがとう、この方向の助け

編集済み

ここからen-ner-person.binファイルをダウンロードし、カットオフパラメーターが機能しました。このコマンドを使用しました

c:\apache-opennlp-1.5.3>bin\opennlp TokenNameFinderTrainer -cutoff 1 -lang en -encoding UTF-8 -data "c:\t7.txt" -model en-ner-person.bin

Daniel Naber に感謝します。

r - トレーニング済みデータによる固有表現認識

0 に答える 0

Related

Reference