java - スタンフォード NLP/NER - 抽出器と分類器の使用方法は?

Question

スタンフォード大学の Named Entity Recognition パッケージに付属するデモファイルには、文の分類の例が示されています。出力オプションは、次のような文字列です。

"I eat apples with Michael and Jordan on mondays"

=>

 "I eat apples with <PERSON>Michael</PERSON> and 
<PERSON>Jordan</PERSON> on <DATE>mondays</DATE>"

または単語ごとの分類のマップ。

分類のマップをエンティティのリストに返すメソッドはありますか?

例えば：

{
  PERSON : ["Michael", "Peter"]
  DATE : ["mondays"]
}

score 0 · Accepted Answer

これを後処理として実行する最小限の bash スクリプトを次に示します。

echo "I eat apples with <PERSON>Michael</PERSON> and <PERSON>Jordan</PERSON> on <DATE>mondays</DATE>"
| grep -Eo '<([^>/]*)>[^<]*'
| awk -F '>' '{nes[$1]=nes[$1]","$2;} END {for(t in nes) print tolower(t)":{"nes[t]"}";}'
| sed 's/:{,/:{/' | tr -d '<'

これを使用して、例のようにリストを取得します:

date:{mondays}
person:{Michael,Jordan}

おそらく、複数のエントリを処理したいでしょう ("uniq" またはそれらを数えますか?)。

java - スタンフォード NLP/NER - 抽出器と分類器の使用方法は?

1 に答える 1

Related

Reference