0

スタンフォード大学の Named Entity Recognition パッケージに付属するデモ ファイルには、文の分類の例が示されています。出力オプションは、次のような文字列です。

"I eat apples with Michael and Jordan on mondays" 

=>

 "I eat apples with <PERSON>Michael</PERSON> and 
<PERSON>Jordan</PERSON> on <DATE>mondays</DATE>"

または単語ごとの分類のマップ。

分類のマップをエンティティのリストに返すメソッドはありますか?

例えば:

{
  PERSON : ["Michael", "Peter"]
  DATE : ["mondays"]
}
4

1 に答える 1

0

これを後処理として実行する最小限の bash スクリプトを次に示します。

echo "I eat apples with <PERSON>Michael</PERSON> and <PERSON>Jordan</PERSON> on <DATE>mondays</DATE>"
| grep -Eo '<([^>/]*)>[^<]*'
| awk -F '>' '{nes[$1]=nes[$1]","$2;} END {for(t in nes) print tolower(t)":{"nes[t]"}";}'
| sed 's/:{,/:{/' | tr -d '<'

これを使用して、例のようにリストを取得します:

date:{mondays}
person:{Michael,Jordan}

おそらく、複数のエントリを処理したいでしょう ("uniq" またはそれらを数えますか?)。

于 2014-06-26T20:24:30.493 に答える