3

テキスト内の名詞の合意機能を抽出する必要があるタスクを実行しています...次のような合意機能:

number = singular, plural
person = first, second, third
gender = male, female, neuter
animacy = animate, inanimate

とにかくテキストからこれらの特徴を抽出することはありますか...。

4

1 に答える 1

2

コメントが示唆するように、データが英語の場合、名詞には個人情報が含まれないため、それを割り引くことができます。

他の人が言及しているように、数は簡単です。多くの品詞タガーは、単数名詞と複数名詞を区別します。

ジェンダーとアニマシーはもっと面白いです。英語では、これらは名詞の構文的特性ではなく意味論的特性です。たとえば、The princess is in the towerという文を考えてみましょう。プリンセスが女性的で生き生きとしているのは、抑揚情報のためではなく、言葉の意味を知っているからです. データの大きな古いコーパスを取得し、その中の代名詞と照応を分析することによって、オントロジーを構築することは可能です。アルゴリズムは、次のような例を探します。

王女は鏡で自分自身を見ます。

お姫様は塔にいます。彼女は悲しい。

王女が彼女自身彼女の先行者であることが(どういうわけか)うまくいき、代名詞の既知の特性から名詞の特性を推測します。もちろん、問題は参照の解決になりますが、これは些細なことではありません。以下は、このテーマに関する最近のエジンバラ大学の講義コースからの参考文献です。

  • Denis、Pascal、および Baldridge、Jason、2008 年。自然言語処理における経験的方法に関する会議の議事録。ACL、650-69。
  • Haghighi、Aria および Klein、Dan、2010 年。In Human Language Technologies: The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics . カリフォルニア州ロサンゼルス、385-93。
  • Lappin、Shalom および Leass、Herbert、1994 年。「代名詞照応解決のためのアルゴリズム」。計算言語学20:535-61。
  • Ng、Vincent、2010 年。ACL '10: 計算言語学協会の第 48 回会議の議事録。1396-411。
于 2012-06-18T13:27:34.143 に答える