ibm-watson - URLGetRelations API が一部の文を「未来」時制として誤ってラベル付けするのはなぜですか?

Question

URLGetRelations API を使用して、テキスト内の未来時制の文を識別できるようにしたいと考えています。ただし、API が未来時制として識別している文に不正確な点があることがわかりました。以下の例はすべて「未来」として識別されていますが、これらは間違いなく正しくありません。以下の API 応答に、文字化けした単語があることがわかります (たとえば、最初の記事の「revivehim」)。ただし、私が API を誘導した URL を見ると、元のソーステキストに歪みは見られません。

1 つ: http://www.reuters.com/article/new-york-police-idUSL2N15R02C

{ "sentence": "\"なんてこった、誰かに襲われた、\" 踊り場で出血しているガーリーを見つけたとき、彼のガールフレンドが必死に彼を生き返らせようとしたとき、梁は涙ながらに言ったことを思い出した.", "subject": { "text": "彼のガールフレンド"}, "action": { "text": "tried to revive","lemmatized": "try to revive", "verb": {"text": "revive", "tense": "future " } },"object": { "text": "him","sentimentFromSubject": { "type": "negative","score": "-0.70197" } } },

2 つ: http://www.cnn.com/2016/02/11/us/nypd-officer-trial/

{ "文": "木曜日の夜、評決の約 1 時間前に、陪審員はダニーチュン判事に容疑と法的定義を読むように依頼しました。今週 2 回目です。","subject": { "text": "ダニー判事Chun" },"action": { "text": "to read","lemmatized": "to read", "verb": {"text": "read", "tense": "future" } }, "object": { "text": "料金と法的定義", "感情": { "type":"negative", "score": "-0.597878" } } },

score 1 · Accepted Answer

この混乱を引き起こしているのは「to」という言葉だと思います。「私は後でそれを食べるつもりです」や「私たちは今夜飛ぶ予定です. また、文法的に 100% 正しくなくても、未来時制を意味する「ジョーが今夜テレビに出演する」などの言い回しも見られます。あなたが共有したケースでは、単語「to」は不定詞を形成するように機能していますが、構造が非常に似ているため、未来時制動詞句に分類されています。2 番目の例では、これがどのように行われているかを特に簡単に確認できます。主語は「ジャスティスダニーチュン」、アクションは「読む」、目的語は「告発...」です。

ibm-watson - URLGetRelations API が一部の文を「未来」時制として誤ってラベル付けするのはなぜですか?

1 に答える 1

Related

Reference