URLGetRelations API を使用して、テキスト内の未来時制の文を識別できるようにしたいと考えています。ただし、API が未来時制として識別している文に不正確な点があることがわかりました。以下の例はすべて「未来」として識別されていますが、これらは間違いなく正しくありません。以下の API 応答に、文字化けした単語があることがわかります (たとえば、最初の記事の「revivehim」)。ただし、私が API を誘導した URL を見ると、元のソース テキストに歪みは見られません。
1 つ: http://www.reuters.com/article/new-york-police-idUSL2N15R02C
{ "sentence": "\"なんてこった、誰かに襲われた、\" 踊り場で出血しているガーリーを見つけたとき、彼のガールフレンドが必死に彼を生き返らせようとしたとき、梁は涙ながらに言ったことを思い出した.", "subject": { "text": "彼のガールフレンド"}, "action": { "text": "tried to revive","lemmatized": "try to revive", "verb": {"text": "revive", "tense": "future " } },"object": { "text": "him","sentimentFromSubject": { "type": "negative","score": "-0.70197" } } },
2 つ: http://www.cnn.com/2016/02/11/us/nypd-officer-trial/
{ "文": "木曜日の夜、評決の約 1 時間前に、陪審員はダニー チュン判事に容疑と法的定義を読むように依頼しました。今週 2 回目です。","subject": { "text": "ダニー判事Chun" },"action": { "text": "to read","lemmatized": "to read", "verb": {"text": "read", "tense": "future" } }, "object": { "text": "料金と法的定義", "感情": { "type":"negative", "score": "-0.597878" } } },