algorithm - アルゴリズムは皮肉を検出できますか

Question

皮肉を検出するアルゴリズムを書くように頼まれましたが、ロジックに欠陥（またはそのように見えるもの）に遭遇しました。

たとえば、人が言う場合

A：ジャスティンビーバーが大好きです。あなたは彼が好きですか？

B：うん。もちろん。私は絶対に彼を愛しています。

今、これは皮肉であるかどうかと考えられるかもしれません、そして知る唯一の方法はBが深刻であるかどうかを知ることであるようです。

（私は深くなるはずがありませんでした。私たちはたくさんのフレーズを与えられ、それらが文に含まれているならそれは皮肉であると言われましたが、私は興味を持ちましたか？）

これを回避する方法はありますか？それとも、皮肉に関しては、コンピューターは絶対に立ち往生していますか？

（スピーカーの音色にもよると思いますが、入力はテキストです）

score 18 · Accepted Answer

それを試みた研究があるように見えますが、彼らはまだうまく機能するアルゴリズムを考え出していません。

González-Ibáñezから、R。etal。「Twitterで皮肉を特定する：詳しく見る」

皮肉と皮肉は、言語学、心理学、認知科学でよく研究されている現象です[...]。しかし、テキストマイニングの文献では、皮肉の自動検出は難しい問題と見なされており[...]、ほんの数件の研究で対処されています。[...]私たちの仕事に最も密接に関連している仕事は、Davidovらの仕事です。（2010）、その目的は、TwitterおよびAmazonの製品レビューで皮肉な発話と皮肉でない発話を識別することでした。この論文では、皮肉なツイートと非皮肉なツイートを区別するというやや難しい問題について考察します。

彼らは次のように結論づけています。

おそらく当然のことながら、人間の裁判官も機械学習技術もあまりうまく機能しません。[...]私たちの結果は、語用論的特徴だけでは皮肉を特定するのに十分ではなく、語用論的および文脈的特徴はさらなる研究に値することを示唆しています

別の最近の関連する論文は次
のとおりです。Reyes、A.「ユーモアの認識から皮肉な検出へ：ソーシャルメディアの比喩的な言葉」

score 9 · Accepted Answer

...文はユーザーによって書かれます。2人の間でシミュレートされた会話。

皮肉を検出することは、1つのフレーズではほぼ不可能ですが、コンテキストを使用すると、もう少し実行可能になる可能性があります。文を解析してその文字通りの意味を解釈できると仮定しましょう（簡単な作業ではありませんが、その問題は少なくともある程度は解決されています）。

これで、次のコンテキストが得られます。

会話内のすべてのフレーズ。
他のスピーカーの応答。

相互参照されたフレーズ

＃1を活用するには、すべてのフレーズを相互参照することができます。それらのいずれかが直接矛盾していますか？

例：

スピーカー1：ジャスティンビーバーが大好きです。あなたは？
スピーカー2：完全に！私は、彼を愛しています。
スピーカー1：彼の好きなところは何ですか？
スピーカー2：彼の素晴らしい音楽！
スピーカー1：本当に？好きな歌は何ですか？
スピーカー2：さあ、あなたは私が彼の音楽を嫌うことを知っています。

「私は彼を愛している！」という2つの矛盾したフレーズがあることを私たちは知っています。そして「私は彼の音楽が嫌いです」。少なくとも皮肉が発生した可能性があります。

他の講演者からの質問または回答

アプローチ＃2はより効果的である可能性があります（または役に立たない...おそらく皮肉は知られていますが、2つの当事者の間で話されていません）。

例：

スピーカー1：ジャスティンビーバーは町にいます。私は彼に会うつもりです。
スピーカー2：ハ。

もう一つの例：

スピーカー1：ジャスティンビーバーが大好きです。あなたは？
スピーカー2：ベッドの上に彼の巨大なポスターがあります。
スピーカー1：そうですね。

さらに詳しく説明すると、ヒューリスティックを適用して、特定のフレーズの後で会話がどれだけ急激に逸脱したかを判断できます。

スピーカー1：私はジャスティンビーバーに完全に夢中です!!! あなたは？
_{スピーカー1は強調した声明を出しました}
スピーカー2：ええ、確かに。
_{皮肉な。私たちはそれを知りませんが、会話の他の人は知っています。}

スピーカー1は今どの方向に進んでいますか？彼らは主題を変えますか？会話がどれだけ鋭く変わるかに応じて、知覚された応答に彼らがどのように反応したかを示している可能性があります。

とはいえ、これのほとんどは高度な処理を必要とし、せいぜい非常に低い精度を期待します。しかし、それは魅力的な質問です。

score 4 · Accepted Answer

皮肉は本当にそれが言われている口調についてであり、テキストは声の口調を保持していません。また、その声明が真実であることがどれほど実行可能であるかによって、その皮肉かどうかを判断することもできます...

入力がユーザーによって入力された場合、2つの方法があります。

1つは、インターネット用語を使用して書いたものに基づいています。

例えば：

ユーザーは次のように入力できます。

"Yeah. Sure. I absolutely love him. /sarcasm"

/sarcasm [/sarcasm]あなたはなどのようなキーワードを検索することができます

または、統計オッズを使用することもできます。

"Yeah, and I'm the president of USA"....事実上正しいという統計的オッズは非常に低いため、皮肉としてフラグを立てることができます。

score 1 · Accepted Answer

では、文化や言語の観点から見た皮肉とは正確には何でしょうか。この複雑な問題を解決したい場合は、それを明確にする必要があります。一部の人間の言語のサームでAIを使用するように求められるため、問題は非常に複雑です。あなたはいくつかのインスピレーションのためにALICEを見ることができます。

algorithm - アルゴリズムは皮肉を検出できますか

4 に答える 4

相互参照されたフレーズ

他の講演者からの質問または回答

Related

Reference