0

文章から質問を生成するプロジェクトに取り組んでいます。今、私は「アンゲラ・メルケルはドイツの首相です」のような質問をすることができるところまで来ています。-> 「アンゲラ・メルケルは誰?」

もちろん、質問を「誰が...?」のようにしたいと思います。代わりは。私がまだ考えていないこれを行う簡単な方法はありますか?

私の現在の考えは、英語 (あまり質問ではない) -> 英語 (質問) の翻訳者を訓練することです。おそらく moses のような既存の機械翻訳エンジンを使用します。これはやり過ぎですか?どのくらいのデータが必要ですか? この問題または同様の問題に対処するコーパスはありますか? 一般的な翻訳エンジンを使用しても、このタスクに適していますか?

4

2 に答える 2

0

私の考えでは、比較的単純な質問に限定すると、解析を実行してから、要素をめくって質問を取得できます。疑問詞ってどうやって決めるの?誰が、何を、どこで、なぜ... このためには、文の要素を調べる分類子が必要です。アンゲラ・メルケルは人/名前として分類しやすいはずなので、彼女は「誰」を取得し、ベルリンは地理の辞書にあるはずなので、「どこ」を取得します。

特定のソフトウェアについてはわかりませんが、NLTK を使用して、依存関係の解析を使用してから、好きな分類スキームを使用することをお勧めします。

最終的に成功するかどうかは、入力スペースと出力スペースの大きさに依存します。私は最初に可能な限り単純な問題に行きます。

于 2012-06-20T17:10:19.323 に答える
0

Michael Heilman の論文Automatic Factual Question Generation from Textをチェックして、質問生成の背景と、この問題に対する彼のアプローチがどのようなものかを確認してください。「質問生成」に関する研究を検索すると、さらに多くの情報を見つけることができます。彼は、Microsoft のコーパスであるMicrosoft Research Question-Answering Corpusについて言及しています。

(現在の) 統計的機械翻訳アプローチのみに基づくアプローチがうまく機能するとは思わない質問。あなたの例のような単純な質問の場合、構文ツリー変換を設計して質問を生成するのは非常に簡単ですが、文がもう少し複雑になるとすぐに難しくなります。

于 2012-06-21T13:13:46.010 に答える