1

チームメイトと私は非常にやりがいのある新しいプロジェクトを抱えており、来週提出することになっています。どうやってそれを行うかについての手がかりは1つもありません。本当に助けが必要です. 私たちは学部生であり、情報検索と AI に慣れていないため、あなたのアイデアを本当に必要としています。

プロジェクトはおおよそ次のとおりです。

専門家が文書で引用されている場合、反対意見を持つ専門家を見つけて、そのトピックについて彼/彼女が何を言っているかを調べます。

プログラミング言語は自由に使用できますが、プログラミングには関心がありません。私たちは私たちを始めるための助けを求めています. そのようなシステムを設計する方法と、インターネット上で情報を取得する方法について、大まかなアイデアを教えてください。どうやって彼の意見を聞き、反対の意見を見つけたらよいでしょうか?

4

4 に答える 4

2

シンプル:AmazonのMechanicalTurkを使用します。

それ(または同等のもの)がなければ、あなたは困っています。問題にそれ以上の制約がない場合は、まだ存在していない種類の本格的なAIが必要になります。厳しい拘束がある場合は、1週間でこれを行うチャンスがあります。専門家があらゆる分野(医学、政治、歴史、ファッション、科学、漫画など)にいることができれば、エッセイの単一の、よく組織されたリポジトリはありません。X博士の意見を見つけるには、Googleを使用する必要があります。X博士の文章を見つけたら(そしてそれが音声ではなくテキストであることを祈りましょう)、説明的なタイトルを見つけるのに十分幸運だったとしても、それを推し進めるために何らかの自然言語処理を行う必要があります( "デジタル写真は絶対に素晴らしいです」)。次に、それが反対であることを理解する必要があります。「ニール・ゲイマンは彼の物語のアイデアのために民間伝承を利用する」の反対は何ですか?あなたが探している意見を理解することは深刻な問題になります。その後、物事は実際に簡単になります:

では、何を解決するチャンスがありますか?他の誰かがすでに「賛成」と「反対」に整理した意見の検索。いくつかのオンライン政治フォーラムはそのように組織されています。ウィキペディアは、その記事のいくつかの特別なセクションで反対意見を引用しています。科学雑誌は反論の手紙を印刷します。周りを見回すと、さらにカットアンドドライされたサイトが見つかるかもしれません。十分に小さいアリーナを選択すると、扱いにくい問題が発生します。

編集:くそー、ベン・ダンラップはコメントで私のすべての主要なポイントに私を打ち負かしました。はぁ

于 2009-11-20T19:17:55.833 に答える
0

「 expert_namesucks」、「expert_namewrong 」などのGoogle検索リクエストを自動的に送信します。同じ文にドキュメントリンクがある「PhD」を持つ最初の結果を見つけて、リンクを返します。

于 2009-11-20T19:12:32.703 に答える
0

私にはNLPの問題のように聞こえます。文書と引用に関する情報については、http://citeseerx.ist.psu.eduが出発点として適しています。

各論文について、その論文を参照するいくつかの引用があります。少なくとも、論文の要約と引用の要約をスキャンし、独自のアルゴリズムを実行して、反対意見の引用があるかどうかを判断する必要があります。たぶんあなたの教授はあなたにいくつかのおおよそのヒューリスティックについてのヒントを与えることができます、しかし私が知る限りそれは本当に難しい問題です。

私はこのスレッドを見て、もっと興味深いアプローチを探しています。

于 2009-11-20T19:01:16.333 に答える
0

あなたはこれを少し大きくしすぎているのではないかと思います... 学部のプロジェクトとして、私はもう少し小規模にアプローチします.

実際のインターネット リソースを使用する必要があると仕様に記載されていない限り、カスタムの短いドキュメントの独自のデータベースを作成することをお勧めします。特定のトピックについてのポイントを示すメタデータを各ドキュメントに追加します。

次に、各ドキュメントにリンクする引用のリストを作成し、トピックに対する専門家のスタンスを表すメタデータを追加します。誰かがドキュメントを読むとき、私は引用のリストを、そのトピックに関する別の見解を持つドキュメントへのリンクのリストで増やします。

基本的には、次のテーブルで構成されます。

Document (id, data)
DocumentPoints (documentId, topic, stance)
Citation (documentId, topic, stance)

また、誰かがドキュメントをロードすると、引用もプルアップされます。引用ごとにDocumentPoints、異なるスタンスで同じトピックを検索します。このプロジェクトで最も困難な部分は、データベースにデータを格納するために必要な 5 つか 6 つのドキュメントを作成することです。その後の解決策は簡単です。

補足として、これらの他の回答のほとんどは、既存のソリューションを使用するように指示しています...割り当てで指示されない限り、そうしないでください。問題全体を自分で処理する場合は、問題とそれを解決するためのさまざまな方法を理解する方がはるかに優れています (これが唯一の/最良の方法ではありません)。教師が、ソリューションを実装するために選択した製品でサポートされていないことをするように求められた場合、それを修正することはできません. 自分で書いたばかりであれば、新しい仕様にも同じように簡単に実装できます。

于 2009-11-20T19:25:58.620 に答える