9

現在、特定のトピック/アイデアがテキストの本文で言及されていることを検出できると非常に便利なプロジェクトに取り組んでいます。たとえば、テキストに次のものが含まれているとします。

ジョーンズ氏についてもう少し教えていただければ助かります。彼の外見の説明、または写真があればそれも役に立ちますか?

その人がジョーンズ氏の写真を要求したことを検出できれば素晴らしいことです。私は非常に素朴なアプローチを取り、「写真」または「写真」という単語を探すだけで済みますが、次のように書いた場合、これは明らかに良くありません。

ジョーンズさんの写真を送らないでください。

どこから始めればよいか知っている人はいますか?それは可能ですか?

私は nltk のようなものを調べましたが、誰かが同様のことをしている例をまだ見つけておらず、この種の分析が何と呼ばれているのかまだ完全にはわかりません. 私を地面から離すことができるどんな助けも素晴らしいでしょう.

ありがとう!

4

3 に答える 3

3

あなたにとって役立つかもしれない最高のものは、自動感情分析です。これは、たとえば、カスタマー レビューが肯定的か否定的かを判断するために使用されます。利用可能なツールを直接紹介することはできませんが、これはあなたが探しているものです。

ただし、これは自然言語処理における現在のホットなトピックであり、カンファレンスで多くの論文を見てきました。これは間違いなく非常に複雑な問題であり、ゼロから始める場合、必要な結果が得られるまでにかなりの時間がかかる可能性があります。

于 2010-05-23T18:53:40.380 に答える
1

あなたが取り組む問題は非常にやりがいがあります。

最初にテキスト内のエンティティを特定することから始めます (名前付きエンティティの認識と呼ばれる問題、ググってください)。次に、概念を特定しようとします。

テキストが何であるかを大まかに特定したい場合は、まずWordNetを使用し、階層内の単語とその場所に従って、関連する概念を特定することをお勧めします. 真の知性を示すシステムを作成したい場合は、文を FOL 文に変換できる CYC (OpenCYC) などのリソースについて調査を開始する必要があります。

この筋金入りの AI は、問題を解決するためのアプローチです。単純なチャット ボットの場合は、単純な統計手法に頼るほうが簡単です。

幸運を

于 2010-05-24T14:09:01.783 に答える
1

NLTK は自然言語を解析するための悪いフレームワークではありませんが、これは簡単なことではないことに注意してください。このようなことをすることは、本当に研究レベルのプログラミングです。

ドメインが非常に限られている場合、たとえばアプリケーションが有名な作家に関する情報に焦点を当てている場合、特定の種類のあいまいさなどの自然言語の複雑さを回避できます。

どこから始めれば?良い質問。このトピックに関するチュートリアルは知りません (Google オプションを試したことがあると思います) が、iTunes U にはこのトピックに関するコースがあると思います。そうでない場合は、私が行ったコースへのリンクを投稿できますが、これは主題に言及しており、完全に恐ろしいものではありませんでした: http://www.inf.ed.ac.uk/teaching/courses/inf2a/lecturematerials/index.html #講義01

于 2010-05-17T22:46:09.437 に答える