8

私はEEのバックグラウンドを持っていますが、自然言語処理のクラスに参加する機会がありませんでした。

トルコ語の感情分析ツールを作りたいです。テキストを英語に翻訳し、提供されたツールを使用してバグのある翻訳されたテキストで分析するよりも、トルコ語のワードネットデータベースを作成するのが最善だと思います。(そうですか?

それで、あなたたちは私に何をするように勧めますか?まず、オープンクラスのウェブサイトからNLPクラスを受講しますか?どこから始めたらいいのかわからない。私を助けてくれませんか、そして多分私にステップバイステップガイドを提供してくれませんか?これは学術的なプロジェクトであることは知っていますが、その分野の趣味としてスキルを身に付けることに興味があります。

前もって感謝します。

4

1 に答える 1

6

これが私が以前に使用したプロセスです(日本語、中国語、ドイツ語、アラビア語のセマンティックネットワークを作成します):

  1. 少なくとも2つの英語/トルコ語辞書を収集します。それらは、互いに派生するのではなく、独立している必要があります。ウィキペディアを使用して、辞書の1つを自動生成できます。ネットワークを公開する必要がある場合は、オープンソースの辞書、ライセンス料、または弁護士が必要になる場合があります。
  2. これらの辞書を使用して英語のWordnetを翻訳し、各シンセットの信頼度を作成します。
  3. 自信を持ってそれらを維持し、中程度または低い自信を持っているものを手動で承認または修正します。
  4. 手動で終了します

これについては、2008年の論文の「WordNetの自動翻訳」セクションで詳しく説明しました。http://dcook.org/mlsn/about/papers/nlp2008.MLSN_A_Multilingual_Semantic_Network.pdf

(トルコの感情辞書の目標については、セマンティックネットワークを含まない他のアプローチがあります。たとえば、BingLiuによる「SemanticAnalysisand Opinion Mining」は、研究の良いまとめです。しかし、セマンティックネットワークアプローチは、IMHOは、長期的には常により良い結果をもたらし、他にも多くの用途があります。)

于 2013-11-06T04:01:27.217 に答える