0

私はあなたが文章を書くように、いくつかのテキストを解析してそれを図解しようとしています。私はNLTKを初めて使用し、これを達成するのに役立つ何かをNLTKで見つけようとしています。これまでのところ、私は見nltk.ne_chunkてきnltk.pos_tagました。私はそれらがあまり役に立たないことに気づき、良いオンラインドキュメントを見つけることができません。

私も使用しようとしましたがLancasterStemmer、それが何をするのか、どのように使用するのか、なぜ存在するのかを完全には理解していません。

誰かがこれを手伝ってくれませんか?私は本当に途方に暮れていて、ガイドライトなしでかなりイライラしています。

前もって感謝します

4

1 に答える 1

1

あなたが説明していることは実際には本当に難しい仕事です。結局のところ、あなたのプログラムが成功したか失敗したかは完全に主観的な尺度です。この場合、通常、問題を解決するためのプログラムを作成するのは難しいことを意味します。大学でこのような問題に取り組むことで報酬を得る人々がいます。

突き刺したい場合は、手動で解析して注釈を付けてから、解析ツリーを活用するのではなく、自動字句解析ツールで何らかの使用を試みることをお勧めします。通常、解析ツリーは構文解析、つまり文の構造を表します。一方、あなたはセマンティック分析、つまりそれが何を意味するのか、または少なくとも2つの文が類似しているか異なるか(実際には何かが意味するものよりも少し簡単です)に関心があります。

既製の自動要約ツールを調べることができます。これらは、テキストの一部にとってどれほど重要であるかによって文をスコアリングし、指定されたしきい値よりも重要でない文を除外しようとします。要約をマージする必要があるという問題がまだあるので、これが本当に役立つわけではありません。

于 2009-11-09T01:32:56.030 に答える