1

構築を計画している Web サイトのコンテンツの要約を検討しています。コンテンツのページやページの代わりに、各トピックの要約を提供したいと思います.

これを行う方法についていくつかのアイデアに出会いました。これは主に、最も一般的な単語を見つけて短い形式を書くことに関係しています。これは役に立ちます。1 文字少なくても大きな違いがあります。

誰か提案をしたり、正しいアルゴリズムの適切な情報源を教えてくれたりしてくれませんか? 自分でアルゴリズムを開発しなければならないことはわかっていますが、開始する前にいくつかの調査を行っています。

4

1 に答える 1

0

これは、さまざまな要約アプローチの概要をよく示していると思います: http://en.wikipedia.org/wiki/Automatic_summarization

NLTK ツールキットも出発点として非常に役立つはずです: http://nltk.org/であり、サマライザーの構築に使用されています (例: https://github.com/amsqr/NaiveSumm)。

于 2013-04-27T08:53:07.140 に答える