4

私は、ユーザーがブログ投稿を書くことを可能にする Web サイトを運営しています。私は、書かれた内容を要約して、<meta name="description".../>たとえば -tag を埋めるために使用したいと思っています。

ユーザー生成コンテンツの内容を自動的に要約/説明するには、どのような方法を使用できますか?
この問題を解決した (できれば無料の) メソッドはありますか?

(最初の 100 程度の単語をコピーするだけの Web サイトを見たことがありますが、これは次善の策だと思います。)

4

10 に答える 10

5

要約のタスクは、ドキュメントから「最も重要な文を選択する」という課題と考えてください。

HP Luhn によるThe Automatic Creation of Literature Abstracts (1958) で説明されている方法は、実際には非常にうまく機能する素朴な方法を説明しています。試してみてください。

Web サイトが Python である場合、 NLTK (自然言語ツールキット)を使用してこのアルゴリズムをコーディングするのは楽しい作業です。

于 2009-10-02T20:35:35.540 に答える
4

予測可能にします。

ユーザーの観点からは、最初の段落を使用することはまったく悪いことではありません。自動化を使用すると、場合によっては横ばいになります。したがって、最初の段落 (ある時点で切り捨てられる可能性があります) を要約として表示し、オプションのフィールドでそれをオーバーライドする機能を提供することをお勧めします。

于 2009-10-01T11:54:13.130 に答える
1

Yahooにはこのための無料のAPIがあります:http: //developer.yahoo.com/search/content/V1/termExtraction.html

于 2009-10-07T01:48:39.813 に答える
1

チェックアウトするもう 1 つの項目、SourceForge プロジェクト、AutoSummary Semantic Analysis Engine

于 2009-09-23T21:59:09.817 に答える
1

Apple の特許 6424362 - ドキュメント コンテンツの自動要約には、役立つサンプル コードが含まれています...

于 2009-10-07T05:40:41.957 に答える
1

機械的な Turk やその他のクラウドソーシングのオプションをいくつでも試してみることができます。

于 2009-09-23T21:40:55.513 に答える
1

些細な作業ではありません...「抽出要約」に関する記事や本を探す必要があります

いくつかのスターターは次のとおりです。

書籍:

記事:

于 2009-10-01T09:52:33.797 に答える
0

名詞句は通常、文の重要な要素になる傾向があります。名詞句が密集している文を選択すると、適切な要約が得られる可能性があります。POSタガーを使用して名詞句を取得できます。

良い要約のために、それは意味のある文であることが望ましいです。壊れた文章を読むのは少し耳障りです。

于 2009-10-07T05:22:40.730 に答える
0

これは人工知能に近いため、「簡単な」解決策はありませんが、この問題を対象とした製品があります.

Copernic Summarizer を確認してください。

于 2009-09-23T21:51:15.397 に答える
0

別の方法として、作成者が記事を投稿するときに、作成者は説明で使用できるキーワードを強調表示して、メタ説明タグに自動的に挿入することができます。

于 2009-10-07T05:43:21.047 に答える