記事のリスト(マークダウンで書かれている)に表示するために、基本的にブログエントリの最初のいくつかの文/段落である要約を自動的に生成する方法を探しています。現在、私は次のようなことをしています:
def abstract(article, paras=3):
return '\n'.join(article.split('\n')[0:paras])
最初の数行分のテキストを取得するだけですが、結果には完全に満足していません.
私が本当に探しているのは、エントリのリストに表示する書式設定されたテキストの画面全体の約 1/3 で終わることですが、上記のアルゴリズムを使用すると、引き出された量は非常にさまざまな量になります。より理想的なサイズのアブストラクトと混同されることがよくあります。
こういうのが得意な図書館ってありますか?そうでない場合、出力を改善するための提案はありますか?