Webページから(HTMLを削除したテキストだけでなく)文章を抽出したいと思います。そのような機能は、Jsoupなどの一般的なHTML解析ライブラリでサポートされているのでしょうか。
ありがとう、
編集:
投稿が明確でない場合は申し訳ありません。自然言語の文章が必要なので、必ずしもドットで区切る必要はありません。
みんな、ありがとう。このライブラリhttp://alias-i.com/lingpipe/demos/tutorial/sentences/read-me.htmlを見つけたところ、まさに私が欲しいもののようです。