2

Webページから(HTMLを削除したテキストだけでなく)文章を抽出したいと思います。そのような機能は、Jsoupなどの一般的なHTML解析ライブラリでサポートされているのでしょうか。

ありがとう、

編集

投稿が明確でない場合は申し訳ありません。自然言語の文章が必要なので、必ずしもドットで区切る必要はありません。

みんな、ありがとう。このライブラリhttp://alias-i.com/lingpipe/demos/tutorial/sentences/read-me.htmlを見つけたところ、まさに私が欲しいもののようです。

4

2 に答える 2

1

JSoup要するに、抽出操作に非常に便利APIな機能を提供します...はい、この機能を提供します... data

于 2012-09-21T12:18:56.083 に答える
-1

そのためにjqueryを使用できます

var t = $('p').text();
var sentences = t.split('.');

于 2012-09-21T12:22:46.020 に答える