1

段落が与えられたら、それを文に分割したいと思います。現時点では、私は単にこれをやっています:

var sentences = paragraph.split('.');

ほとんどの場合は機能しますが、次のような文が与えられると失敗し始めます。

アラスカはアメリカ最大の州

ピリオドがあるためU.S.、構文解析しSて文になります。

段落内の文を決定する最良の方法は何ですか? 大文字の前の最後のピリオドに基づいてそれらを解析することを考えましたが、段落が適切に入力されていない場合 (ピリオドの後の小文字) も失敗します。

4

1 に答える 1

0

最初に、空白で分割して段落を単語にトークン化します。次に、ピリオド、疑問符、感嘆符で終わる単語を探して、文を再構成します。ピリオドで終わる場合は、単語に複数のピリオドが含まれているかどうかを確認します。含まれている場合は、省略形であり、文の終わりではありません。

于 2013-05-26T18:21:05.380 に答える