jqueryを使用して、テキストの段落を文に分割しようとしています。ただし、文が間違って分割される場合がいくつかありました。
以下のような場合
私の答えは 5.6 の答えが間違っていました。
上記の場合、スペースがないと 2 つの文を分割できません。
現在、私がやっている方法は、期間のインデックスを見つけることだけですが、うまくいきません。正規表現の一致方法を使用してそれを行う方法はありますか?
前もって感謝します!
文の分割は、例外に満ちた問題です。このことを考慮:
それらは不機嫌氏にとって暗い時期であり、彼は適切にチェックされました.
ほとんどの人は、ピリオドの後にいくつかのスペースがあり、頭字語として知られている特殊な単語が前にないものを探しますMr
。
(?<!Mr|Mrs|Dr)\.\s+
次にsplit
これについて。
ランダムなイニシャルを考慮していないため、これでさえそれほど素晴らしいものではありませんJames T. Kirk
。それを許可しない場合 ((?<!Mr|Mrs|^[A-Z]|\s[A-Z])
後読みで)、1 文字で終わる文 ( Look at exhibit B.
) を防ぐことはできません。
難しい。
'.'
次のスペースを確認できます。このような:
var paragraph = 'se tenc one. se tenc two. se tenc 5.6 one. ';
var sentenses = paragraph.split(/\.[ ]+/g);
alert(sentenses);
表示されますse tenc one,se tenc two,se tenc 5.6 one,
。
のような他の文末文字を追加できるようになり'!?;'
ました。
var paragraph = 'se tenc one. se tenc two. se tenc 5.6 one. ';
var sentenses = paragraph.split(/[\.!?;][ ]+/g);
alert(sentenses);