現在、長い列を短い列に分割するアプリケーションに取り組んでいます。そのために、テキスト全体を単語に分割しましたが、現時点では正規表現も数字を分割しています。
私がすることはこれです:
str = "This is a long string with some numbers [125.000,55 and 140.000] and an end. This is another sentence.";
sentences = str.replace(/\.+/g,'.|').replace(/\?/g,'?|').replace(/\!/g,'!|').split("|");
結果は次のとおりです。
Array [
"This is a long string with some numbers [125.",
"000,55 and 140.",
"000] and an end.",
" This is another sentence."
]
望ましい結果は次のようになります。
Array [
"This is a long string with some numbers [125.000, 140.000] and an end.",
"This is another sentence"
]
これを実現するには、どのように正規表現を変更する必要がありますか? 遭遇する可能性のある問題に注意する必要がありますか? ". "
または、 、 、"? "
およびを検索するだけで十分でしょ"! "
うか?