私は自分の問題の解決策を見つけるのに苦労しましたが、それを共有できれば幸いです. 問題は次のとおりです。
私はテキストを持っています。それにはあらゆる種類の句読点が含まれている可能性があります。私はそれを2つの部分に分割したい:
- 最大Xワード
- ドットやコンマなどの最後の単語に付けられた句読点を含む
- テキストの終わり
- 2つの部分の間の間隔から始めます
ここではいくつかの例を示します。
str = "one two, three, quatro 5! : six sept ocho nine 10!"
splitAfterXWords(str, 2)
// ["one two,", "three, quatro 5! : six sept ocho nine 10!"]
splitAfterXWords(str, 5)
// ["one two, three, quatro 5!", " : six sept ocho nine 10!"]
splitAfterXWords(str, 20)
// ["one two, three, quatro 5! : six sept ocho nine 10!", ""]
splitAfterXWords(str, 6)
// ["one two, three, quatro 5! : six", " sept ocho nine 10!"]