Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
文を単語と特殊文字に分割したい。以下の正規表現を使用しています。
@"((\b[^\s]+\b)((?<=\.\w).)?)
ただし、単語のみが返され、スペースで区切られたハイフンやコロンなどの特殊文字は返されません。
理想的には、文について:
"たった今!" 彼女は大声で叫び、両手が宙に舞いました - いくつかの歓声の中で - 約2分間。
私は取得する必要があります:
右 今 彼女 叫んだ と 手 はためいた の の 空気 - 真ん中 a 少し 乾杯 - 為に 約 2 分
おそらく、次のようなパターンで分割します。
@"\s+(?:\p{P}(?!\s))?|\b\p{P}+\s*"