テキスト行を単語に分割する必要があり、使用する正規表現について混乱しています。私はどこでも単語に一致する正規表現を探し、この投稿に似た正規表現を見つけましたが、Javaでそれを望んでいます(Javaは通常の文字列で\を処理しません)。
私は各回答に対して正規表現を試しましたが、これのために Java の正規表現を構築する方法がわかりません (すべての正規表現が同じであると仮定しました)。私が見る正規表現で \ を \ に置き換えると、正規表現は機能しません。
私も自分で調べてみましたが、このページに来ました: http://www.regular-expressions.info/reference.html
しかし、正規表現の高度なテクニックに頭を悩ませることはできません。
String.split(ここでは正規表現文字列) を使用して文字列を分離しています。たとえば、「私は食べるのが好きですが、みんなの食べ物を食べるのは好きではありません。そうしないと、彼らは飢えてしまいます。」一致させたい:
I
like
to
eat
but
I
don't
like
to
eat
everyone's
food
or
they'll
starve
また、'' または '''' または ' ' または '.'' またはその他の順列に一致させたくありません。私のデリミタ条件は次のようにする必要があります:[任意の単語文字に一致][単語文字が前にある場合はアポストロフィにも一致し、その後に単語文字がある場合は一致します]
私が得たのは単語 [\w] に一致する単純な正規表現ですが、先読みまたは後読みを使用してアポストロフィと残りの単語を一致させる方法がわかりません。