regex - 正規表現エンジン dk.brics.automaton で Unicode を使用できますか?

Question

正規表現で Unicode を使用したいと考えています。

たとえば、RegExp="\u0061" は "a" に一致します。しかし、dk.brics.automaton はこれをサポートしていないようです。「u0061」と一致することがわかりました。RegExp="\u0061" と RegExp="\\u0061" も試しました。どれもうまくいきません。

このツールを使用した経験がある場合は、解決策を教えてください。

ありがとう！

score 1 · Accepted Answer

最後に、この問題を回避する方法を見つけました。

まず、Java コードで Unicode を使用できますが、個別に作成する必要があります。例: String str = "\u0061"+"b";WhileString str = "\u0061b";はうまく機能しません。

次に、" " を含む test.txt などのテキストファイルから文字列を読み取りたい場合は、\u0061b\u0063(私の知る限り) Unicode を対応する記号に手動で置き換える必要があります。String str次に、値「abc」で取得できます。

score 0 · Accepted Answer

私はdk.brics.automatonの経験はありませんが、 FAQとRegExp Class の JavaDoc にすべてが書かれていると思います。

\u0061私が理解しているように、ユニコード文字を使用できますが、表記法ではなく文字 (「a」) として表現する必要があります。

regex - 正規表現エンジン dk.brics.automaton で Unicode を使用できますか?

2 に答える 2

Related

Reference