2

正規表現で Unicode を使用したいと考えています。

たとえば、RegExp="\u0061" は "a" に一致します。しかし、dk.brics.automaton はこれをサポートしていないようです。「u0061」と​​一致することがわかりました。RegExp="\u0061" と RegExp="\\u0061" も試しました。どれもうまくいきません。

このツールを使用した経験がある場合は、解決策を教えてください。

ありがとう!

4

2 に答える 2

1

最後に、この問題を回避する方法を見つけました。

まず、Java コードで Unicode を使用できますが、個別に作成する必要があります。例: String str = "\u0061"+"b";WhileString str = "\u0061b";はうまく機能しません。

次に、" " を含む test.txt などのテキスト ファイルから文字列を読み取りたい場合は、\u0061b\u0063(私の知る限り) Unicode を対応する記号に手動で置き換える必要があります。String str次に、値「abc」で取得できます。

于 2012-04-08T22:00:11.650 に答える
0

私はdk.brics.automatonの経験はありませんが、 FAQRegExp Class の JavaDoc にすべてが書かれていると思います。

\u0061私が理解しているように、ユニコード文字を使用できますが、表記法ではなく文字 (「a」) として表現する必要があります。

于 2012-04-05T12:15:07.193 に答える