アラビア語の音訳サービスから JSON 応答を受信しています。
Pattern
最初のステップとして、次を使用して音訳された単語を含む応答の一部だけを抽出しようとしました"\"r\":\"(\\P{M}\\p{M}*)*?\"");
。選択範囲全体を出力すると、応答のこの部分が正しく返されます。
"r":"تست\\\/0|طست\\\/1|تسة\\\/1|طسة\\\/1|تيست\\\/1|طاسة\\\/1|تيسة\\\/1|تصت\\\/2|تثت\\\/2|تسط\\\/2"
ただし、でグループ部分だけを取得しようとするとm.group(1)
、出力は2
. "r":"
との間のすべての単語部分を期待していました"
。
Eclipse でコンソール出力全体を選択しようとする"r":
と、それが LTR で、残りが RTL のように見えます。おそらくそれは正規表現を壊します。
"r":"
との間のグループ全体を取得するにはどうすればよい"
ですか?