編集:「r」フラグの意味を理解すると、この質問は本当に意味がありません。詳細はこちら。簡単な答えを探している人のために、以下に追加しました。
Python スクリプトで正規表現を手動で入力すると、パターン文字列に 4 つのフラグの組み合わせを使用できます。
- p1 =「パターン」
- p2 = u「パターン」
- p3 = r「パターン」
- p4 = ru「パターン」
Web フォーム入力からの Unicode 文字列がたくさんあり、それらを正規表現パターンとして使用したいと考えています。
上記の手動フォームの使用から同様の結果を期待できるように、文字列にどのプロセスを適用する必要があるかを知りたいです。何かのようなもの :
import re
assert re.match(p1, some_text) == re.match(someProcess1(web_input), some_text)
assert re.match(p2, some_text) == re.match(someProcess2(web_input), some_text)
assert re.match(p3, some_text) == re.match(someProcess3(web_input), some_text)
assert re.match(p4, some_text) == re.match(someProcess4(web_input), some_text)
someProcess1 から someProcessN とは何で、その理由は何ですか?
someProcess2 は何もする必要はないと思いますが、someProcess1 はローカルエンコーディングへのユニコード変換を行う必要があります。生の文字列リテラルについては、私にはわかりません。