1

正規表現を使用して特定のパターンに一致させ、パターン全体を削除しようとしています。例: 「≺任意のテキストをここに残す≻その他のテキスト」

この「Leave Other test」のように終わる必要があります。Unicode を使用するようにスクリプトを変換しましたが、リスト内の文字列が見つかりません。

私はリテラル値に基づいてそれを呼び出そうとしましたが、それは16進代替でもあります(シンボルの正確な16進コード、utf-8シンボルを見つけるために16進エディタを使用して見つかりました)。

「≻」は「>」と同じではないことに注意してください。

試した:

eleInfo = "Leave ≺random text here≻Other text"

eleInfo = re.sub("≺.*?≻","",eleInfo)

試した:

eleInfo = "Leave ≺random text here≻Other text"

eleInfo = re.sub("\x89\xBA.*?\x89\xBB","",eleInfo)

試した:

eleInfo = "Leave ≺random text here≻Other text"

eleInfo = re.sub("\\x89\\xBA.*?\\x89\\xBB","",eleInfo)

どんな助けやアイデアも大歓迎です!

4

1 に答える 1

0

\xe2が欠落しているようです。以下の作品:

re.sub("\\xe2\\x89\\xba.*\\xe2\\x89\\xbb","",eleInfo)

さらに、文字列をユニコードに変換できます

eleInfo = unicode("Leave ≺random text here≻Other text")

re.sub(u"[\u227a].*[\u227b]","",eleInfo) works too.
于 2013-07-27T01:38:55.213 に答える