0

各レコードの一部として電子メール アドレスを含む XML ファイルがあります。メールアドレスを(プライバシーのために)隠したいのですが、同じメールアドレスから複数のメールアドレスがある場合にレコードを組み合わせること(この場合は購入)を可能にするために、それらの「一意性」も保持したいと思います。

正規表現を使用して「@」の前後の文字を * などに置き換える方法があるかもしれないと考えました。前後に 3 文字または 4 文字あると、プライバシーが保護され、(ほとんどの場合) 「一意性」が維持されると考えられます。

これを行うための最良の方法に関する提案(私が考えているものとはまったく異なるオプションを含む)?

ありがとう。

4

1 に答える 1

1

正規表現は次のようになります: ([^@]{1,4})@(.{1,4}) @ の前後に最大 4 文字を取得します。

置換を行う方法は、言語とファイルのロード方法によって異なります。プログラムの途中ではなく、Ultra Edit などのテキスト エディターでこれを 1 回だけ行う場合は、次のようにします。

Replace all [^@>]@[^<] with *@*
Replace all [^@>]{2}@[^<]{2} with **@**
Replace all [^@>]{3}@[^<]{3} with ***@***
Replace all [^@>]{4}@[^<]{4} with ****@****

そうすれば、短いメールアドレスでも何かを行うことができます. (xml タグを含めないように微調整)

于 2013-10-30T02:22:05.910 に答える