1

HTML::Entitiesドキュメントによると、 の 2 番目の引数encode_entities:

安全でない文字は、正規表現の文字クラス構文 (正規表現の括弧内にあるもの) を使用して指定されます。

エンコードするデフォルトの文字セットは、制御文字、上位ビット文字、および <、&、>、'、および " 文字です。

ただし、このページには、デフォルト セットの同等の引数の例は示されていません。後退せずに、安全でない文字のセットを微調整したいと思います。

開始点として使用できる «制御文字、上位ビット文字、および <、&、>、'、および "» に相当する正規表現文字クラスはどれですか?

4

2 に答える 2

1

これはデフォルトの置換正規表現のようです:

s/([^\n\r\t !\#\$%\(-;=?-~])/$char2entity{$1} || num_entity($1)/ge

https://metacpan.org/pod/HTML::エンティティ

于 2014-02-14T23:05:46.250 に答える