Owasp Anti samy と Ebay ポリシー ファイルを使用して、Web サイトへの XSS 攻撃を防ぎます。
また、Hibernate 検索を使用してオブジェクトのインデックスを作成しています。
このコードを使用すると:
String html = "special word: été";
// use the Ebay configuration file
Policy policy = Policy.getInstance(xssPolicyFile.getInputStream());
AntiSamy as = new AntiSamy();
CleanResults cr = as.scan(html, policy);
// result is now : "special word: été"
result = cr.getCleanHTML();
ご覧のとおり、すべての文字 "é" は HTML エンティティに相当する " é
"に変換されています。
私のページは UTF-8 なので、この変換は必要ありません。さらに、このテキストを Hibernate Search でインデックス化すると、単語が html エンティティでインデックス化されるため、インデックスで「été」という単語が見つかりません。
アンチサミーが特殊文字を同等の html エンティティに変換しないように強制するにはどうすればよいですか?
ありがとう
PS: 問題が開かれました: http://code.google.com/p/owaspantisamy/issues/detail?id=99