2 つの XML の違いを視覚化できる Web ツールを作成しようとしています。difflib
違いのある html を作成する際にかなりうまく機能していましたが、一部の Unicode テキストが XML に表示され、結果の html には html でエンコードされた文字が含まれるようになりました。
この問題に対する他のアプローチはありますか?
気になるのは、対応する数値ではなく、 「html文字エンティティ」であると思います。たとえば、正規表現 (sed など) をサポートするお気に入りの cli ツールや、Unicode e-workersのテーブルまたはリファレンス. 数値エンティティのエンコーディングは、html ファイルと xml ファイルで同様に使用できます。
よろしく、カルテン