特定のツールで MS ヘルプに変換されている日本語のコンテンツがあります。問題は、サードパーティ ツールが utf-8 エンコーディングを使用しておらず、文字化けした .xml を作成していることです。
<param name="Name" value="ÉAÉvÉäÉPÅÉVÉáÉìdžÇ'ÇËÇØÅǵÇÃ'ÇÃ']">
<param name="Name" value="Test File">
<param name="Local" value="applications.htm#Xau1044547">
エンコーディングをいじってみましたが、次のようになります。
<param name="Name" value="ÉAÉvÉäÉPÅ">
<param name="Name" value="Test">
<param name="Local" value="applications.htm#Xau1044547">
ただし、utf-8 エンコーディング (別のツール) を使用すると、正しい出力は次のようになります。
<param name="Name" value="アプリケーション">
<param name="Name" value="Small Business アプリケーションの起動 ">
<param name="Local" value="applications1.html#wp1044548">
ファイルをデコードおよびエンコードして正しい出力を得るために使用できる Java API はありますか。ツールが何を使用しているのかはわかりませんが、「ISO-8859-1」と推測しています。
ありがとう。