Jsoup (バージョン: 1.7.3) を使用して MHT ドキュメントを解析しようとしています。目標は、2 つのファイルを開き、それらをマージ (頭と体を結合) して 1 つの完全なファイルを取得することです。しかし、最初に、mht ファイルの解析で問題が発生しました。これは、解析結果に情報の大幅な遅れがあり、解析後に開くことができないためです。私がしたことは次のとおりです。
- Word を使用して mht ファイルを作成する (1 つの画像といくつかのテキストを含む)
- Jsoupを使用して文字列に解析します
- 文字列をファイルに書き込む
- ファイルを開くと、ファイルが壊れています
次のコードを使用しました。
private static final String USED_CHARSET = "windows-1252";
private static final String PATH = "C:\\Test\\";
private static final Charset CHARSET = Charset.forName(USED_CHARSET);
@Test
public void test() throws IOException {
Document doc = Jsoup.parse(new File(PATH, "sourceMht.mht"),
USED_CHARSET);
writeDoc(new File(PATH, "parsedMht.mht"), doc.html());
}
private void writeDoc(File file, String html) throws IOException {
Writer out = new BufferedWriter(new OutputStreamWriter(
new FileOutputStream(file), CHARSET));
try {
out.write(html);
} finally {
out.flush();
out.close();
}
}
ご協力いただきありがとうございます。