ローカルの HTML ファイルを解析すると、jsoup はアンカー要素内の引用符を HTML を覆い隠す & に変更します。
次の HTML 部分で値「1」を「2」に変更したいとします。
<div class="pg2-txt1">
<a class="foo" appareantly_a_javascript_statement='{"targetId":"pg1-magn1", "ordinal":1}'>one</a>
</div>
私が得るものは次のとおりです。
<div class="pg2-txt1">
<a class="foo" appareantly_a_javascript_statement="{"targetId":"pg1-magn1", "ordinal":1}">two</a>
</div>
アンカー要素内の引用符が必要です。私のコードは次のようになります。
File input = new File("D:/javatest/page02.html");
Document doc = Jsoup.parse(input, "UTF-8");
Element div = doc.select("div.pg2-txt1").first(); //anchor element only identifyable by parent <div> class
div.child(0).text("one"); //actual anchor element
私は試した
doc.outputSettings().prettyPrint(false);
成功しませんでした。
jsoupでこれを達成できますか? 別のパーサーを使用する必要がありますか?それはどのように見えますか?
事前にどうもありがとうございました。