JSoup には次の問題があります。
次のhtmlコードを解析して変更したい:
<code>
<style type="text/css" media="all">
@import url("http://hakkon-aetterni.at/modules/system/system.base.css?ll3lgd");
@import url("http://hakkon-aetterni.at/modules/system/system.menus.css?ll3lgd");
@import url("http://hakkon-aetterni.at/modules/system/system.messages.css?ll3lgd");
@import url("http://hakkon-aetterni.at/modules/system/system.theme.css?ll3lgd");
</style>
</code>
私はそれを達成するために次のコードを使用しています:
Elements cssImports= doc.select("style");
for (Element src : cssImports) {
String regex ="url\\(\"(.)*\"\\)";
String data =src.data();
String link;
Pattern p = Pattern.compile(regex);
Matcher m = p.matcher(data);
while (m.find()){
link=m.group().substring(5,m.group().length()-2);
doc=Jsoup.parse(doc.html().replace(link, ""));
}
}
まず、それは機能します。すべてのインポート URL は文字列 " " に置き換えられFOUNDます。私が抱えている問題は、最後の import ステートメントとクローズされた</style>Tag の間に新しい行がたくさんあることです。
なぜこれが起こっているのか、どうすれば回避できるのか手がかりはありますか?
フォーマットが悪くて申し訳ありませんが、コードの一部が投稿時に削除されているようです。最初のコードブロックを囲むスタイルタグがあります...