0

私は JSoup の新規ユーザーです。hrefhtml から値を抽出したい。

例えば:

 String html = "<p>An <a href='http://exa'mple.com'><b>example</b></a> link.</p>";
 Document doc = Jsoup.parse(html);
 Element link = doc.select("a").first();
 String linkHref = link.attr("href"); 

として出力を取得していますが、 (href の生のテキスト)"http://exa"としての出力が必要です。いくつかの異なるテキストを提供しています。"http://exa'mple.com"link.outerHtml()

HTML を変更することはできません。HTML はユーザーの入力です。

4

2 に答える 2

0

これを試して:

String html = "<p>An <a href='http://exa%27mple.com'><b>example</b></a> link.</p>";

于 2012-11-14T23:37:49.543 に答える
0

jsoupパーサーがhref引数を閉じるために ' を期待していることを考えると、これがどのように可能になるかわかりません。唯一のオプションは、ユーザーが提供した文字列を事前に解析することだと思いますが、「正しい」引用符と「正しくない」引用符を区別するルールを考え出す必要があるため、それでも難しいでしょう。

于 2012-11-14T23:44:59.850 に答える