0

以下は、リンクタグを解析しているURLです

http://www.mobileapp.pcmac.org/mobile/xml/sisapp.asp?sid=353&pn=news2

このURLのデータは

 <item>
      <title>DATA WAREHOUSE (Quick link and training information)</title>
      <category> News</category>
      <description></description>
      <pubDate>Tue, 1 Dec 2009 00:00 CST</pubDate>
      <enclosure url="" length="0" type="image/jpg" />
      **<link>http://www.mcpss.com?PN=&apos;News2&apos;&amp;SubP=&apos;DNewsStory&apos;&amp;gn=&amp;NewsID=17662&amp;ShowNav=&amp;StoryGroup=Current</link>**
    </item>

上記のデータからリンクタグを解析していますが、その値を以下のコードに入れようとすると、次の例外がスローされます: URL の取得中に HTTP エラーが発生しました

try {
           String website=list.get(0);
           Document doc = Jsoup.connect(website).get();
           Elements el=doc.getElementsByClass("header");
           Elements atr= doc.select("p span");
           String ss="";
           for(Element s:atr)
               ss+=s.text();
                String text=el.text();
                t1.setText(text);
                t2.setText(ss);
     } catch (Exception e) {
log.d("Error",e.getMessage());

              }

そのリンク値をハードコーディングすると、正常に機能します。この問題を解決するには助けが必要です。

4

1 に答える 1

0

まず、解析が正しく機能するかどうかを確認する必要があります。したがって、println などを使用してください。URL が確認された場合は、次のステップを実行できます。

ほとんどの問題はリダイレクトで発生します。

あなたの例では、解析されたリンクは次のようになります。

http://www.mcpss.com?PN=&apos;News2&apos;&amp;SubP=&apos;DNewsStory&apos;&amp;gn=&amp;NewsID=17662&amp;ShowNav=&amp;StoryGroup=Current

リダイレクトされる実際のサイトは次のとおりです。

http://www.mcpss.com/?PN=&apos;News2&apos;&amp;SubP=&apos;DNewsStory&apos;&amp;gn=&amp;NewsID=17662&amp;ShowNav=&amp;StoryGroup=Current

スラッシュが追加されていることがわかります。jsoup でその最終 URL に接続してみてください。それが機能する場合は、最初にすべてのリンクを解析し、jsoup で接続する前にスラッシュを追加する必要があります。ただし、該当する場合は、すべての URL に対して永続的なスキームにする必要があります。

それが役に立てば幸い

于 2013-01-23T07:54:10.260 に答える