-1

私は現在Androidアプリケーションを作成しようとしていますが、それを完了するにはJSOUPを使用する必要があるという結論に達しました。JSOUPを使用してインターネットからデータを抽出し、アプリに投稿しています。

私が理解しようとしているのは、URLから複数のデータを抽出し、それぞれを独自のXML文字列TextView内で使用する方法です(それが正しい場合は?)

これが私が抽出しようとしているHTMLの断片です。


a href = "http://www.campusdish.com/en-US/CSMA/OldDominion/Locations/rda.aspx?RCN=m12296&MI=122&RN=BACoN TURKEY SLICED" OnCick = "javascript:NewWindow('http:// www.campusdish.com/en-US/CSMA/OldDominion/Locations/rda.aspx?RCN=m12296&MI=122&RN=BACON TURKEY SLICED'、' RDA_window'、' width = 450、height = 600、scrollbars = no、toolbar = no、directorys = no、status = no、menubar = no、copyhistory = no'); return false "Class =" recipeLink "> BACON TURKEY SLICED


BACONTURKEYSLICEDという単語を抽出しようとしています

問題は、JSOUPがまったくわからないことです。私はそれについての考えを持っているように、しかし私はそれとそのすべてを実際に使うことができないようです。誰かが私に正しい方向へのプッシュを試みてくれるかどうか疑問に思いました。

また、私は料理本を読んでみました。

誰か助けてくれたらどうもありがとう!

編集

もう2つあります。それらはまったく同じものだと思います。

a href = "http://www.campusdish.com/en-US/CSMA/OldDominion/Locations/rda.aspx?RCN=m4903&MI=122&RN=STATION OMELET" OnClick = "javascript:NewWindow('http:// www .campusdish.com / en-US / CSMA / OldDominion / Locations / rda.aspx?RCN = m4903&MI = 122&RN = STATION OMELET'、' RDA_window'、' width = 450、height = 600、scrollbars = no、toolbar = no、 directorys = no、status = no、menubar = no、copyhistory = no'); return false "Class =" recipeLink "> STATION OMELET

a href = "http://www.campusdish.com/en-US/CSMA/OldDominion/Locations/rda.aspx?RCN=m784&MI=122&RN=CEREAL HOT GRITS" OnClick = "javascript:NewWindow('http:// www.campusdish.com/en-US/CSMA/OldDominion/Locations/rda.aspx?RCN=m784&MI=122&RN=CEREAL HOT GRITS'、' RDA_window'、' width = 450、height = 600、scrollbars = no、toolbar = no、directorys = no、status = no、menubar = no、copyhistory = no'); return false "Class =" recipeLink "> CEREAL HOT GRITS

4

1 に答える 1

0

したがって、この回答は、あなたが次のことに興味があることを前提としています。

  • <ahref="..">必要なテキスト</a>
  • これらすべての<a>タグには、style属性「recipeLink」があります。

あなたの例を考えると、ここでは文字列として:

String tastyTurkeySandwich= "<a href=\"http://www.campusdish.com/en-US/CSMA/OldDominion/Locations/rda.aspx?RCN=m12296&amp;MI=122&amp;RN=BACoN  TURKEY  SLICED\" OnCick=\"javascript: NewWindow('http://www.campusdish.com/en-US/CSMA/OldDominion/Locations/rda.aspx?RCN=m12296&amp;MI=122&amp;RN=BACON  TURKEY  SLICED', 'RDA_window',  'width=450, height=600, scrollbars=no, toolbar=no,  directories=no, status=no, menubar=no, copyhistory=no');return false\" Class=\"recipeLink\">BACON  TURKEY  SLICED</a>";

次のコードを使用して(最初の)テキストを抽出できます。

Document doc = Jsoup.parse(tastyTurkeySandwich);
Elements links = doc.select("a[href].recipeLink");
// This will just print the text in the first one
System.out.println(links.first().text());

Elements(インターフェースを実装するIterable)インスタンスを反復処理するには、次のようにします。

for (Element link : links) {
    // Calling link.text() will return BACON TURKEY SLICED etc. etc.
    System.out.println(link.text());
}

要するに:

  1. a[href]href属性を持つすべての<a>タグに一致します。
  2. パーツは.recipeLinkその選択をフィルタリングして、recipeLinkスタイルのリンクのみを含めます。
于 2012-06-27T13:46:42.093 に答える