hereに示すように、特定の日付に対応する記事のリスト (タイトルと URL リンク) をプログラムで (Java で) 抽出しようとしています。
結果は次のようになります。
Thursday, January 31, 2013
- Dollar Curbs Tumble Despite....
- http://finance.yahoo.com/news/dollar-curbs-tumble-despite-gdp-051100047.html
Wednesday, January 30,2013
- [video] Santelli's Midday Bond Report
- http://us.rd.yahoo.com/finance/external/video/cnbc/SIG=110mfa5qs/*http://video.cnbc.com/gallery/?video=3000144631&__source=yahoo%7Cheadline%7Cquote%7Cvideo%7C&par=yahoo
したがって、示されているように、特定の日付について、HtmlUnit を使用してすべてのタイトル/リンクを抽出しようとしています。
問題は、HTML/DOM に関する私の知識は、この些細なタスクに対して非常に限られていることです。これを手伝ってくれる人や、正しい方向に向けてくれる人の助けをいただければ幸いです。
ありがとうございました。
編集: ページを調べると、探しているタグが「h3」タグと「ul」タグが交互に含まれているように見えます。これらのタグにアクセスしてトラバースする方法がわかりません..