必要なコンテンツが AJAX によって生成される Web ページでスクリーン スクレイピングを行う必要があります。最初のページには、4 つのタブを持つテーブルがあります。タブのいずれかをクリックすると、テーブルの内容が変わります。3 番目のタブのコンテンツのみが必要です。Google chrome の「Inspect Element」ツールを使用して、リクエストと投稿データが何であるかを確認しました。情報 (セッション ID と他の多くの Cookie データと投稿データ) を入力すると、必要な情報を取得できます。 inspect 要素は PHP curl リクエストになります。ただし、これはセッションが続く 30 分間のみ有効です。この情報を入手する方法を知っている人はいますか?
質問する
384 次
2 に答える
1
ここではコードを再現しませんが、答えを示します。それはこの本の中にあります:
http://www.amazon.com/Webbots-Spiders-Screen-Scrapers-Developing/dp/1593273975/ref=dp_ob_image_bk
あなたがしていることをしている人のために買う必要があります。
于 2012-12-05T09:44:52.007 に答える
0
最後に、必要なコンテンツを取得するために htmlunit を使用しました。また、必要な Java コードを生成するのに HTMLUnit Scripter が非常に役立つこともわかりました。
于 2013-01-03T17:03:54.643 に答える