0

プロジェクトのためにフランスの裁判例をスクレイピングする必要がありますが、裁判所の検索エンジンを Java でナビゲートする方法がわかりません。

操作する必要がある検索ページは次のとおりです。結果ページのスクレイピングを開始したいのですが、URL だけでは Java からそのページにアクセスできません。日付パラメーター (2003 年 1 月 1 日 - 2003 年 6 月 30 日) に基づいて Java がサーバーに検索を実行するように命令する何らかの方法が必要です。その後、接続先の URL を操作するだけでショーを実行できます。 .

助言がありますか?

4

1 に答える 1

1

まず、サイトの利用規約でこれが許可されていることを確認してください。

データを送信して結果を取得するには、httpclient投稿を使用します。ページのフォームを参照し、エミュレートする必要がある変数を見つけて、httpclient で送信します。探している結果が返されるはずです。また、このページには多くの JavaScript が含まれているため、フォームを送信せずにページを更新するために ajax 呼び出しを行っている可能性がありますが、同じ結果が得られる可能性があります。

「 fiddler 」などをいつでもインストールして、ページが送信している http トラフィックを監視し、httpclient を使用してそれをエミュレートできます。

于 2010-08-16T17:18:03.280 に答える