GAE で使用できる良い解決策やヘッドレス ブラウザはありますか? 私は、アプリケーションがいくつかの Web ページを読み取り、それらを解析し、いくつかの統計を行う GAE 上のアプリケーションに取り組んでいます。HTMLUnit を GAE で動作させるための議論がここで行われていますが、とにかく動作するかどうかはわかりません。
1 に答える
1
HTML を取得するだけでよい (Javascript を実行しない) 場合は、jsoup.orgを参照してください。
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");
(jsoup から恥知らずにコピーされたサンプル コード)
于 2013-06-26T14:44:41.893 に答える