20

これまでに利用可能なヘッドレス ブラウザーについて調査したところ、HtmlUnit がかなり広く使用されていることがわかりました。HtmlUnit と比較して有利な HtmlUnit の代替手段はありますか?

ありがとうネイン

4

6 に答える 6

7

私の知る限り、HtmlUnit` は最も強力なヘッドレス ブラウザです。

あなたはそれについて何を問題にしていますか?

于 2010-11-23T09:48:26.440 に答える
5

これに使用できるライブラリは他にもたくさんあります。

  • xml ベース データをスクレイピングする必要がある場合は、JTidyを使用します。
  • HTML から特定のデータをスクレイピングする必要がある場合は、Jsoupを使用できます。

私は jsoup を使用しています。他のどの API よりもかなり高速です。

于 2012-11-13T07:27:20.980 に答える
4

仮想フレームバッファを備えた WebDriver が唯一の現実的な代替手段です。利点は、実際のブラウザーを使用することです。不利な点は、セットアップが面倒なことと、API がはるかに貧弱であることです。

于 2010-11-23T09:51:07.597 に答える
3

HtmlUnit と比較して、実際のブラウザーを使用でき、実際の世界でレンダリングされるものから逸脱しないため、ユース ケースには Selenium を使用します。WebDriver と統合され、優れた API とクールな修正を提供する Selenium2 を使用する予定です。ありがとうネイン

于 2010-11-30T08:29:12.493 に答える
2

セレンもお勧めします。優れた機能は、各ステップで何が起こっているかを確認できるブラウザページを開くクライアントを作成できることです。さらに、自動テスト用のマクロを作成することも優れた機能です。ただし、Webページから一部の情報を廃棄する必要がある場合は、HtmlUnitの方がセレンよりも優れています。

于 2011-08-16T21:24:37.150 に答える
2

Qt の Python バインディングを使用して、ヘッドレス ブラウザーとして Webkit を使用します

Webkit は、Chrome と Safari で使用されるレンダリング エンジンであり、非常に柔軟です。

HtmlUnit よりもこれを選択した理由の 1 つは、セットアップの容易さです。

sudo apt-get install python-qt4
于 2010-11-29T23:54:34.220 に答える