0

私は(元)同僚が数年前にJaxerで書いた古いツールを持っていて、それを交換/書き直したいと思っています。

Jaxerは、ヘッドレスのMozilla / Gecko-Browserに基づく(放棄された)サーバー側フレームワークであり、JavaScriptとDOMサーバー側を使用できます。

Jaxerが廃止され、新しいコンピューターでJaxerを使用してAptana Studio 1.5をインストールして実行するのに大きな問題があるため、新しいバージョンのベースとなるライブラリ/フレームワーク/何かを探しています。

このツールは、Aptana Studio(JaxerのIDE)内でのみローカルで実行され、実際のWebアプリを意図したものではありません。サーバー側のMozillaにページごとにロードすることで、顧客のWebサイトをクロールします。これを行うために、jQueryと事前定義されたCSSセレクターを使用して、メニュー内のリンクを検索し、ページから他の情報を解析します。最終的な結果は、基本的に栄光のサイトマップです。

可能であればこのmodusオペランドを維持し、jQuery / JavaScript / DOMを使用してページをロードおよび解析/アクセスし続けたいと思いますが、Javaなどの別の言語に基づくフレームワークでラップすることができます。自分でGeckoをベースにしたものを書くことを考えましたが、それは少しやり過ぎのように思われるので、他の提案を受け付けています。

4

1 に答える 1

1

HTMLのクロール/解析に関する限り:http: //ccil.org/~cowan/XML/tagsoup/

また

http://jsoup.org/

于 2012-02-21T12:26:38.143 に答える