2

IDにアクセスしてWWW::Mechanizeを介してWebページをナビゲートし、HTML :: TreeBuilder :: XPathを介して情報を取得できるようになったので、 Firebugを使用してDOMを読み取り、HTMLツリーのレイアウトを検出します。Mechanizeがキャプチャするコンテンツは、構造化されていないHTMLであり、人間の目には適していません。

Firebugを使用して、一般的なアプローチの後に私がいるIDを確認していますか?IDを取得したら、準備は完了です。追跡するIDがいくつかあるページがいくつかあり、DOMのフォーマットされたレイアウトを取得(ダンプ、印刷など)したいと思っていました。その発見を容易にするために。当然のことながら、Firebugを使用すると非常に簡単になります。もっと簡単な方法がないのではないかと思っています。

PerlMonksでクロスポストされました。

4

2 に答える 2

3

テキストが必要な場合は、xmllint --html --format(libxml2に付属しています)まともな仕事をします。

ツリーが必要で、それをいじってGUIでさまざまな表現をテストしたい場合は、Xacobeoが新しい親友です。

Xacobeoのスクリーンショット

注:これらのツールはどちらもlibxmlに依存しているため、互換性を保つためにHTML :: TreeBuilder::XPathHTML::TreeBuilder::LibXMLに置き換えてください。XPathの評価も、その方法で高速になります。


Javascript / JQueryを知っている場合は、FireQueryもインストールしてください。次に、FireBugでCSS式をテストし、Web::QueryなどのCSS式を介してHTMLを選択するモジュールでそれらを使用できます。

FireQueryのスクリーンショット

于 2012-01-27T10:31:04.290 に答える
0

XPathでの最近の開発にはOxygenIDEのXMLDeveloperを使用しています 。http ://www.oxygenxml.com/download.html これは30日間の試用版のツールですが、XPathビジュアライザーを検索することもできます。

私の知る限り、それはあなたのために木を視覚化しません(多分それをしているパネルがあるでしょう)。しかし、それはあなたにあなたがいつでもどんなノードを利用できるかを知るのを助けるいくつかのスマートな完全な機能をあなたに与えます。パーサーピボットが実際にどこを指しているのかを知るのは難しいため、XPathにとってはかなり大きなものです。

于 2012-01-27T04:51:51.333 に答える