perl - HTML DOMツリーを視覚化/きれいに印刷するにはどうすればよいですか？

Question

IDにアクセスしてWWW::Mechanizeを介してWebページをナビゲートし、HTML :: TreeBuilder :: XPathを介して情報を取得できるようになったので、 Firebugを使用してDOMを読み取り、HTMLツリーのレイアウトを検出します。Mechanizeがキャプチャするコンテンツは、構造化されていないHTMLであり、人間の目には適していません。

Firebugを使用して、一般的なアプローチの後に私がいるIDを確認していますか？IDを取得したら、準備は完了です。追跡するIDがいくつかあるページがいくつかあり、DOMのフォーマットされたレイアウトを取得（ダンプ、印刷など）したいと思っていました。その発見を容易にするために。当然のことながら、Firebugを使用すると非常に簡単になります。もっと簡単な方法がないのではないかと思っています。

PerlMonksでクロスポストされました。

score 3 · Accepted Answer

テキストが必要な場合は、xmllint --html --format（libxml2に付属しています）まともな仕事をします。

ツリーが必要で、それをいじってGUIでさまざまな表現をテストしたい場合は、Xacobeoが新しい親友です。

Xacobeoのスクリーンショット

注：これらのツールはどちらもlibxmlに依存しているため、互換性を保つためにHTML :: TreeBuilder::XPathをHTML::TreeBuilder::LibXMLに置き換えてください。XPathの評価も、その方法で高速になります。

Javascript / JQueryを知っている場合は、FireQueryもインストールしてください。次に、FireBugでCSS式をテストし、Web::QueryなどのCSS式を介してHTMLを選択するモジュールでそれらを使用できます。

FireQueryのスクリーンショット

score 0 · Accepted Answer

XPathでの最近の開発にはOxygenIDEのXMLDeveloperを使用しています。http ：//www.oxygenxml.com/download.html これは30日間の試用版のツールですが、XPathビジュアライザーを検索することもできます。

私の知る限り、それはあなたのために木を視覚化しません（多分それをしているパネルがあるでしょう）。しかし、それはあなたにあなたがいつでもどんなノードを利用できるかを知るのを助けるいくつかのスマートな完全な機能をあなたに与えます。パーサーピボットが実際にどこを指しているのかを知るのは難しいため、XPathにとってはかなり大きなものです。

perl - HTML DOMツリーを視覚化/きれいに印刷するにはどうすればよいですか？

2 に答える 2

Related

Reference