xpath - Web パーサー用に XPATH を自動的に書き込むツールは?

Question

現在、Web サイトからデータを抽出する必要があります。XPATHを使ってデータを抽出するHTML Agility Packを使ってみました。XPATH の書き込みを自動化して、初心者のユーザーでも XPATH を記述せずに解析ツールの構成を使用できるようにするツールはありますか。私のシナリオについて貴重な提案をしてください。

注: XPATH を記述するためのいくつかのツールを使用できますが、適切な形式の XML が必要ですが、私の場合、入力として不正な形式の HTML ドキュメントが使用されています。

score 3 · Accepted Answer

はい、そのようなツールがあります！

確かに、多くの Web ブラウザーに存在する組み込みメソッドを使用できます (Mike が提案したように)。ただし、追加のプラグインとユーティリティもあります。

Chrome Extension XPath Helperが最も便利であることがわかりました。同じ目的を果たしますが、使いやすく、単なる位置ではなく、(id などの属性に基づいて) より堅牢な XPath 式を作成します。式をインラインで編集して、リアルタイムで結果を確認することもできます。

score 2 · Accepted Answer

ここで何をしようとしているのか正確にはわかりませんが、HtmlAgilityPack を使用するときは、XPath よりも Linq 機能を活用します。私のお気に入りの戦術は、特に Where 句を追加して検索を絞り込む場合に、子孫メソッドを使用することです。そこから、名前、ID を確認するか、GetAttributeValue を使用して他の属性 (href など) を確認できます。Linq の方がはるかに読みやすく、XPath 構文で迷子になることなく、非常に精巧な解析を行うことができます。

score 0 · Accepted Answer

Chrome ブラウザでウェブサイトを開く
Ctrl+Shift+I を押します (デベロッパーインストゥルメントが開きます)。
楽器ウィンドウの上部にある「要素」を選択します
計器ウィンドウの下部にある虫眼鏡を選択します
ブラウザで目的の要素を選択します
DOM ツリーで選択した行を右クリックし、[XPath のコピー] を選択します。

xpath - Web パーサー用に XPATH を自動的に書き込むツールは?

3 に答える 3

Related

Reference