2

現在、Web サイトからデータを抽出する必要があります。XPATHを使ってデータを抽出するHTML Agility Packを使ってみました。XPATH の書き込みを自動化して、初心者のユーザーでも XPATH を記述せずに解析ツールの構成を使用できるようにするツールはありますか。私のシナリオについて貴重な提案をしてください。

注: XPATH を記述するためのいくつかのツールを使用できますが、適切な形式の XML が必要ですが、私の場合、入力として不正な形式の HTML ドキュメントが使用されています。

4

3 に答える 3

3

はい、そのようなツールがあります!

確かに、多くの Web ブラウザーに存在する組み込みメソッドを使用できます (Mike が提案したように)。ただし、追加のプラグインとユーティリティもあります。

Chrome Extension XPath Helperが最も便利であることがわかりました。同じ目的を果たしますが、使いやすく、単なる位置ではなく、(id などの属性に基づいて) より堅牢な XPath 式を作成します。式をインラインで編集して、リアルタイムで結果を確認することもできます。

于 2012-05-31T16:19:14.670 に答える
2

ここで何をしようとしているのか正確にはわかりませんが、HtmlAgilityPack を使用するときは、XPath よりも Linq 機能を活用します。私のお気に入りの戦術は、特に Where 句を追加して検索を絞り込む場合に、子孫メソッドを使用することです。そこから、名前、ID を確認するか、GetAttributeValue を使用して他の属性 (href など) を確認できます。Linq の方がはるかに読みやすく、XPath 構文で迷子になることなく、非常に精巧な解析を行うことができます。

于 2012-05-30T22:50:48.987 に答える
0
  1. Chrome ブラウザでウェブサイトを開く
  2. Ctrl+Shift+I を押します (デベロッパー インストゥルメントが開きます)。
  3. 楽器ウィンドウの上部にある「要素」を選択します
  4. 計器ウィンドウの下部にある虫眼鏡を選択します
  5. ブラウザで目的の要素を選択します
  6. DOM ツリーで選択した行を右クリックし、[XPath のコピー] を選択します。
于 2012-05-31T14:16:02.100 に答える