問題タブ [html-agility-pack]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
3552 参照

c# - HTMLAgilityPackのスクリーンスクレイピングXPATHがデータを返さない

Digikey用のスクリーンスクレイパーを作成しようとしています。これにより、当社は、部品が製造中止になったときに、価格設定、部品の入手可能性、および製品の交換を正確に追跡できます。Chrome DevtoolsとFirefoxのFirebugで表示されているXPATHと、C#プログラムで表示されているものとの間に不一致があるようです。

私が現在スクレイピングしているページはhttp://search.digikey.com/scripts/DkSearch/dksus.dll?Detail&name=296-12602-1-NDです。

私が現在使用しているコードはかなり速くて汚いです...

使用しているパスは「正しい」ように見えますが、リスト「m_unparsedProductInfoNodes」を見るとNULLになり続けています。

ここで何が起こっているのか分かりますか?また、baseNodeで「SelectNodes」を実行すると、ブラウザのユーザーエージェントによって異なるように見える「cs=####」だけが重要な子を持つdivのみが返されることも追加します。とにかくこれを使用しようとすると(識別できないブラウザーのパスに/ cs = 0を入れる)、式がノードセットに評価されないことを主張するフィットを提案しますが、それらを残すと、過去のすべてのデータの問題が残りますdiv[2]はNULLとして返されます。

0 投票する
2 に答える
985 参照

c# - タグ `< table <` から解析する HTML Agility パックのオプション

&ltおよびのようなタグを解析できる HTML アジリティ パックのオプションはありますか&gt

次のようなタグがある場合<table>、html アジリティ パックはタグ テーブルからの情報を適切に解析します。しかし、タグが次のような場合、&lt table &ltここではタグ テーブルからの情報を解析しません。そのため、HTML アジリティ パックには、そのようなタグからの情報も解析するオプションがあります。

0 投票する
3 に答える
7011 参照

c# - Html Agility Pack を使用して HTML フラグメントを解析できますか?

Html Agility Pack を使用して HTML 文字列フラグメントを解析できますか?

そのような:

<b>次に、すべてのタグを抽出しますか? これまでに見たすべての例は、html ドキュメントのようにロードされていました。

0 投票する
1 に答える
1174 参照

c# - HTTP Agility Pack を使用した HTML の解析

5 つのうちの 1 つの表を次に示します。

テーブル ヘッダーが DATUM および Maloprodajna cena [EUR/L] である値を抽出する必要があります。Agility HTML パックを使用しています。

これらの値を取得するのに苦労しました。私はから始めました:

しかし、テーブル ヘッダーが DATUM および Maloprodajna cena[EUR/L] である値のみを選択する方法を見つけることができませんでした。where句でそれを行うことは可能ですか?

次に、次の 2 つのクエリで終了しました。

これら 2 つのクエリを組み合わせることは可能ですか? そして、それをラムダ式に変換するにはどうすればよいですか? 私はそれらのことを学び始めたばかりであり、将来それらの質問がないように、それがどのように行われるかを知りたい.

O、もう 1 つ質問があります...グラフ コントロールを知っている人はいますか? Microsoft Chart Controls から始めましたが、設定に問題があります。したがって、誰かがそれを経験したことがある場合は、x軸が毎秒ではなくすべての値を表示するように設定する方法を知りたいです... 2009 年 4 月 21 日、2009 年 5 月 5 日、2009 年 5 月 6 日: 10.03.2009、07.04.2009、05.05.2009 など。

次のようにデータをグラフにバインドします。

私は私の最初の投稿のためにたくさんの質問をしています...へへ、私が不明瞭でなかったことを願っています。返信ありがとうございます。

0 投票する
2 に答える
1536 参照

c# - htmlアジリティパックを使用してhtmlファイルから最も内側のテーブルを抽出する方法は?

htmlアジリティパックを使用して、htmlファイルの表形式の情報を解析しています。

今、私はそれを行うことができ、それは機能します。

しかし、私が抽出したいテーブルが最も内側にある場合。

または、ネストされたテーブルのどの位置にあるかわかりません。ネストされたテーブルはいくつでも存在する可能性があるため、そこから列名name、addressを持つテーブルの情報を抽出します。

元。

テーブルはたくさんありますが、列名name、addressのテーブルを抽出したいと思います。だから私は何をすべきですか?

0 投票する
1 に答える
275 参照

c# - tdタグがあるスペースを使用して表形式のセルデータを解析する

私はhtml敏捷性パックの助けを借りてhtml表形式の情報を解析しています。今最初に私はそのテーブルの行を次のように見つけています

var rows = table.Descendants("tr");

次に、各行のセルデータを次のように検索します。

これでセルデータが得られますが、NameAdressPhone Noのようにスペースを入れないでください。ただし、Name Address Phone Noのように内部テキストが必要なのは、 tdタグがある場所を意味します。異なる列セルの間にスペースを1つ残しておきます。

0 投票する
1 に答える
3381 参照

replace - HTML Agility Pack - ReplaceNode は Body の InnerHTML を変更しません

私はこれを持っています

本体:

コード:

これを行った後、ボディ ノードの InnerHtml は最初と同じままですが、OutterHtml または InnerText は良好な結果を示しています。私のコードに何か問題がありますか?

結果:

0 投票する
3 に答える
14461 参照

html-agility-pack - Html Agility Pack:コードをきれいに見せます

Html Agility Packを使用して、出力を適切にインデントし、不要な空白を削除して表示できますか?

0 投票する
1 に答える
14866 参照

c# - HtmlAgilityPack を使用して HTML ページを解析し、クラスごとに Div を選択する

HtmlAgilityPack で C# を使用しており、id が foo の div を選択できます。

しかし、バーのクラスでdivを選択するにはどうすればよいですか?

0 投票する
1 に答える
3649 参照

c# - HTML DOM を簡単に管理できる C# のオブジェクトはありますか?

HTTP Post から返されたばかりのページの html を含む文字列がある場合、それを DOM を簡単にトラバースできるようにするにはどうすればよいでしょうか?

HtmlDocument オブジェクトは理にかなっていると思いましたが、コンストラクターがありません。HTML DOM を簡単に管理できる型はありますか?

ありがとう、
マット