問題タブ [html-agility-pack]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
24672 参照

c# - childNode を選択する HtmlAgilityPack が期待どおりではない

HtmlAgilityPack ライブラリを使用してページ内のいくつかのリンクを解析しようとしていますが、メソッドから期待する結果が得られません。以下に、リンクの HtmlNodeCollection を示します。リンクごとに、画像ノードがあるかどうかを確認し、その属性を解析したいのですが、linkNode の SelectNodes および SelectSingleNode メソッドは、linkNode の childNodes ではなく親ドキュメントを検索しているようです。

存在する場合、linkNode の画像の子ノードの alt 属性を取得できる他の方法はありますか?

0 投票する
1 に答える
7341 参照

c# - Html アジリティ パック - 解析
  • シンプルなウェブサイトから事実のリストをスクレイピングしたい. それぞれの事実は<li>タグで囲まれています。Html Agility Pack を使用してこれを行うにはどうすればよいですか? より良いアプローチはありますか?

    <li>タグで囲まれているのは事実だけで、それ以外は何もありません。

    0 投票する
    1 に答える
    2171 参照

    html-agility-pack - HtmlAgilityPack を使用してハイパーリンク タグを変更する

    HtmlAgilityPack を使用してすべてのハイパーリンクを置き換える方法。

    href 属性だけが残るようにします。URL。

    これは可能ですか?

    0 投票する
    1 に答える
    1987 参照

    c# - HTMLAgilityPack使用時のエンコーディングエラー

    この実際のサイトから見つけたコードを使用してHTMLドキュメントを解析しようとしていますが、解析エラーが発生し続けます

    どんな助けもいただければ幸いです:)

    0 投票する
    3 に答える
    2947 参照

    c# - エンコーディングに関する質問: HtmlAgilityPack から StringWriter に出力し、エンコーディングを保持するにはどうすればよいですか?

    HtmlAgilityPack で html を読み込んで編集し、StreamWriter に出力しています。HtmlAgilityPack Encoding は Latin1 で、StreamWriter は UnicdeEncoding です。

    変換でいくつかの文字が失われていますが、そうなってほしくありません。

    StreamWriter のエンコーディングを変更できないようです。この問題を回避するのに最適なものは何ですか?

    0 投票する
    2 に答える
    2199 参照

    html-agility-pack - HTMLAgility パック - OuterHtml 読み取り専用?

    やあ、私は自分のコード ベース内のすべてのリンクを調べて、ローカライズの理由でから<a href="x">に変更しています。<asp:HyperLink>私はこれ (およびその他のもの) に HTMLAgilityPack を使用しています。見つけたリンクの OuterHtml オブジェクトを変更したいのですが、読み取り専用ですか?

    HAP を初めて使用しますが、新しいノードを作成して古いノードを削除する必要がありますか? 誰かがこれに遭遇しましたか?

    ありがとう!

    0 投票する
    1 に答える
    5911 参照

    c# - InnerHTML での HTMLAgilityPack 解析

    div から Token2 を抽出しようとしています

    私は Token1 と Token3 を取得することができました:

    HTMLAgilityPack で Token2 を直接抽出するにはどうすればよいですか?

    汚いオプションの 1 つは、doc.DocumentNode.SelectNodes("//div").InnerText で Token1 と Token2 を string.empty に置き換えることですが、HTMLAgilityPack を使用すると、よりクリーンな方法で行うことができると思います...

    0 投票する
    1 に答える
    914 参照

    .net - HTMLAgilityPackとVisualStudioC++の問題

    .NET環境で整形式のHTMLドキュメントからテキストやテーブルを抽出できる非常にシンプルなHTMLパーサーが必要です。HTMLAgilityPackへの参照がいくつか見つかりました。私の問題は、.NETFrameworkでVisualC++環境を使用していることです。C#で生成された.dllファイルへの「参照」をVC ++プロジェクトに追加する方法について誰かが私を助けてくれますか?Visual C ++ Win32プロジェクトでHTMLAgilityPackを使用することも可能ですか?タスクを実行できるより優れた/基本的なC++パーサーをご存知の場合は、お知らせください。ご協力いただきありがとうございます。

    0 投票する
    3 に答える
    8360 参照

    c# - html敏捷性パックは子供を削除します

    HTML Agilityパックを使用して、特定のIDを持つdivとその子を削除しようとすると問題が発生します。設定オプションがないのは確かですが、金曜日と私は苦労しています。

    簡略化されたHTMLは次のように実行されます。

    これは私が持っている限りです。敏捷性パックによってスローされたエラーは、div構造が見つからないことを示しています。

    これまでのコードは次のとおりです(Stackoverflowから取得...)

    0 投票する
    2 に答える
    39103 参照

    c# - HtmlAgilityPackを使用したHTMLページの解析

    C#を使用して、このサンプルhtmlスクリプトからTextbox値(つまり、john)を取得する方法を知りたいです。