問題タブ [html-agility-pack]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - childNode を選択する HtmlAgilityPack が期待どおりではない
HtmlAgilityPack ライブラリを使用してページ内のいくつかのリンクを解析しようとしていますが、メソッドから期待する結果が得られません。以下に、リンクの HtmlNodeCollection を示します。リンクごとに、画像ノードがあるかどうかを確認し、その属性を解析したいのですが、linkNode の SelectNodes および SelectSingleNode メソッドは、linkNode の childNodes ではなく親ドキュメントを検索しているようです。
存在する場合、linkNode の画像の子ノードの alt 属性を取得できる他の方法はありますか?
c# - Html アジリティ パック - 解析
シンプルなウェブサイトから事実のリストをスクレイピングしたい. それぞれの事実は<li>
タグで囲まれています。Html Agility Pack を使用してこれを行うにはどうすればよいですか? より良いアプローチはありますか?
<li>
タグで囲まれているのは事実だけで、それ以外は何もありません。
html-agility-pack - HtmlAgilityPack を使用してハイパーリンク タグを変更する
HtmlAgilityPack を使用してすべてのハイパーリンクを置き換える方法。
href 属性だけが残るようにします。URL。
これは可能ですか?
c# - HTMLAgilityPack使用時のエンコーディングエラー
この実際のサイトから見つけたコードを使用してHTMLドキュメントを解析しようとしていますが、解析エラーが発生し続けます
どんな助けもいただければ幸いです:)
c# - エンコーディングに関する質問: HtmlAgilityPack から StringWriter に出力し、エンコーディングを保持するにはどうすればよいですか?
HtmlAgilityPack で html を読み込んで編集し、StreamWriter に出力しています。HtmlAgilityPack Encoding は Latin1 で、StreamWriter は UnicdeEncoding です。
変換でいくつかの文字が失われていますが、そうなってほしくありません。
StreamWriter のエンコーディングを変更できないようです。この問題を回避するのに最適なものは何ですか?
html-agility-pack - HTMLAgility パック - OuterHtml 読み取り専用?
やあ、私は自分のコード ベース内のすべてのリンクを調べて、ローカライズの理由でから<a href="x">
に変更しています。<asp:HyperLink>
私はこれ (およびその他のもの) に HTMLAgilityPack を使用しています。見つけたリンクの OuterHtml オブジェクトを変更したいのですが、読み取り専用ですか?
HAP を初めて使用しますが、新しいノードを作成して古いノードを削除する必要がありますか? 誰かがこれに遭遇しましたか?
ありがとう!
c# - InnerHTML での HTMLAgilityPack 解析
div から Token2 を抽出しようとしています
私は Token1 と Token3 を取得することができました:
HTMLAgilityPack で Token2 を直接抽出するにはどうすればよいですか?
汚いオプションの 1 つは、doc.DocumentNode.SelectNodes("//div").InnerText で Token1 と Token2 を string.empty に置き換えることですが、HTMLAgilityPack を使用すると、よりクリーンな方法で行うことができると思います...
.net - HTMLAgilityPackとVisualStudioC++の問題
.NET環境で整形式のHTMLドキュメントからテキストやテーブルを抽出できる非常にシンプルなHTMLパーサーが必要です。HTMLAgilityPackへの参照がいくつか見つかりました。私の問題は、.NETFrameworkでVisualC++環境を使用していることです。C#で生成された.dllファイルへの「参照」をVC ++プロジェクトに追加する方法について誰かが私を助けてくれますか?Visual C ++ Win32プロジェクトでHTMLAgilityPackを使用することも可能ですか?タスクを実行できるより優れた/基本的なC++パーサーをご存知の場合は、お知らせください。ご協力いただきありがとうございます。
c# - html敏捷性パックは子供を削除します
HTML Agilityパックを使用して、特定のIDを持つdivとその子を削除しようとすると問題が発生します。設定オプションがないのは確かですが、金曜日と私は苦労しています。
簡略化されたHTMLは次のように実行されます。
これは私が持っている限りです。敏捷性パックによってスローされたエラーは、div構造が見つからないことを示しています。
これまでのコードは次のとおりです(Stackoverflowから取得...)
c# - HtmlAgilityPackを使用したHTMLページの解析
C#を使用して、このサンプルhtmlスクリプトからTextbox値(つまり、john)を取得する方法を知りたいです。