問題タブ [html-agility-pack]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
147 参照

html-parsing - この HTML ファイルを解析するにはどうすればよいですか?

(new Image()) の href 値を何らかの方法で抽出する必要があります。HtmlAgilityPack でこれをどのように達成できますか?

私はそれが初めてで、これまでのところ、解析に効果的に使用する方法に関する有用なチュートリアルを見つけていません。

助けてくれてありがとう!

0 投票する
2 に答える
1441 参照

parsing - Html Agility Pack:DescendantsOrSelf()がHTML要素を返さない

私はいくつかのHTMLを持っています、例えば:

そして、CxCMS:ContentManagedPlaceHolder要素のすべてのインスタンスを検索したいと思います。

私はHTMLAgilityPackを使用しています。これが最適と思われます。

ただし、[meagre]のドキュメントを見ても、コードを機能させることができません。

私は以下が機能することを期待します:

しかし、私は何も返されません。

DescendantsOrSelfに変更すると、ドキュメントノード「#document」が返されます。これは正しくありません。

LINQも使用してみました:

これらの方法はどちらも機能しないため、代わりにSelectNodesの使用に移りました。

これは例外をスローします:「名前空間マネージャーまたはXsltContextが必要です。このクエリにはプレフィックス、変数、またはユーザー定義関数があります。」HtmlDocumentオブジェクトに名前空間管理を追加する方法が見つかりません。

ここで何が欠けていますか?DescendantsOrSelf()メソッドは、「p」などの「標準」HTMLタグを使用している場合は機能しますが、私が持っているものは機能しません。確かにそれはうまくいくはずですか?(する必要があります!)

0 投票する
4 に答える
2163 参照

c# - WebBrowserコントロール内の入力に値を設定できますか?

WebBrowserオブジェクトにWebページをロードしています。私がやりたいのは、そのページの要素にアクセスしてデータを入力することです。たとえば、ユーザー名とパスワードを入力してフォームを送信します。

これはどのように可能ですか?何か案は?

HTMLAgilityPackを使用して要素にアクセスし、それらの値を設定できますか?

0 投票する
3 に答える
1253 参照

javascript - Javascriptをhtmlhrefタグで記述できますか?

私はjavascriptを書くことができるすべての方法を理解しようとしています。受け入れ可能なタグのホワイトリストを作成していますが、属性によって取得されています。

私のリッチHTMLエディターでは、リンクなどを許可しています。

現在、私はhtmlアジリティパックを使用して、サポートしない属性とその問題に関するhtmlタグを削除しています。

しかし、人がこのようなことをすることができるかどうかはまだわかりません

それで、私がサポートしているすべての属性の内部テキストを調べ始め、それらをhtmlエンコードする必要があるかどうかわかりませんか?または何なら。

また、あるページに移動し、ロード時にJavaScriptを起動するhtmlリンクを防ぐ方法もわかりません。

ホワイトリストがそれを止めることができるかどうかはわかりません。

0 投票する
2 に答える
3656 参照

c# - HtmlAgilityPackを使用してノードの子を解析する際の問題

htmlのフォームの入力タグの子を解析する際に問題が発生しました。// input [@type]を使用してルートから解析できますが、特定のノードの子として解析することはできません。

問題を説明するコードを次に示します。

出力されるものは次のとおりです。

私が期待するのは、Form1とForm2の両方に子があり、input[@type]はform1の2つのノードとform2の1つのノードを見つけることができるということです。

使用していない特定の構成設定または方法はありますか?何か案は?

ありがとう、

スティーブ

0 投票する
2 に答える
18890 参照

c# - HTML Agility Pack ストリップ タグがホワイトリストにない

ホワイトリストにないhtmlタグと属性を削除する関数を作成しようとしています。私は次のHTMLを持っています:

HTMLアジリティパックを使用していますが、これまでのコードは次のとおりです。

私が達成しようとしている出力は

つまり、<b>タグのみを保持したいということです。
私がこれを行っている理由は、一部のユーザーが MS WORD から ny WYSYWYG html エディターに cpoy-paste を行っているためです。

ありがとう。!

0 投票する
2 に答える
1657 参照

c# - 解析におけるhtmlアジリティパックの質問

私はこの単純な文字列を持っています:

htmlアジリティパックを使用してテキストだけを解析するにはどうすればよいですか。

注意:別のスパン内にネストされたスパンがあります。

ありがとう、ロッド。

0 投票する
1 に答える
333 参照

asp.net - ノード選択基準に OR 句を追加する - HTMLAgility

HTMLAgility を使用してノード選択に OR 句を入れることはできますか

私が必要としているのは、そうあるべき時とそうあるSelectNodes("//td[@class=\"roomPrice figure\"]"); 時があることですSelectNodes("//td[@class=\"roomPrice figure bb\"]");

いずれかのクラスを取得する必要がありますroomPrice figureORroomPrice figure bb

どうすればこれを達成できますか。

ご協力いただきありがとうございます

0 投票する
5 に答える
16885 参照

html - HtmlAgilityPackを使用してすべてのhtmlタグを削除する

私はこのようなhtml文字列を持っています:

結果の文字列が次のようになるように、すべてのhtmlタグを削除したいと思います。

SOの別の投稿から、この関数(Html Agility Packを使用)を思いつきました。

残念ながら、これは私が期待するものを返しません、代わりにそれは与えます:

どうか、どこが間違っているのですか?これが最善のアプローチですか?

よろしくと幸せなコーディング!

更新:以下の答えによって、私はこの関数を思いついた、他の人に役立つかもしれない:

0 投票する
1 に答える
1889 参照

html - HTMLAgilityPackを使用してHTMLのIDをクエリする際の例外

HTML Agilityパックを使用して、VisualStudio内のASPXファイルを解析しています。

指定されたID属性を持つ要素を検索しています。

私が使用しているコードは次のとおりです。

ただし、このコードを実行すると、「式はノードセットに評価される必要があります」という例外がスローされます。

なぜこれがノードセットに「評価されなければならない」のか誰かに教えてもらえますか?単純にノードを返さないのはなぜですか(次の行はtagsWithId.Countを呼び出します)?確かに、SelectNodesメソッドによって返されるHtmlNodeCollectionには0ノードを含めることができますか?

または、Xpath式の形式が正しくないためにエラーが発生しますか?[これをテストしているセレクターIDは、ファイルに<div id="thisId">として確実に存在します。]

Visual Studioから直接ASPXファイルをロードすることも可能ですか(アドインを構築しています)、またはこれにXMLエラーが含まれ、代わりに出力HTMLストリームをロードする必要があります(つまり、最初にページ宣言なしで)ファイルのなど)?