問題タブ [html-parser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
521 参照

html - HTMLの一部にHtmlTidy Managedを使用する

私は.netのHtmlTidyにこのライブラリラッパーを使用しています

https://github.com/markbeaton/TidyManaged

簡単な例があります:

「html」タグと「body」タグを含む完全なページではなく、HTML の一部にライブラリを使用したいのですが、可能ですか?

私は基本的に、開始タグと終了タグなどを検証し、一致する開始タグがないタグを削除したいと考えています。他の優れたツールが適しています。

0 投票する
1 に答える
72 参照

python - HTMLコードからテーブルを抽出できません

以下に示す html テーブル (完全な html コードのセクション) を解析しようとしていますが、コードが機能していません。「テーブルに属性 findall がありません」というエラーが表示されます。コードは次のとおりです。

0 投票する
2 に答える
937 参照

php - 非オブジェクトのプロパティを取得しようとしています (解析中)

解析に問題があります。写真のリンクを取得する必要がありますが、コードにエラーがあります。PHP エラーが発生しました重大度: 通知メッセージ: 非オブジェクトのプロパティを取得しようとしていますファイル名: views/varle2_view.php 行番号: 25

ウェブのソース

0 投票する
1 に答える
515 参照

java - Java HTMLパーサーマルチページテーブル

このウェブサイトのテーブルからすべての詳細を取得するために、HTML パーサーとして Jsoup を使用しています。以下のコードでは、最初のページのデータしか取得できません。何かアドバイスはありますか?

0 投票する
2 に答える
160 参照

ruby-on-rails - Rubyで文字列から値を分割する方法

私の文字列の例はここにリストされています。すべての値の結果を配列またはハッシュに分割して、各要素の値を処理したい。

ハッシュまたは配列の各値を取得するにはどうすればよいですか。

0 投票する
1 に答える
1823 参照

java - jsoup を使用した検索クエリの送信

この質問はすでに尋ねられていることは知っていますが、それは私にはうまくいきません。実際、このサイトでは、URL をコピーして他のタブに貼り付けても、最初にエラーが表示され、数秒後に再度リロードして目的のページが表示されるため、最初の試行で値を取得できません。誰かが私に解決策を教えてくれれば素晴らしいことです。私の評判を見ると、私はstackoverflowに非常に慣れていないので、何か間違いをした場合は申し訳ありません...

0 投票する
2 に答える
2889 参照

python - HTML リストをネストされた Python リストに変換する

次のような入れ子になった html (順序付けされていない) リストがあるとします。

Pythonでネストされたリストを作成するにはどうすればよいですか? 例えば:

Beautiful SoupHTML Parserなどのライブラリにはこれを行う機能があると思いますが、それを理解することはできませんでした。ヘルプ/ポインタをありがとう!