問題タブ [html-parser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
355 参照

regex - Perlを使用してHTMLドキュメントのスクリプトタグのsrc属性を選択的に変更するにはどうすればよいですか?

次のように、すべてのsrcの前に[perl] texthere[/perl]を付ける正規表現をPerlで作成する必要があります。

何か助けはありますか?ありがとう!

0 投票する
1 に答える
95 参照

objective-c - HTMLパーサーの使用中にエラーが発生しました

Objective-C--HMTLパーサー(https://github.com/zootreeves/Objective-C-HMTL-Parser)を使用しようとしています。私はすべての指示に注意深く従い、新しいプロジェクトでは問題なく動作しますが、別のプロジェクトで使用しようとすると、次のエラーが発生します。

エラーのスクリーンショット

2つのプロジェクトの違いは、2番目のプロジェクトでは「libsqlite3.dylib」を使用することです。

ありがとう、ルイージ。

0 投票する
4 に答える
98038 参照

python - 要素内のテキストを取得するためのHTMLの解析

2つの要素内のテキストを文字列にまとめる必要があります。

どうすればこれを達成できますか?

0 投票する
1 に答える
816 参照

perl - Perlエラー「Parser.plの6行目の未定義の値でメソッド「get_tag」を呼び出せません」

簡単なperlスクリプトを作成しましたが、次のランタイムエラーが発生します。

Parser.plの6行目の未定義の値でメソッド「get_tag」を呼び出すことはできません

以下は私のコードです:

このperlプログラムの同じディレクトリの下にファイルbad.htmlを配置しました。以下はbad.htmlのコードです

私のperlコードを実行する際のエラーについて私を助けてください。

0 投票する
1 に答える
739 参照

java - java neko html、javax.xml.xpath

これを手伝ってください:

nがnullである理由、ありがとう

0 投票する
1 に答える
171 参照

java - Java を使用して div の座標と寸法を取得する方法

そこの

私は、Web の html コードを Java を使用して特定の JS ライブラリに変換するプロジェクトに取り組んでいるため、div ブロックはさまざまな動的動作を行うことができます。

html div を JS オブジェクトに変換するには、その座標と幅と長さを知る必要があります。

私はいくつかの Java html パーサー ライブラリに変わりました: http://java-source.net/open-source/html-parsers

しかし、Cobra http://lobobrowser.org/cobra/java-html-parser.jspを除いて、この機能を備えたものはありません。div の座標と寸法を提供できるレンダリング エンジンを備えています。しかし、このライブラリは本当にバグが多いことが判明しました。ライブラリに付属しているテストを実行することさえできません。

この問題を処理する方法を知っている人はいますか? お役に立てれば本当に助かります!

前もって感謝します!フィル

0 投票する
1 に答える
536 参照

python - HTML ページからデータを動的に抽出する

このカスタム クラスを使用して、HTML ドキュメント (この場合は Nagios ステータス ページ) から文字列/データを抽出するスクリプトを作成しています。

< td > タグが見つかるたびに、SGMLParser が呼び出されstart_td、属性を探しCLASSます。

上記は、 CLASS属性の<td>タグで見つかったすべての値を示しています。ビット (in ) と(の値として)を動的に割り当てる方法はありますか?tdstart_tdclasskoptparse

静的にコーディングするのではなく?コマンドラインから任意のタグ (例<a>:<div>など) および関連する属性 (例: など) にhrefこのクラスを [再] 使用するつもりです。idどんな助けでも大歓迎です。

0 投票する
1 に答える
35 参照

html - どのような状況で、要素はHTML解析中にDOMのHead要素にアタッチされますか?

<head></head>明らかに、ペア内のコンテンツ/タグはヘッド要素に添付されます。

の解析中に<body></body>、一部の要素がBody要素ではなくHead要素にアタッチされる状況はありますか?

0 投票する
1 に答える
129 参照

perl - 未定義の値HTML::TokeParser

Perlスクリプトを使用してHTML内のタグを見つけようとしています。

このエラーが発生します。C:\ Users \ me \ Documents \ Scripts \parsing.pl9行目の未定義の値でメソッド「get_tag」を呼び出せません。

salida2.htmlはスクリプトと同じディレクトリにあり、WWW :: Mechanize :: Firefoxインスタンスでも使用しており、正常に動作しています。

前もって感謝します。

0 投票する
5 に答える
411 参照

android - asynctask android から文字列を取得する

AsyncTask から文字列を取得するには? jsoup を使用して、URL からコンテンツを取得します。以下のケースでは、コンテンツを取得しましたが、そのコンテンツを getItembody 文字列に入れることができません。コードは次のとおりです。

私の質問は、doinbackground の文字列コンテンツを getItemBody 文字列に入れ、文字列名が本体であり、ダイアログが閉じられた後に結果を取得したいということです。現在のダイアログは閉じませんが、キーをタップして戻る必要があります。これは logcat Log.v("LogContentView", content); の結果です。