問題タブ [html-parser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
1097 参照

python - カンマで文字列を分割すると、アンパサンドも分割されます

以下のコードはHTMLを解析します。問題は、データにアンパサンドが表示されたときに分割されることです。

出力
コンマだけでなく、「&」を分割しています。

ありがとう

0 投票する
2 に答える
1205 参照

java - java.lang.NoClassDefFoundError: org/htmlparser/util/ParserException

このhttp://htmlparser.sourceforge.net/コードを Eclipse で実行しようとしています。そこにある説明は、単に「ライブラリを使用するには、コンパイルおよび実行時に、クラスパスに htmllexer.jar または htmlparser.jar を追加する必要があります」です。

htmllexer.jar と htmlparser.jar をビルド パスに追加すると、すべて正常にコンパイルされます。しかし、実行時にEclipseはそれらのjarファイルを見つけることができないようです。これらのjarファイルをランタイムクラスパスに追加する方法がわかりません....

私の日食は次のようになります。 ここに画像の説明を入力

0 投票する
2 に答える
416 参照

python - HTMLParserError が発生したときに HTML でエラー行を見つける方法

現在、Python を使用して Web クローラーを作成していますが、HTMLParserError がスローされることがあります。

junk characters in start tag: u'\u201dTPL_password_1\u201d\r\n\t\t', at line 21285, column 6

21285行目でエラーが発見されたとのことですが、HTMLソースコードの21285行目でエラーが発見されたということですか?そうでない場合、エラーを生成する現在の HTML コードを知るにはどうすればよいですか? 現在の解析URLは何ですか?

私の解析クラスは次のように単純化できます。

助けてくれてありがとう。

0 投票する
1 に答える
484 参照

android - JSoup が私の HTML コードを間違って解析するのはなぜですか?

Web ページを解析しようとしていますが、ページ内のテキストを取得したい場合。Jsoup.parse() および Jsoup.connect().get() メソッドを呼び出すと、Jsoup は間違ったドキュメントを取得します。

これは Web ページと私のコードの一部です。doc var の DOM が間違っています。

doc1 変数の結果は次のとおりです。

私は何か間違ったことをしましたか?

0 投票する
1 に答える
2703 参照

java - JSOUPを使用してHTMLソースコードからRSSリンクを取得するJava

HTMLソースコードからRSSリンクを取得しようとしています。RSSリンクを見つけるためにJsoup Javaライブラリを使用しました。RSS リンクを取得するための小さなコードを書きましたが、残念ながらすべての Web サイトで機能するわけではありません。以下は私のコードです

上記のコードは、すべての Web サイトで機能するわけではありません。私の問題を解決してください。(RSS 2.0 リンクを探しています)

ありがとうございました

0 投票する
1 に答える
583 参照

php - 正規表現またはHTMLパーサーを使用して、PHPのソースとしてpdfファイルを含むすべてのアンカータグを検索する

anchorソースPDFですべてのタグを見つけるにはどうすればよいですか

abc.pdf文字列変数だけが必要です

0 投票する
1 に答える
533 参照

iphone - iPhoneアプリでHTMLサブタグを解析するには?

多くの画像とライブコンテンツを含む HTML Web ページがあります。parse the data from the webpage(HTML)iPhoneアプリで表示する必要があります。次のコードを使用して HTML コンテンツを解析しています。しかし、タグ内のサブタグを解析する方法がわかりませんか?

応答:

クラスphoneModelItemsからテキストNokia Modelを取得したいと考えています。「Nokia Model」というテキストを取得する方法を教えてください。前もって感謝します。

0 投票する
1 に答える
766 参照

python - django は文字列 python からタグを削除します

Python を使用して文字列以外のすべての html タグを削除したいのですが、これを使用します。

しかし、これによりすべてのhtmlタグが削除されます。

0 投票する
1 に答える
674 参照

java - Htmlparser は Java で「tbody」を解析できません

でノードorg.htmlparserを取得したいtbodyid

なぜnodelist1読まないの<tr><td>4</td><td>5</td></tr>ですか?