問題タブ [html-parser]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - カンマで文字列を分割すると、アンパサンドも分割されます
以下のコードはHTMLを解析します。問題は、データにアンパサンドが表示されたときに分割されることです。
出力
コンマだけでなく、「&」を分割しています。
ありがとう
java - java.lang.NoClassDefFoundError: org/htmlparser/util/ParserException
このhttp://htmlparser.sourceforge.net/コードを Eclipse で実行しようとしています。そこにある説明は、単に「ライブラリを使用するには、コンパイルおよび実行時に、クラスパスに htmllexer.jar または htmlparser.jar を追加する必要があります」です。
htmllexer.jar と htmlparser.jar をビルド パスに追加すると、すべて正常にコンパイルされます。しかし、実行時にEclipseはそれらのjarファイルを見つけることができないようです。これらのjarファイルをランタイムクラスパスに追加する方法がわかりません....
私の日食は次のようになります。
python - HTMLParserError が発生したときに HTML でエラー行を見つける方法
現在、Python を使用して Web クローラーを作成していますが、HTMLParserError がスローされることがあります。
junk characters in start tag: u'\u201dTPL_password_1\u201d\r\n\t\t', at line 21285, column 6
21285行目でエラーが発見されたとのことですが、HTMLソースコードの21285行目でエラーが発見されたということですか?そうでない場合、エラーを生成する現在の HTML コードを知るにはどうすればよいですか? 現在の解析URLは何ですか?
私の解析クラスは次のように単純化できます。
助けてくれてありがとう。
android - JSoup が私の HTML コードを間違って解析するのはなぜですか?
Web ページを解析しようとしていますが、ページ内のテキストを取得したい場合。Jsoup.parse() および Jsoup.connect().get() メソッドを呼び出すと、Jsoup は間違ったドキュメントを取得します。
これは Web ページと私のコードの一部です。doc var の DOM が間違っています。
doc1 変数の結果は次のとおりです。
私は何か間違ったことをしましたか?
java - JSOUPを使用してHTMLソースコードからRSSリンクを取得するJava
HTMLソースコードからRSSリンクを取得しようとしています。RSSリンクを見つけるためにJsoup Javaライブラリを使用しました。RSS リンクを取得するための小さなコードを書きましたが、残念ながらすべての Web サイトで機能するわけではありません。以下は私のコードです
上記のコードは、すべての Web サイトで機能するわけではありません。私の問題を解決してください。(RSS 2.0 リンクを探しています)
ありがとうございました
php - 正規表現またはHTMLパーサーを使用して、PHPのソースとしてpdfファイルを含むすべてのアンカータグを検索する
anchor
ソースPDFですべてのタグを見つけるにはどうすればよいですか
abc.pdf
文字列変数だけが必要です
iphone - iPhoneアプリでHTMLサブタグを解析するには?
多くの画像とライブコンテンツを含む HTML Web ページがあります。parse the data from the webpage(HTML)
iPhoneアプリで表示する必要があります。次のコードを使用して HTML コンテンツを解析しています。しかし、タグ内のサブタグを解析する方法がわかりませんか?
応答:
クラスphoneModelItemsからテキストNokia Modelを取得したいと考えています。「Nokia Model」というテキストを取得する方法を教えてください。前もって感謝します。
python - django は文字列 python からタグを削除します
Python を使用して文字列以外のすべての html タグを削除したいのですが、これを使用します。
しかし、これによりすべてのhtmlタグが削除されます。
java - Htmlparser は Java で「tbody」を解析できません
でノードorg.htmlparser
を取得したいtbody
id
なぜnodelist1
読まないの<tr><td>4</td><td>5</td></tr>
ですか?