問題タブ [html-parser]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

204 問題

0 投票する

2 に答える

1097 参照

python - カンマで文字列を分割すると、アンパサンドも分割されます

以下のコードはHTMLを解析します。問題は、データにアンパサンドが表示されたときに分割されることです。

出力
コンマだけでなく、「＆」を分割しています。

ありがとう

python html-parser

2012-04-19T04:38:43.290

0 投票する

2 に答える

1205 参照

java - java.lang.NoClassDefFoundError: org/htmlparser/util/ParserException

このhttp://htmlparser.sourceforge.net/コードを Eclipse で実行しようとしています。そこにある説明は、単に「ライブラリを使用するには、コンパイルおよび実行時に、クラスパスに htmllexer.jar または htmlparser.jar を追加する必要があります」です。

htmllexer.jar と htmlparser.jar をビルドパスに追加すると、すべて正常にコンパイルされます。しかし、実行時にEclipseはそれらのjarファイルを見つけることができないようです。これらのjarファイルをランタイムクラスパスに追加する方法がわかりません....

私の日食は次のようになります。ここに画像の説明を入力

2012-05-15T20:32:37.623

0 投票する

2 に答える

416 参照

python - HTMLParserError が発生したときに HTML でエラー行を見つける方法

現在、Python を使用して Web クローラーを作成していますが、HTMLParserError がスローされることがあります。

junk characters in start tag: u'\u201dTPL_password_1\u201d\r\n\t\t', at line 21285, column 6

21285行目でエラーが発見されたとのことですが、HTMLソースコードの21285行目でエラーが発見されたということですか？そうでない場合、エラーを生成する現在の HTML コードを知るにはどうすればよいですか? 現在の解析URLは何ですか?

私の解析クラスは次のように単純化できます。

助けてくれてありがとう。

python html-parser

2012-05-21T08:48:33.377

0 投票する

1 に答える

484 参照

android - JSoup が私の HTML コードを間違って解析するのはなぜですか?

Web ページを解析しようとしていますが、ページ内のテキストを取得したい場合。Jsoup.parse() および Jsoup.connect().get() メソッドを呼び出すと、Jsoup は間違ったドキュメントを取得します。

これは Web ページと私のコードの一部です。doc var の DOM が間違っています。

doc1 変数の結果は次のとおりです。

私は何か間違ったことをしましたか？

android jsoup html-parser

2012-05-22T11:14:46.303

0 投票する

1 に答える

2703 参照

java - JSOUPを使用してHTMLソースコードからRSSリンクを取得するJava

HTMLソースコードからRSSリンクを取得しようとしています。RSSリンクを見つけるためにJsoup Javaライブラリを使用しました。RSS リンクを取得するための小さなコードを書きましたが、残念ながらすべての Web サイトで機能するわけではありません。以下は私のコードです

上記のコードは、すべての Web サイトで機能するわけではありません。私の問題を解決してください。(RSS 2.0 リンクを探しています)

ありがとうございました

java rss jsoup html-parser

2012-05-27T07:10:11.100

0 投票する

1 に答える

583 参照

php - 正規表現またはHTMLパーサーを使用して、PHPのソースとしてpdfファイルを含むすべてのアンカータグを検索する

anchorソースPDFですべてのタグを見つけるにはどうすればよいですか

abc.pdf文字列変数だけが必要です

php regex anchor html-parser

2012-06-12T06:16:04.920

0 投票する

1 に答える

533 参照

iphone - iPhoneアプリでHTMLサブタグを解析するには?

多くの画像とライブコンテンツを含む HTML Web ページがあります。parse the data from the webpage(HTML)iPhoneアプリで表示する必要があります。次のコードを使用して HTML コンテンツを解析しています。しかし、タグ内のサブタグを解析する方法がわかりませんか?

応答：

クラスphoneModelItemsからテキストNokia Modelを取得したいと考えています。「Nokia Model」というテキストを取得する方法を教えてください。前もって感謝します。

iphone html ios tags html-parser

2012-06-12T12:43:18.333

0 投票する

1 に答える

766 参照

python - django は文字列 python からタグを削除します

Python を使用して文字列以外のすべての html タグを削除したいのですが、これを使用します。

しかし、これによりすべてのhtmlタグが削除されます。

python django html-parser

2012-06-15T12:37:03.803

0 投票する

1 に答える

674 参照

java - Htmlparser は Java で「tbody」を解析できません

でノードorg.htmlparserを取得したいtbodyid

なぜnodelist1読まないの<tr><td>4</td><td>5</td></tr>ですか？

java html-parser

2012-06-21T01:35:46.323

1 2 3 4 5 6 7 8 9 10

問題タブ [html-parser]

Reference