問題タブ [htmlcleaner]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
394 参照

java - クリーニング中に Java htmlcleaner がクラッシュする

こんにちは私のコードでは、次の行を実行しますが、このコードは実行中にクラッシュします。

これはエラーのスタック トレースです。

なぜそれが起こっているのかを知るのを手伝ってくれる人はいますか?

敬具、ゾリ

0 投票する
0 に答える
241 参照

java - ソースを整理せずにHTMLパーサー

私のマシンには数百の古いhtmlファイルがあり、それらを解析してデータを抽出しようとしています。Jsoup、Tagsoup、HTMLcleaner、JTidyなどのさまざまなJavaパーサーを試しました。ファイル内のhtmlコードの方法により、XPATHをサポートするパーサーしか使用できず、Jsoupを試しましたが、同等のcssセレクターが見つかりませんでした。

とにかく、私の問題は、私が試したパーサーが何であれ、実際のコンテンツをクリーンアップし、'(アポストロフィ)のようなものを奇妙な文字に変換することです。

特別な文字を整理して置き換えることなく、Javaパーサーを使用してコンテンツを解析することは可能ですか?

0 投票する
1 に答える
147 参照

java - HTML アセットを適切に取得する方法

HtmlCleaner を使用して HTML を解析するためのチュートリアル、具体的には次のチュートリアルに従っています: http://xjaphx.wordpress.com/2012/02/04/android-xml-adventure-parsing-html-using-htmlcleaner/

URL を取得し、そのページの html を変更するコードの一部があります。

Web ページを適切に保存し、アセットとして保存して、同じ目標を達成するにはどうすればよいですか?

ありがとう

0 投票する
1 に答える
405 参照

xpath - 特定のノード要素の下のノードを取得する

ここで私の問題について助けが必要か、少なくともいくつかのアドバイスが必要です。XPATH を使用して HTMLcleaner を使用して HTML ドキュメントを解析しています。

私はこのようなものを持っています:

Ok。いくつかの<h4>タグがあり、それぞれに<a>タグといくつかのテキストがあります。私の問題は、「h4 [i]」のように、特定の からそれぞれのテキストをすべて取得する方法がわからないことです。私はこのようなことを試しましたが、うまくいきませんでした:

アドバイスありがとうございます!

0 投票する
1 に答える
603 参照

android - HTMLCleaner で解析されたテキストの問題 - テキストの先頭にあるスペース

Web サイトから HTMLCleaner を使用してテキストを取得できます。問題は、テキストを TextView に設定すると、テキストの先頭に大きなスペースが表示されることです。スクリーンショット

試してみandroid:gravityましたが、何も起こりませんでした。

助けてください。

ここに私のコードがあります:

0 投票する
1 に答える
844 参照

android -
HTMLCleaner でタグを処理するには?

HTMLCleaner での解析中に、すべての「br」タグが無視されます。「br」タグの処理方法を知りたいです。

例を次に示します。

出力は、消去された br タグです。

何か案は?助けが必要です。

前もって感謝します。

0 投票する
2 に答える
863 参照

java - HTMLファイルのXPathでHTMLを抽出

特定の Xpath にあるファイルから html コードを取得しようとしています。HTMLUnit を使用してみましたが、Google キャッシュからダウンロードしたこれらの静的ファイルをうまく処理できないようです。私は HTMLCleaner で少し運が良かったのですが、これまでのところテキストだけを取得でき、HTML コードは取得できませんでした。どんな提案も役に立ちます。以下は私が現在使用しているコードです。

0 投票する
2 に答える
1005 参照

android - AsyncTaskのHTMLcleaner

HTMLクリーナーを使用してWebサイトからの情報を解析し、Xpathを使用して探しているデータを見つけようとしています。別のAsyncTaskクラスにhtmlcleanerのものがあり、アプリは私の電話で動作するようです。ただし、ボタンを押しても何も起こりません。これが私のメインアクティビティクラスとAsyncTaskクラスです。

そして、これが私の参照クラスです。誰かがこれを見て、何が起きているのか教えてくれたら本当にありがたいです。実用的な例に従って、独自のUrlとXpathを挿入しようとしましたが、機能しません。

0 投票する
2 に答える
492 参照

android - HTMLcleaner スタック トレース エラー

私はプロジェクトに取り組んでおり、問題が発生しました。HTMLクリーナーを使用してhtmlを解析し、xpathを使用して文字列を返そうとしています。エラーが見つかった場合はスタックトレースを返すようにしました(エラーが発生しました)。スタックトレースに基づいてデバッグする方法が本当にわかりません。これがコードです。

これが私のHTMLヘルパークラスです

UI と読み込みバーは正常に動作しますが、TextView は [Ljava.lang.Object;@42455a88 を返し続けます。

これについての助けを本当に感謝しています...私は一日中それに取り組んでいて、それを理解できないようです. ありがとう!

0 投票する
2 に答える
195 参照

java - ifelseステートメント

いくつかのif/elseステートメントを含むコードがあります。ただし、「else」ケースがスローされると、後続のすべてのステートメントも「else」になります。これがコードです、助けていただければ幸いです!

前述のように、この問題は最初の「else」ステートメントがスローされたときに発生します。最初のケースが「if」で、2番目の「else」の場合、3番目と4番目も「else」になります