問題タブ [htmlcleaner]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - クリーニング中に Java htmlcleaner がクラッシュする
こんにちは私のコードでは、次の行を実行しますが、このコードは実行中にクラッシュします。
これはエラーのスタック トレースです。
なぜそれが起こっているのかを知るのを手伝ってくれる人はいますか?
敬具、ゾリ
java - ソースを整理せずにHTMLパーサー
私のマシンには数百の古いhtmlファイルがあり、それらを解析してデータを抽出しようとしています。Jsoup、Tagsoup、HTMLcleaner、JTidyなどのさまざまなJavaパーサーを試しました。ファイル内のhtmlコードの方法により、XPATHをサポートするパーサーしか使用できず、Jsoupを試しましたが、同等のcssセレクターが見つかりませんでした。
とにかく、私の問題は、私が試したパーサーが何であれ、実際のコンテンツをクリーンアップし、'(アポストロフィ)のようなものを奇妙な文字に変換することです。
特別な文字を整理して置き換えることなく、Javaパーサーを使用してコンテンツを解析することは可能ですか?
java - HTML アセットを適切に取得する方法
HtmlCleaner を使用して HTML を解析するためのチュートリアル、具体的には次のチュートリアルに従っています: http://xjaphx.wordpress.com/2012/02/04/android-xml-adventure-parsing-html-using-htmlcleaner/
URL を取得し、そのページの html を変更するコードの一部があります。
Web ページを適切に保存し、アセットとして保存して、同じ目標を達成するにはどうすればよいですか?
ありがとう
xpath - 特定のノード要素の下のノードを取得する
ここで私の問題について助けが必要か、少なくともいくつかのアドバイスが必要です。XPATH を使用して HTMLcleaner を使用して HTML ドキュメントを解析しています。
私はこのようなものを持っています:
Ok。いくつかの<h4>
タグがあり、それぞれに<a>
タグといくつかのテキストがあります。私の問題は、「h4 [i]」のように、特定の からそれぞれのテキストをすべて取得する方法がわからないことです。私はこのようなことを試しましたが、うまくいきませんでした:
アドバイスありがとうございます!
android -
HTMLCleaner でタグを処理するには?
HTMLCleaner での解析中に、すべての「br」タグが無視されます。「br」タグの処理方法を知りたいです。
例を次に示します。
出力は、消去された br タグです。
何か案は?助けが必要です。
前もって感謝します。
java - HTMLファイルのXPathでHTMLを抽出
特定の Xpath にあるファイルから html コードを取得しようとしています。HTMLUnit を使用してみましたが、Google キャッシュからダウンロードしたこれらの静的ファイルをうまく処理できないようです。私は HTMLCleaner で少し運が良かったのですが、これまでのところテキストだけを取得でき、HTML コードは取得できませんでした。どんな提案も役に立ちます。以下は私が現在使用しているコードです。
android - AsyncTaskのHTMLcleaner
HTMLクリーナーを使用してWebサイトからの情報を解析し、Xpathを使用して探しているデータを見つけようとしています。別のAsyncTaskクラスにhtmlcleanerのものがあり、アプリは私の電話で動作するようです。ただし、ボタンを押しても何も起こりません。これが私のメインアクティビティクラスとAsyncTaskクラスです。
そして、これが私の参照クラスです。誰かがこれを見て、何が起きているのか教えてくれたら本当にありがたいです。実用的な例に従って、独自のUrlとXpathを挿入しようとしましたが、機能しません。
android - HTMLcleaner スタック トレース エラー
私はプロジェクトに取り組んでおり、問題が発生しました。HTMLクリーナーを使用してhtmlを解析し、xpathを使用して文字列を返そうとしています。エラーが見つかった場合はスタックトレースを返すようにしました(エラーが発生しました)。スタックトレースに基づいてデバッグする方法が本当にわかりません。これがコードです。
これが私のHTMLヘルパークラスです
UI と読み込みバーは正常に動作しますが、TextView は [Ljava.lang.Object;@42455a88 を返し続けます。
これについての助けを本当に感謝しています...私は一日中それに取り組んでいて、それを理解できないようです. ありがとう!
java - ifelseステートメント
いくつかのif/elseステートメントを含むコードがあります。ただし、「else」ケースがスローされると、後続のすべてのステートメントも「else」になります。これがコードです、助けていただければ幸いです!
前述のように、この問題は最初の「else」ステートメントがスローされたときに発生します。最初のケースが「if」で、2番目の「else」の場合、3番目と4番目も「else」になります