問題タブ [jsoup]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Jsoup の正規表現は、Android プロジェクトではなく Java プロジェクトで動作します
Jsoup HTML パーサーを使用して Web サイトからサムネイル URL を取得しようとしています。60x60.jpg(または png) で終わるすべての URL を抽出する必要があります (すべてのサムネイル URL はこの URL で終わります)。
問題は、通常のJavaプロジェクトで動作するようになることですが、Androidでは動作しません。(正規表現の問題)
このコードは Java プロジェクトで機能します。
そしてurls配列を印刷します..Androidプロジェクトではなく、Javaで動作します。
Android で機能する唯一の正規表現はこれだけです
Androidでは問題なく動作します...jpgで終わるすべてのリンクは必要ありませんが
使ってみた
.(png|jpg) の前に 1 つのスラッシュがあっても、まだ良くありません。
正規表現の問題ですか?それはAndroidまたは何とは異なりますか?通常のJavaプロジェクトで動作するため、パーサーの問題ではありません..
java - java を使用して xml を解析し、html タグを保持する
ノード間からデータを解析して取得するxmlがあります。ただし、このデータは html タグで囲まれています。別の xml を作成し、このデータをその中に入れます。ここで、適切な html 構文を取得するために再度解析する必要があります。
親切に助けてください。
プロセスを開始する私のクラス
jsoup から変換した後に取得するサンプル xml
ニュースタグの間のコンテンツを抽出したい。この xml は XMLFunctions クラスの XMLfromString(String xml) 関数に渡され、"<" のみが返され、本文の残りの部分が残されます。
フォーマットを提供するための html タグを含む本文を取得できません。
html - Jsoup:Safe Elements.get(0)
次のコードスニペットは、1つだけの要素、具体的には最初の要素を抽出します。
これは、簡潔なものと比較すると非常に面倒なコードですlinks.get(0)
が、重要な機能が1つあります。それは、Elementsが空の場合にifをスローしないことです。IndexOutOfBoundException
代わりに、文字列を空のままにします。
これを自分の関数にカプセル化することはできますが、Jsoupにそのような関数がまだないことを信じるのは難しいです(可能な限り「車輪の再発明」よりもライブラリ関数を使用する方が好きです)。ドキュメントを検索しましたが、見つかりませんでした。
Elements.get(0)
そのような「安全」がJsoupに存在するかどうか知っていますか?
html - スープ:
HTML 4.01 では、 <a> 要素にはインライン要素のみを含めることができると規定されています。<div> はブロック要素であるため、<a> 内に表示されない場合があります。
しかし...
HTML5 では、 <a> 要素にブロックを含めることができます。
さて、次を使用して、ブロック<div class="m">
内でを選択しようとしました。<a>
divがそこにあるにもかかわらず、elmesは空を返します。
だから私は考えています: a 内の div を選択するための正しい構文を使用していないか、または... Jsoup はこの HTML5 のみの機能をサポートしていませんか?
div
内でを選択するための正しいJsoup構文は何a
ですか?
更新:試してみました
また、Jsoup には問題はありませんでした (つまり、a 内のそのような div の正しい数を返します)。
だから私の質問は今です:なぜですか?
なぜ機能しないa.getElementsByClass("m")
のに機能するのa.select("m")
ですか?
更新:@Delan Azabaniの提案に従って、試してみました:
そしてそれはうまくいきました。したがって、基本的には機能しますが、クラス名の前がありa.select()
ませんでした。.
java - 文字列を解析し、異なるIDを持つHTML要素を収集する
HTMLコンテンツを「Html_content」という文字列に渡しました。文字列「Html_content」を解析し、そこにあるIDを使用していくつかのDIVタグを選択する必要があります。たとえば、「fullHeader」はDIVのIDです。「fullHeader」のdivタグ内にあるコンテンツを選択し、文字列を保存する必要があります。
JSOUPを試しましたが、収集したdivタグをDocument内に保存する必要がありますが、文字列として保存する必要がありますが、Jsoupを使用することはできません。代替手段はありますか?
java - HTMLパーサーから要素を取得する
JSOUPを使用していて、特定のdivタグIDで始まる要素を取得しようとしています。例えば:
要素が文字列「test」で始まるかどうかを確認し、すべての要素を取得する必要があります。
http://jsoup.org/cookbook/extracting-data/selector-syntaxを見て、以下を使用して複数のバリエーションを試しました。
しかし、それでも機能しませんでした。どんな助けでも大歓迎です。
configuration - 外部 jar ライブラリを Intellij IDEA に追加する
私はばかげた問題を抱えています:Intellij Ideaで開発されたAndroidアプリケーションにJsoupライブラリ(単なる外部jar)を追加しようとしていますが、正しく動作しないようです. ライブラリを libs フォルダーに入れ、次に Project Structure -> modules and selected dependencies に移動し、 add global library を選択し、 attach source を選択して、[OK] をクリックします。
コードを記述すると、クラスを自動的にインポートしてコンパイルできますが、実行すると「 java.lang.NoClassDefFoundError: org.jsoup.Jsoup 」が発生します
java - JSoup: 文字列を置き換えると新しい行が追加されます
JSoup には次の問題があります。
次のhtmlコードを解析して変更したい:
私はそれを達成するために次のコードを使用しています:
まず、それは機能します。すべてのインポート URL は文字列 " " に置き換えられFOUND
ます。私が抱えている問題は、最後の import ステートメントとクローズされた</style>
Tag の間に新しい行がたくさんあることです。
なぜこれが起こっているのか、どうすれば回避できるのか手がかりはありますか?
フォーマットが悪くて申し訳ありませんが、コードの一部が投稿時に削除されているようです。最初のコードブロックを囲むスタイルタグがあります...
java - jSoup要素から配列を作成するにはどうすればよいですか?(java)
Html(values = "valueIWant")の一部で値を取得し、それらを配列に含めるにはどうすればよいですか?次のことを試しましたが、うまくいきませんでした。
だから誰かが答えを得ましたか?ありがとう。(ところで、私はJsoupを使用しています)
android - AndroidjSoupヘルプ
jSoupを使用して、このURLhttp : //skyalipi.blogspot.com/2011/04/there-is-no-resistance-without.htmlからhtmlを解析しようとしています。私はこのコードを使用しています
ログには、次のようなものがあります。
段落の内容を取得したい。どこが間違っているのかわかりません。次のURLも参照しましたhttp://jsoup.org/cookbook/extracting-data/attributes-text-html助けてください