問題タブ [jsoup]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1256 参照

java - Jsoup で HTML の文字列を解析するとエラーが発生する

私は Android アプリを作成しており、JRE 6 と最新の jSoup ライブラリを使用しています。次の方法を使用して、HTML を含む文字列を解析しようとしています。

次の例外が発生します。

java.lang.NoSuchMethodError java.lang.string.isEmpty

どうすればこれを修正できますか?

0 投票する
6 に答える
27888 参照

java - JSONコンテンツの読み取り

私はjsoupを使用していくつかのHTMLデータをスクレイプしていますが、うまく機能しています。次に、いくつかのJSONコンテンツをプルする必要があります(HTMLではなくJSONのみ)。jsoupを使用してこれを簡単に行うことはできますか、それとも別の方法を使用して行う必要がありますか?jsoupが実行する解析は、JSONデータをエンコードしているため、Gsonでは正しく解析されません。

0 投票する
1 に答える
1987 参照

java - 部分ページをフェッチするJsoup

入札 Web サイトのコンテンツをスクレイピングしようとしていますが、Web サイトの完全なページを取得できません。xulrunner で crowbar を使用して最初にページをフェッチし (ajax が特定の要素を遅延してロードするため)、次にファイルからスクレイピングしています。しかし、Bidrivals Web サイトのメインページでは、ローカル ファイルが適切な形式であっても、これは失敗します。jSoup は、html コードの途中で「...」文字で終わっているようです。誰かが以前にこれに遭遇した場合は、助けてください。次のコードは [このリンク] で呼び出されます。

0 投票する
2 に答える
218 参照

java - JavaのWebページから情報を取得するにはどうすればよいですか?

JavaのWebページから情報を取得する簡単な方法を知っている人はいますか?たとえば、次のようなページを見ている場合:http ://www.ncbi.nlm.nih.gov/pubmed/?term= 10952317「MeSHTerms」という見出しの下にある単語のリストを抽出したい、どうすればそうできますか?

ソースを読み取ることができるものがありますが、HTMLタグなどでいっぱいです...

どんな助けでも大歓迎です!

0 投票する
3 に答える
5171 参照

jsoup - tbodyタグ付きのHtmlファイルを解析するJsoup

私はちょうど最近、tbody タグに関して一貫性のない Jsoup の動作に気付きました。

Jsoup は、select メソッド () によって返される要素に tbody 要素を含めません。

メソッド connect().get() を使用して、次のようなドキュメント変数にリモート ページを読み込みます。

しかし、ローカル ディスクで同じページを解析したとき (ダウンロード後)。Jsoup には tbody タグが含まれています。tbody 要素が欠落しているため、式が機能しなくなります。

私が使う:

私の Jsoup 式は、最初のケースでのみ機能します。

両方のケースで同じ式を使用できるように、Jsoup に tbody 要素を認識させる (または削除する) ようにする方法はありますか?

これは Jsoup の正常な動作ですか?

ローカル ページの解析にも connect メソッドを使用する必要がありますか?

0 投票する
6 に答える
62535 参照

java - jsoupの投稿とCookie

jsoupを使用してサイトにログインしてから情報を取得しようとしていますが、問題が発生しています。正常にログインしてindex.phpからドキュメントを作成できますが、サイトの他のページを取得できません。投稿後にCookieを設定し、サイトで別のページを開こうとしたときにCookieを読み込む必要があることはわかっています。しかし、どうすればこれを行うことができますか?次のコードを使用すると、ログインしてindex.phpを取得できます

私はapachehttpclientを使用してこれを行うことができることを知っていますが、したくありません。

0 投票する
3 に答える
77 参照

java - アプリケーション内のWebページのコンテンツを処理する方法

私のシステム(私はJSPを使用しています)は、Web上の既存のWebサイトを処理します。私のアプリケーションは、いくつかの単語を強調表示するなど、いくつかの変更を加えてそのWebサイトのページを表示できるはずです。

したがって、私のプログラムは、そのWebサイトからページを取得し、特定の単語を強調表示してから、システムのユーザーに強調表示された単語を含むページを再度表示します。

Javaを使用してそれを行うにはどうすればよいですか?

0 投票する
2 に答える
1153 参照

android - Android での get() の Jsoup エラー

Android アプリケーションで Jsoup 1.6.0 を使用しようとしていますが、何らかの理由でクラッシュします。コードを次のように単純化しました。

しかし、携帯電話 (USB デバッグ モード) またはエミュレーターで上記を実行すると、プログラムが予期せずクラッシュしたというメッセージが表示されます。エラーはキャッチされませんでした。try ブロックの内容を

プログラムは正常に動作するので、get() メソッドが問題を引き起こしているようです...

参考までに、私の AndroidManifest.xml に含めました

R.layout.main は、新しいプロジェクトを作成するときに ADT が生成するデフォルトのレイアウトです。このプロジェクトでは Android API レベル 7 を使用しています。これを機能させるにはどうすればよいですか?

0 投票する
3 に答える
582 参照

java - Jsoupが「0」のみを含むHtmlタグを解析すると、nullが返されますか?

私はjsoup-1.6.0を使用し、文字列コンテンツ「0」のみを含むhtmlタグ文字列を解析しますが、jsoupはnullを返します。

例:

なんで?


答え:

これはバグであるはずです。binary_runnerはjsoup-1.3.3がうまく機能すると言っていますが、私はjsoup-1.5.2もうまく機能することをテストします。そこで、jsoup-1.5.2を使用することにしました。

binary_runnerに感謝します!

0 投票する
1 に答える
5620 参照

android - Androidでウェブ上のデータを操作する

私は新しいAndroidプログラマーですが、私の質問は次のとおりです。

HTMLファイルから情報を取得したい。それをダウンロードして快適な方法で解析するための最良の方法は何でしょうか?

ありがとう!