“jsoup”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

1256 参照

java - Jsoup で HTML の文字列を解析するとエラーが発生する

私は Android アプリを作成しており、JRE 6 と最新の jSoup ライブラリを使用しています。次の方法を使用して、HTML を含む文字列を解析しようとしています。

次の例外が発生します。

java.lang.NoSuchMethodError java.lang.string.isEmpty

どうすればこれを修正できますか?

2011-06-13T21:51:54.567

0 投票する

6 に答える

27888 参照

java - JSONコンテンツの読み取り

私はjsoupを使用していくつかのHTMLデータをスクレイプしていますが、うまく機能しています。次に、いくつかのJSONコンテンツをプルする必要があります（HTMLではなくJSONのみ）。jsoupを使用してこれを簡単に行うことはできますか、それとも別の方法を使用して行う必要がありますか？jsoupが実行する解析は、JSONデータをエンコードしているため、Gsonでは正しく解析されません。

java gson jsoup

2011-06-14T19:02:23.887

0 投票する

1 に答える

1987 参照

入札 Web サイトのコンテンツをスクレイピングしようとしていますが、Web サイトの完全なページを取得できません。xulrunner で crowbar を使用して最初にページをフェッチし (ajax が特定の要素を遅延してロードするため)、次にファイルからスクレイピングしています。しかし、Bidrivals Web サイトのメインページでは、ローカルファイルが適切な形式であっても、これは失敗します。jSoup は、html コードの途中で「...」文字で終わっているようです。誰かが以前にこれに遭遇した場合は、助けてください。次のコードは [このリンク] で呼び出されます。

java web-scraping jsoup

2011-06-16T06:43:57.190

0 投票する

2 に答える

218 参照

java - JavaのWebページから情報を取得するにはどうすればよいですか？

JavaのWebページから情報を取得する簡単な方法を知っている人はいますか？たとえば、次のようなページを見ている場合：http ://www.ncbi.nlm.nih.gov/pubmed/?term= 10952317「MeSHTerms」という見出しの下にある単語のリストを抽出したい、どうすればそうできますか？

ソースを読み取ることができるものがありますが、HTMLタグなどでいっぱいです...

どんな助けでも大歓迎です！

java html file-io jsoup

2011-06-16T15:55:23.603

0 投票する

3 に答える

5171 参照

jsoup - tbodyタグ付きのHtmlファイルを解析するJsoup

私はちょうど最近、tbody タグに関して一貫性のない Jsoup の動作に気付きました。

Jsoup は、select メソッド () によって返される要素に tbody 要素を含めません。

メソッド connect().get() を使用して、次のようなドキュメント変数にリモートページを読み込みます。

しかし、ローカルディスクで同じページを解析したとき (ダウンロード後)。Jsoup には tbody タグが含まれています。tbody 要素が欠落しているため、式が機能しなくなります。

私が使う：

私の Jsoup 式は、最初のケースでのみ機能します。

両方のケースで同じ式を使用できるように、Jsoup に tbody 要素を認識させる (または削除する) ようにする方法はありますか?

これは Jsoup の正常な動作ですか?

ローカルページの解析にも connect メソッドを使用する必要がありますか?

jsoup

2011-06-17T14:11:58.137

0 投票する

6 に答える

62535 参照

java - jsoupの投稿とCookie

jsoupを使用してサイトにログインしてから情報を取得しようとしていますが、問題が発生しています。正常にログインしてindex.phpからドキュメントを作成できますが、サイトの他のページを取得できません。投稿後にCookieを設定し、サイトで別のページを開こうとしたときにCookieを読み込む必要があることはわかっています。しかし、どうすればこれを行うことができますか？次のコードを使用すると、ログインしてindex.phpを取得できます

私はapachehttpclientを使用してこれを行うことができることを知っていますが、したくありません。

java screen-scraping jsoup

2011-06-21T22:56:07.373

0 投票する

3 に答える

77 参照

java - アプリケーション内のWebページのコンテンツを処理する方法

私のシステム（私はJSPを使用しています）は、Web上の既存のWebサイトを処理します。私のアプリケーションは、いくつかの単語を強調表示するなど、いくつかの変更を加えてそのWebサイトのページを表示できるはずです。

したがって、私のプログラムは、そのWebサイトからページを取得し、特定の単語を強調表示してから、システムのユーザーに強調表示された単語を含むページを再度表示します。

Javaを使用してそれを行うにはどうすればよいですか？

java xml jsp jsoup

2011-06-23T17:37:33.867

0 投票する

2 に答える

1153 参照

android - Android での get() の Jsoup エラー

Android アプリケーションで Jsoup 1.6.0 を使用しようとしていますが、何らかの理由でクラッシュします。コードを次のように単純化しました。

しかし、携帯電話 (USB デバッグモード) またはエミュレーターで上記を実行すると、プログラムが予期せずクラッシュしたというメッセージが表示されます。エラーはキャッチされませんでした。try ブロックの内容を

プログラムは正常に動作するので、get() メソッドが問題を引き起こしているようです...

参考までに、私の AndroidManifest.xml に含めました

R.layout.main は、新しいプロジェクトを作成するときに ADT が生成するデフォルトのレイアウトです。このプロジェクトでは Android API レベル 7 を使用しています。これを機能させるにはどうすればよいですか？

android jsoup

2011-06-23T18:21:01.440

0 投票する

3 に答える

582 参照

java - Jsoupが「0」のみを含むHtmlタグを解析すると、nullが返されますか？

私はjsoup-1.6.0を使用し、文字列コンテンツ「0」のみを含むhtmlタグ文字列を解析しますが、jsoupはnullを返します。

例：

なんで？

答え：

これはバグであるはずです。binary_runnerはjsoup-1.3.3がうまく機能すると言っていますが、私はjsoup-1.5.2もうまく機能することをテストします。そこで、jsoup-1.5.2を使用することにしました。

binary_runnerに感謝します！

java jsoup

2011-06-24T07:09:30.010

0 投票する

1 に答える

5620 参照

android - Androidでウェブ上のデータを操作する

私は新しいAndroidプログラマーですが、私の質問は次のとおりです。

HTMLファイルから情報を取得したい。それをダウンロードして快適な方法で解析するための最良の方法は何でしょうか？

ありがとう！

android jsoup

2011-06-24T10:47:26.447

問題タブ [jsoup]

java - Jsoup で HTML の文字列を解析するとエラーが発生する

java - JSONコンテンツの読み取り

java - 部分ページをフェッチするJsoup

java - JavaのWebページから情報を取得するにはどうすればよいですか？

jsoup - tbodyタグ付きのHtmlファイルを解析するJsoup

java - jsoupの投稿とCookie

java - アプリケーション内のWebページのコンテンツを処理する方法

android - Android での get() の Jsoup エラー

java - Jsoupが「0」のみを含むHtmlタグを解析すると、nullが返されますか？

android - Androidでウェブ上のデータを操作する

問題タブ [jsoup]

Reference