問題タブ [jsoup]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Jsoup で HTML の文字列を解析するとエラーが発生する
私は Android アプリを作成しており、JRE 6 と最新の jSoup ライブラリを使用しています。次の方法を使用して、HTML を含む文字列を解析しようとしています。
次の例外が発生します。
java.lang.NoSuchMethodError java.lang.string.isEmpty
どうすればこれを修正できますか?
java - JSONコンテンツの読み取り
私はjsoupを使用していくつかのHTMLデータをスクレイプしていますが、うまく機能しています。次に、いくつかのJSONコンテンツをプルする必要があります(HTMLではなくJSONのみ)。jsoupを使用してこれを簡単に行うことはできますか、それとも別の方法を使用して行う必要がありますか?jsoupが実行する解析は、JSONデータをエンコードしているため、Gsonでは正しく解析されません。
java - 部分ページをフェッチするJsoup
入札 Web サイトのコンテンツをスクレイピングしようとしていますが、Web サイトの完全なページを取得できません。xulrunner で crowbar を使用して最初にページをフェッチし (ajax が特定の要素を遅延してロードするため)、次にファイルからスクレイピングしています。しかし、Bidrivals Web サイトのメインページでは、ローカル ファイルが適切な形式であっても、これは失敗します。jSoup は、html コードの途中で「...」文字で終わっているようです。誰かが以前にこれに遭遇した場合は、助けてください。次のコードは [このリンク] で呼び出されます。
java - JavaのWebページから情報を取得するにはどうすればよいですか?
JavaのWebページから情報を取得する簡単な方法を知っている人はいますか?たとえば、次のようなページを見ている場合:http ://www.ncbi.nlm.nih.gov/pubmed/?term= 10952317「MeSHTerms」という見出しの下にある単語のリストを抽出したい、どうすればそうできますか?
ソースを読み取ることができるものがありますが、HTMLタグなどでいっぱいです...
どんな助けでも大歓迎です!
jsoup - tbodyタグ付きのHtmlファイルを解析するJsoup
私はちょうど最近、tbody タグに関して一貫性のない Jsoup の動作に気付きました。
Jsoup は、select メソッド () によって返される要素に tbody 要素を含めません。
メソッド connect().get() を使用して、次のようなドキュメント変数にリモート ページを読み込みます。
しかし、ローカル ディスクで同じページを解析したとき (ダウンロード後)。Jsoup には tbody タグが含まれています。tbody 要素が欠落しているため、式が機能しなくなります。
私が使う:
私の Jsoup 式は、最初のケースでのみ機能します。
両方のケースで同じ式を使用できるように、Jsoup に tbody 要素を認識させる (または削除する) ようにする方法はありますか?
これは Jsoup の正常な動作ですか?
ローカル ページの解析にも connect メソッドを使用する必要がありますか?
java - jsoupの投稿とCookie
jsoupを使用してサイトにログインしてから情報を取得しようとしていますが、問題が発生しています。正常にログインしてindex.phpからドキュメントを作成できますが、サイトの他のページを取得できません。投稿後にCookieを設定し、サイトで別のページを開こうとしたときにCookieを読み込む必要があることはわかっています。しかし、どうすればこれを行うことができますか?次のコードを使用すると、ログインしてindex.phpを取得できます
私はapachehttpclientを使用してこれを行うことができることを知っていますが、したくありません。
java - アプリケーション内のWebページのコンテンツを処理する方法
私のシステム(私はJSPを使用しています)は、Web上の既存のWebサイトを処理します。私のアプリケーションは、いくつかの単語を強調表示するなど、いくつかの変更を加えてそのWebサイトのページを表示できるはずです。
したがって、私のプログラムは、そのWebサイトからページを取得し、特定の単語を強調表示してから、システムのユーザーに強調表示された単語を含むページを再度表示します。
Javaを使用してそれを行うにはどうすればよいですか?
android - Android での get() の Jsoup エラー
Android アプリケーションで Jsoup 1.6.0 を使用しようとしていますが、何らかの理由でクラッシュします。コードを次のように単純化しました。
しかし、携帯電話 (USB デバッグ モード) またはエミュレーターで上記を実行すると、プログラムが予期せずクラッシュしたというメッセージが表示されます。エラーはキャッチされませんでした。try ブロックの内容を
プログラムは正常に動作するので、get() メソッドが問題を引き起こしているようです...
参考までに、私の AndroidManifest.xml に含めました
R.layout.main は、新しいプロジェクトを作成するときに ADT が生成するデフォルトのレイアウトです。このプロジェクトでは Android API レベル 7 を使用しています。これを機能させるにはどうすればよいですか?
java - Jsoupが「0」のみを含むHtmlタグを解析すると、nullが返されますか?
私はjsoup-1.6.0を使用し、文字列コンテンツ「0」のみを含むhtmlタグ文字列を解析しますが、jsoupはnullを返します。
例:
なんで?
答え:
これはバグであるはずです。binary_runnerはjsoup-1.3.3がうまく機能すると言っていますが、私はjsoup-1.5.2もうまく機能することをテストします。そこで、jsoup-1.5.2を使用することにしました。
binary_runnerに感謝します!
android - Androidでウェブ上のデータを操作する
私は新しいAndroidプログラマーですが、私の質問は次のとおりです。
HTMLファイルから情報を取得したい。それをダウンロードして快適な方法で解析するための最良の方法は何でしょうか?
ありがとう!