1

他のページから情報を取得し、その情報/データの一部を現在のページに表示する必要があるページを操作しています。

文字列で解析する必要のあるHTMLソースコードがあります。これを簡単に行うのに役立つライブラリを探しています。(特定のタグとそれに含まれるテキストを抽出する必要があります)HTMLは整形式です(すべての終了/終了タグが存在します)。

私はいくつかのオプションを見てきましたが、さまざまな理由でそれらすべてを操作するのは非常に困難です。

私は次の解決策を試しました:

  1. jkl-parsexmlライブラリ(ライブラリjsファイル自体がHTTPError 101をスローします)
  2. jQuery.parseXMLユーティリティ(何をすべきかを理解するための多くのドキュメント/多くの例が見つかりませんでした)
  3. XPATH(Executeステートメントは機能していませんが、JSエラーコンソールにエラーは表示されません)

そのため、前述のツールをより適切に、より簡単に、効率的に使用できる、よりユーザーフレンドリーなライブラリまたは何か(チュートリアル/書籍/リファレンス/ドキュメント)を探しています。

理想的なソリューションは、Pythonで利用可能なBeautifulSoupのようなものです。

4

2 に答える 2

4

jQueryを使用すると、その中の文字列からHTMLデータを使用してjQueryオブジェクトを作成するのと同じくらい簡単になり$(HTMLstring);ます(このDOMはドキュメントから切断されます)。そこから、好きなことを簡単に行うことができます。もちろん、ロードされたデータをトラバースするのは、jQueryを使用するのが簡単です。

于 2012-09-11T22:56:08.380 に答える
0

あなたはこのようなことをすることができます:

$("string with html here").find("jquery selector")

$("string with html here")これにより、ドキュメントフラグメントが作成され、その中にhtmlが配置されます(基本的に、HTMLが解析されます)。そしてfind、そのドキュメントフラグメント内の要素を検索します(そしてその中のみ)。同時に、ページDOMには配置されません

于 2012-09-11T22:56:52.087 に答える