他のページから情報を取得し、その情報/データの一部を現在のページに表示する必要があるページを操作しています。
文字列で解析する必要のあるHTMLソースコードがあります。これを簡単に行うのに役立つライブラリを探しています。(特定のタグとそれに含まれるテキストを抽出する必要があります)HTMLは整形式です(すべての終了/終了タグが存在します)。
私はいくつかのオプションを見てきましたが、さまざまな理由でそれらすべてを操作するのは非常に困難です。
私は次の解決策を試しました:
- jkl-parsexmlライブラリ(ライブラリjsファイル自体がHTTPError 101をスローします)
- jQuery.parseXMLユーティリティ(何をすべきかを理解するための多くのドキュメント/多くの例が見つかりませんでした)
- XPATH(Executeステートメントは機能していませんが、JSエラーコンソールにエラーは表示されません)
そのため、前述のツールをより適切に、より簡単に、効率的に使用できる、よりユーザーフレンドリーなライブラリまたは何か(チュートリアル/書籍/リファレンス/ドキュメント)を探しています。
理想的なソリューションは、Pythonで利用可能なBeautifulSoupのようなものです。