問題タブ [hpricot]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ruby-on-rails - XML => Hpricot と Rails を使用した HTML
私は Web サービスや Rails を扱ったことはありませんが、これは明らかに学ぶ必要があることです。見栄えが良いので、hpricot を使用することにしました。とにかく、_why はhpricot の Web サイトで次の例を提供してくれました。
シンプルでエレガント、そして簡単に見えます。Ruby では問題なく動作しますが、私の質問は次のとおりです。これをレールで分割するにはどうすればよいですか?
これをすべて単一のコントローラーに追加して実験しましたが、ビューで呼び出す最良の方法を思いつきませんでした。
では、Web API から XML ファイルを解析し、Hpricot を使用してクリーンな HTML に出力する場合、アクティビティをモデル、ビュー、およびコントローラーに分割するにはどうすればよいでしょうか? また、何をどこに配置しますか?
ruby-on-rails - FreeBSD で構築された Hpricot 0.6 Gem を入手するにはどうすればよいですか?
FreeBSD サーバーで hpricot 0.6.164 を使用して rake gems:build を実行すると、次のようになります。
エラー: gem ネイティブ拡張のビルドに失敗しました。
/user/localbin/ruby18 extconf.rb gems:build RB_USER_INSTALL -lc で main() をチェックしています... はい Makefile を作成しています
作る
make install /usr/bin/install -c -o root -g wheel -m 0755 hpricot_scan.so /user_directory/vendor/gems/hpricot-0.6.164/lib/universal-java1.6 install: /user_directory/vendor/gems /hpricot-0.6.164/lib/universal-java1.6/hpricot_scan.so: chown/chgrp: 操作は許可されていません *** エラー コード 71
/user_directory/vendor/gems/hpricot-0.6.164/ext/hpricot_scan で停止します。
ruby - Hpricot (Ruby) を使用した HTML テーブルの解析
Hpricot を使用して HTML テーブルを解析しようとしていますが、スタックしており、指定された ID を持つページからテーブル要素を選択できません。
これが私のルビーコードです:-
これの何が問題なのかを特定するのを手伝ってくれる人はいますか。
ruby-on-rails - JRuby用hpricotのインストール
Jruby on Railsのキュウリを見ようとしています。前提条件の 1 つは、前提条件として hpricot を持つ webrat です。
以下を使用して hpricot で gem をインストールしました。
gem install hpricot --source http://code.whytheluckystiff.net --version 0.6.1 --platform java
これにより、hpricot の Java バージョンがインストールされます。hpricot_scan.jar を CLASSPATH に追加しますが、実行すると:
次の出力が得られます。
等
HpricotScanService.java ファイルをコンパイルし、結果の .class ファイルをクラスパスに追加すると、次のようになります。
hpricot の新しいバージョンをインストールしようとすると、次のようになります。
私が間違っている/していない/どこで私が愚かであるかについて、誰かの手がかりはありますか?
Windows XP、JRuby 1.2.0 を使用
ruby - hpricot と firebug の XPath
hpricot を使用してテーブル ベースの Web サイトから情報を抽出しようとしています。FireBug で XPath を取得します。
これは機能しません... どうやら、FireBug の XPath はレンダリングされた HTML のパスであり、サイトからの実際の HTML ではありません。tbody を削除すると問題が解決する可能性があることを読みました。
私は試してみます:
それでもうまくいきません...もう少し調査を行ったところ、XPathで数値が削除されたと報告している人もいるので、次のようにします。
まだ運がない...
したがって、次のように段階的に実行することにしました。
必要な情報は bbb にありますが、ccc にはありません。
私は何を間違っていますか、または長い/複雑なXPathでHTMLをスクラップするためのより良いツールがあります.
ruby - hpricotのセグメンテーション違反
私はHTMLを読むためにhpricotを使用しています。セグメンテーション違反エラーが発生しました。グーグルで検索し、最新バージョンのRubyにアップグレードすると言う人もいます。レール2.3.2とルビー1.8.7を使用しています。このエラーを解決するにはどうすればよいですか?
php - hpricot や PHP 用の美しいスープのようなものはありますか?
重複の可能性:
PHP 用の堅牢で成熟した HTML パーサー
PHPでhtmlドキュメントのサーバー側を解析および変更する良い方法を探しています。美しいスープと hpricot は非常に優れたツールのように見えますが、php では使用できません。PHPでこれを行うことができる良いライブラリはありますか? Tidy は部分的に私が探しているもののように見えますが、tidy でセレクターなどを使用できるようには見えません。
ruby-on-rails - アクションのキャッシュが機能しない
Rails アプリで Twitter と flickr から XML を取得して操作しています。結果はすべてのページに表示され、解析は Hpricot と open-uri を使用してアプリケーション コントローラーで処理されます。
これは、アクション キャッシングを使用した最初の実験であり、機能していないようです。WEBRick を使用して開発モードにしています。適切なものはすべて、development.rb で true に設定されています。
コントローラーの内容は次のとおりです。
/tmp/cache には何も表示されず、ページが読み込まれるたびに Hpricot が実行していることは明らかです。
前もって感謝します。
ruby-on-rails - プリコット要素交差点
特定の基準 (class = "int" または class = "ext") を満たさない HTML ページ (実際には tinymce ユーザー入力) からすべての画像を削除したいのですが、正しいアプローチに苦労しています。それが私がこれまで行っていることです:
しかし、クラスの値が間違っている(「int」または「ext」ではない)画像を見つける方法がわかりません。
また、要素をループして、標準の html ではない他の属性をチェックする必要があります (属性 dbsrc で設定した DB ID などの内部値を設定するためにそれらを使用します)。これらの属性にもアクセスすることはできますか? また、条件を満たさない特定の要素 (hpricot 検索結果にある要素) を削除する方法はありますか?
ご協力いただきありがとうございます!