問題タブ [hpricot]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
122 参照

css - Ruby: Web ページの計算されたスタイル

Hpricot を使用して html ページを解析していますが、要素ごとに計算されたスタイルを取得する必要があります。たとえば、h1 Hpricot 要素があり、ページの外部 CSS に h1 の background-image が定義されている場合、background-image が何であるかを確認するにはどうすればよいですか?

0 投票する
1 に答える
338 参照

ruby - Hpricotを使用した非同期応答によるページのスクレイピング

ページをスクレイプしようとしていますが、コンテンツが非同期で送り込まれるため、最初の応答は本文に何もありません。たとえば、アップルのWebサイトでの検索結果:http://www.apple.com/uk/search/ ?q = searching + for + something&sec = global

hpricotで検索した結果をうまく取得する方法について何かアイデアはありますか?

ありがとう。

0 投票する
3 に答える
2804 参照

xpath - Xpath 検索でコロンをエスケープする

私はこのhtml入力要素を持っているセレンでHpricotを使用しています:

そして、この Xpath 式でこの値を取得しようとしています:

しかし、コロンのために何も見つかりません。Xpath 式にコロンを含めることはできません。いろいろな方法で逃げようとしましたが、うまくいきません。

それを回避したり、この問題を回避したりする方法はありますか? html の値を変更できないため、foo:bar はこのようにしてコロンを使用する必要があります。しかし、どうにかしてこの要素を見つける必要があります。

何か案は?

ありがとう

0 投票する
2 に答える
946 参照

ruby - hpricot のエンコードの問題

Ruby 1.9 で hpricot を使用して Web ページをスクレイピングしようとすると、次のエンコード エラーが発生します。

次のようにしてエラーを再現できます。

0 投票する
1 に答える
622 参照

ruby - ノードをルビー文字列に置き換える方法は?

<img>HTMLファイル内のすべてのタグを<%= image_tag() %>railsタグに置き換えようとしています。

私がやりたいことは次のようなものです:

必要なのは、ファイル内のノードを、渡す文字列に置き換える関数です。

アップデート:

正規表現を使用したくないので、Hpricotを選択しました。これは、HTMLを解析してから、すべての属性を含めてElement.attributes生成できるためです。image_tag

私のimgタグが次のような場合はどうなりますか?

また

私が何を意味するのか分かりますか?エスケープスラッシュを含む.SQLファイルを解析する場合があります。src属性は、別の属性の後にある可能性があります。

image_tag問題は、私が与えた場合に私のanを返す関数をすでに実行したことですがHpricot::Element、Hpricotドキュメントで元のノードを私の文字列に置き換える方法がわかりません。

0 投票する
1 に答える
134 参照

html - Hpricotを使用して要素のクラス属性を削除します

どうすればいいのですか?例えば、

になる必要があります

0 投票する
1 に答える
115 参照

ruby-on-rails - hpricot の解析問題

次のような XML があります。

hpricot を使用して ' http://www.someweb.com/something.png ' だけを抽出する正しい方法は何ですか? 私が得ることができる最も近いものはこれです...

github で hpricot の README を読み、Google で検索しましたが、まだ何も見つかりませんでした。ご回答ありがとうございます。

0 投票する
2 に答える
527 参照

ruby - Hpricotを使用して、任意の/ほとんどのWebサイトの主要な記事のテキストを検索できますか?

記事を表示するWebページから本文を抽出する方法が必要です。Readabilityが実行されている任意のWebサイトでメインテキストを見つける方法と同様です。

私はRubyonRailsを使用しているので、Hpricotが最善の策だと思います。私が探しているものはHpricotで可能ですか?どこかに例はありますか?読んでくれてありがとう。


0 投票する
3 に答える
983 参照

tags - Hpricotを介してページから最大の画像を取得する

Hpricotで解析したページから最大の画像を取得しようとしていますが、うまくいきません。imgタグの幅と高さの属性にアクセスするにはどうすればよいですか?

0 投票する
3 に答える
962 参照

javascript - Ruby Hpricot RegExは、を次のように置き換え
ます

誰かがHpricotとRegExを使用してこのJavascriptの行をRubyに変換する方法を教えてもらえますか?

私が設定したコードは次のとおりです。

ありがとう