問題タブ [hpricot]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
css - Ruby: Web ページの計算されたスタイル
Hpricot を使用して html ページを解析していますが、要素ごとに計算されたスタイルを取得する必要があります。たとえば、h1 Hpricot 要素があり、ページの外部 CSS に h1 の background-image が定義されている場合、background-image が何であるかを確認するにはどうすればよいですか?
ruby - Hpricotを使用した非同期応答によるページのスクレイピング
ページをスクレイプしようとしていますが、コンテンツが非同期で送り込まれるため、最初の応答は本文に何もありません。たとえば、アップルのWebサイトでの検索結果:http://www.apple.com/uk/search/ ?q = searching + for + something&sec = global
hpricotで検索した結果をうまく取得する方法について何かアイデアはありますか?
ありがとう。
xpath - Xpath 検索でコロンをエスケープする
私はこのhtml入力要素を持っているセレンでHpricotを使用しています:
そして、この Xpath 式でこの値を取得しようとしています:
しかし、コロンのために何も見つかりません。Xpath 式にコロンを含めることはできません。いろいろな方法で逃げようとしましたが、うまくいきません。
それを回避したり、この問題を回避したりする方法はありますか? html の値を変更できないため、foo:bar はこのようにしてコロンを使用する必要があります。しかし、どうにかしてこの要素を見つける必要があります。
何か案は?
ありがとう
ruby - hpricot のエンコードの問題
Ruby 1.9 で hpricot を使用して Web ページをスクレイピングしようとすると、次のエンコード エラーが発生します。
次のようにしてエラーを再現できます。
ruby - ノードをルビー文字列に置き換える方法は?
<img>
HTMLファイル内のすべてのタグを<%= image_tag() %>
railsタグに置き換えようとしています。
私がやりたいことは次のようなものです:
必要なのは、ファイル内のノードを、渡す文字列に置き換える関数です。
アップデート:
正規表現を使用したくないので、Hpricotを選択しました。これは、HTMLを解析してから、すべての属性を含めてElement.attributes
生成できるためです。image_tag
私のimgタグが次のような場合はどうなりますか?
また
私が何を意味するのか分かりますか?エスケープスラッシュを含む.SQLファイルを解析する場合があります。src
属性は、別の属性の後にある可能性があります。
image_tag
問題は、私が与えた場合に私のanを返す関数をすでに実行したことですがHpricot::Element
、Hpricotドキュメントで元のノードを私の文字列に置き換える方法がわかりません。
html - Hpricotを使用して要素のクラス属性を削除します
どうすればいいのですか?例えば、
になる必要があります
ruby-on-rails - hpricot の解析問題
次のような XML があります。
hpricot を使用して ' http://www.someweb.com/something.png ' だけを抽出する正しい方法は何ですか? 私が得ることができる最も近いものはこれです...
github で hpricot の README を読み、Google で検索しましたが、まだ何も見つかりませんでした。ご回答ありがとうございます。
ruby - Hpricotを使用して、任意の/ほとんどのWebサイトの主要な記事のテキストを検索できますか?
記事を表示するWebページから本文を抽出する方法が必要です。Readabilityが実行されている任意のWebサイトでメインテキストを見つける方法と同様です。
私はRubyonRailsを使用しているので、Hpricotが最善の策だと思います。私が探しているものはHpricotで可能ですか?どこかに例はありますか?読んでくれてありがとう。
tags - Hpricotを介してページから最大の画像を取得する
Hpricotで解析したページから最大の画像を取得しようとしていますが、うまくいきません。imgタグの幅と高さの属性にアクセスするにはどうすればよいですか?
javascript - Ruby Hpricot RegExは、を次のように置き換え
ますの
誰かがHpricotとRegExを使用してこのJavascriptの行をRubyに変換する方法を教えてもらえますか?
私が設定したコードは次のとおりです。
ありがとう