問題タブ [hpricot]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
325 参照

html - Hpricotの要素のタイプを取得します

span要素の子を調べて、テキストまたは次のようなものだけをフィルタリングしたいと思います。

しかし、特定の要素がどのタイプであるかをテストする方法が見つかりません。どうすればそれをテストできますか?私がやろうとしていることを行うためのより良い方法があるかどうかにかかわらず、私はそれを知りたいのですが、それについての提案にも感謝しています。

0 投票する
2 に答える
188 参照

html - インデックス付きのHpricotループ?

私は次のHTMLドキュメントを持っています:

Hpricotを使用してリスト項目をループし、それぞれの先頭に新しいHTMLを挿入して、次のようにするにはどうすればよいですか。

新しいスパンのコンテンツが修正された場合、私は次を使用できます:

私の問題は変数スパンの内容に起因します:どうすればプリペンドループでインデックスを使用できますか?

0 投票する
2 に答える
706 参照

ruby - HPricotでリンクされたファイルを見つける

私はHPricotで遊んでいますが、かなりの量の検索を行った後、これを解決することができませんでした。

HTMLページを解析して、mp3ファイルへのhrefを持つすべてのタグを見つけようとしています。これまでのところ私は持っています

これは正常に機能しており、正規表現/href\s*=\s*\"([^\"]+)(.mp3)/も機能しています。2つを組み合わせる方法がわかりません。

.search関数で何ができるかを理解するために、誰かが私に指摘できる良い例やドキュメントはありますか。

ありがとう

0 投票する
2 に答える
889 参照

ruby - Hpricot/Nokogiriでmailtoリンクを検出する方法

のようなリンクを一致させたいのです<a href="mailto:my@email.com">foo</a>が、これはNokogiriでのみ機能しません。

それを行う正しい方法は何ですか?Hpricotでそれを行うにはどうすればよいですか?

0 投票する
2 に答える
223 参照

xml - hpricot の要素が空であることを確認する

これが場所要素だとしましょう: <.location>blah...<./location>

次のように空にすることができます: <.location/>

空の要素のバックスラッシュを検出して返さないようにする方法はありますか?

0 投票する
1 に答える
2219 参照

html - Hpricot による HTML スクレイピング (Ruby on Rails を使用)

Hpricotの下で、いわばすべてのHtmlをスクレイピングしていないことがわかっているという問題を解決するために、大量のチュートリアルを読みました。詳しく説明します:

私がhtmlを削り取ろうとしているウェブサイトはhttp://yellowpages.com.mt/Malta-Search/Radio-In-Malta-Gozo.aspx.

結果としてリストされているリンクを取得する必要があります(前述のサイトの可能なすべてのURLに対してこれを行う必要があるため、RSSなどは、プログラムがURLを指定してオンザフライで読み取る必要があるため、有益ではありません食べます。)

私は必要な特定のIDを引き出すためにあらゆることを試みました(直接XPATHなどを与えます)が、そうすると気づきました

提供された結果には、必要なリンクに関連するすべての html が含まれていません。したがって、どの方法を使用してスクレイピングしても、hpricotによると必要な要素が存在しないため、必要な要素が見つかりません。

Firefox でソースコードを表示すると、それらが表示されるので、非常に混乱しています。この問題を回避する方法を知っている人はいますか? 私は何年もの間自分の道を見つけようとしてきましたが、一人では解決策を見つけることができません! どんな助けでも大歓迎です

0 投票する
2 に答える
1532 参照

html - HTML / スクリプト Hpricot を使用した Google マップのスクレイピング (Ruby On Rails)

作成中の Web マッシュアップの情報を抽出するために必要なスクレイピング コードに問題があります。

基本的に、私はコードをスクレイプしようとしています:

これは、スクレイピングする必要があるページの 1 つにすぎないため、必要なコードをプログラムに直接供給することはできません =/.

次のコードを使用してページをスクレイプすると (Hpricot で)

必要なコードの一部ではなく、スクリプト参照のみが表示されていることに気付きました。

マルタの Beautimport Ltd (Balmain Hair Extensions) | イエローページ?? (マルタ) 株式会社 | YellowPages.com.mt

これは、Firefox でソースを表示したときにも表示されます。ただし、Firebug の要素にカーソルを合わせると、XPath を取得できますが、スクリプト参照が残っているため、残念ながら機能しません。(説明が正しいかどうかはわかりません)。スクリプトのためにページ上で生成されるすべてのコードが本当に必要になります (これは firebug でしか表示できません)。以下を抽出できるようにこれが必要です(マップ上のGoogleアイコンにカーソルを合わせてfirebugから取得:

これは次の Xpath (//tbody を表す) を提供しますが、前述のように、Hpricot でコード全体を提供するわけではないため、アクセスできないため、かなり役に立ちません!

このようにして、プロジェクトに本当に必要な Lng と Lat を抽出することができます。Hpricotを使用して別の方法でこれを行う方法が本当にわかりません。必要なすべてのコードが得られないためです。どんな助けでも非常に感謝します。

0 投票する
5 に答える
9666 参照

ruby - Windows 上の Ruby 1.9.1 に Hpricot をインストールする

次のコマンドを使用して hpricot をインストールしようとしています。

p>

「開発ツール」をインストールする必要があると書かれていますが、それが何を指しているのかわかりません。助言がありますか?

0 投票する
3 に答える
4541 参照

html - Hpricot (Ruby on Rails) を使用して非表示の HTML (表示 = false の場合) をスクレイピングする

残念ながら、私は超えることができないように見える問題に遭遇しました。残念ながら、私はRuby on Railsの新生児でもあるため、質問の数が多くなります

次のような Web ページをスクレイピングしようとしています。

次のページの住所、電話番号、URL をスクレイピングしたいと思います。この場合は

考えられることは何でも試してみましたが、見えないように設定されているため、何も機能していないようです。

アドレスはh3タグ内にありますが、スクラップ可能ではないようです。次の URL から ScRUBYt についても調べてみましたがhttp://www.rubyrailways.com/ajax-scraping-with-scrubyt-linkedin-google-analytics-yahoo-suggestions/、この場合の適用方法の表と裏を見つけることができないようです。

これは私の任務を前進させるために本当に乗り越える必要がある障害であるため、どんな指針も本当に感謝しています. 助けてくれてありがとう。

0 投票する
1 に答える
194 参照

model-view-controller - netbeans の hpricot

JRuby で hpricot を使用しようとしています。私の問題は次のとおりです。このコードがある場合:

どこに置くの?私のコントローラーに?そこで受け入れないからです。そして、それを自分のモデルに入れるとしたら。どうすれば私の見解からそれを呼び出すことができますか?

ありがとうございました

このエラーは、wired.com Web サイトを試すときに表示されます

Errno::ENOENT in ProductsController#create

そのようなファイルまたはディレクトリはありません - ファイルが見つかりません - www.wired.com

RAILS_ROOT: H:\Documents and Settings/owner/My Documents/NetBeansProjects/RailsApplication5