アマゾンの商品ページへのリンクがあるだけです。このリンクを使用するだけで、Ruby プログラムですべての情報 (写真、価格など) を取得するにはどうすればよいですか?
5 に答える
以下は、Amazon が oembed 用に公開した、サポートされている URL のリストです。製品広告 API は、これらの URL を解析して ASIN を取得した後にのみ表示されます。
http://アマゾン. /gp/製品/*
http://アマゾン. / /dp/
http://アマゾン. /dp/*
http://アマゾン. /o/ASIN/*
http://アマゾン. /gp/offer-listing/*
http://アマゾン. / /ASIN/
http://アマゾン. /gp/製品/画像/*
http://アマゾン. /gp/aw/d/*
このライブラリを見つけました (Rails を使用しています) amazon-ecs を試しています。それでも、特定の製品の詳細を取得するには、何らかの ID (製品 ID?) が必要です。たとえば、kindleへのこのリンクを検討してください
そのリンクで、B00154JDAI である ASIN に気付きました。
この ID を使用して、製品情報を取得できるようです (amazon-ecs を使用)。ASIN を取得するには、URL を解析するだけです。
それを行う他の方法はありますか?
いいえ、私はスクリーン スクレイピングを行うつもりはありません。それは良い考えではありません。
これを行いたい場合は、Nokogiriまたはhpricotライブラリの両方で HTML の解析と検索が可能です。ただし、この種のスクリーン スクレイピングは信頼性が低いことで有名です (Amazon が HTML の再編成を決定するといつでも機能しなくなる可能性があるため) 。代わりに製品広告 APIを使用してください。
プログラムで: ページを取得し、HTML を解析します。必要な情報をフィルターで除外します。Ruby には、HTML を解析する (私が知らない) ライブラリがいくつかあるかもしれません。
hpricotはあなたが望むことをしているようです。
ライブラリRuby/AWSを使用する必要があります(Googleで検索してください。私のカルマは外部リンクを許可するほど高くありません...)。まさにそのために書かれています。
探しているアイテムを見つけるために、組み込みの検索を使用する必要がある場合があります。その後、API は写真、リンク、およびすべての使用可能な情報へのアクセスを提供します。