0

FacebookのようなURLスクレーパーを実装しようとしています。ウェブサイトの URL と facebook を入力すると、そのページから動画や画像、タイトル、説明が取得されます。Facebook は og:meta タグを使用して Web サイトをスクレイピングします。Facebook では、URL スクレーパーまたは URL デバッガーを使用できますか。あなたがそれを行うことができる他の方法はありますか?

yahooクエリ言語を使ってみました。ただし、me​​ta タグのプロパティ属性は返されません。

4

1 に答える 1

2

この宝石を試してみてください https://github.com/intridea/opengraph

ページを解析し、og 情報を抽出します。

require 'opengraph'

movie = OpenGraph.fetch('http://www.rottentomatoes.com/m/1217700-kick_ass/')

movie.title # => 'Kick-Ass'
movie.movie? # => true
movie.image # => 'http://images.rottentomatoes.com/images/movie/custom/00/1217700.jpg'
于 2013-04-26T13:07:00.970 に答える