4

http://www.example.com/books?_pop=mheader

これに一致する正規表現と、パターンの1つが一致するときにURLに「本」が含まれるURLは何でしょうか。このサイトには、本のカテゴリとその下にある他のさまざまなサブカテゴリがあります。トラバースしてすべてのURLで本を検索するにはどうすればよいですか?

require 'anemone'
Pattern = %r[(\/books)*]
Anemone.crawl("http://www.example.com/") do |anemone|
  anemone.on_pages_like(Pattern) do |page|
    puts page.url
  end
end
4

2 に答える 2

3

http://rubular.com/は、Rubyの正規表現をテストするための便利なツールです。

正規表現は単純です/http:\/\/.+(books)/。それhttp://がURLであることを確認するのに役立つようにも一致します。これはhttp://www.example.com/reference-books-2300に対する一般的なテストです。

于 2012-09-07T05:19:51.163 に答える
1

URLの/booksに一致するパターンは「/books」である必要があります

これは、正規表現http://regexpal.comをテストして、コードの少なくともその部分が正しいことを確認するのに適したサイトです。

于 2012-09-07T05:23:14.237 に答える