1

2013年1月1日以降にアップロードされたTechcrunchのページをクロールしたい.Webサイトはパターンに従っています

             http://www.techcrunch.com/YYYY/MM/DD

したがって、私の質問は、必要なページのみをクロールできるように、urlfilter で正規表現を設定する方法です。

             +^http://www.techcrunch.com/2013/dd/dd/([a-z0-9\-A-Z]*\/)*
4

2 に答える 2

0

ちょっとわかりませんが、試してみますか:

+^http://www.techcrunch.com/2013/[0-9]{2}/[0-9]{2}.*$

また

+^http://www.techcrunch.com/2013/[0-9]+/[0-9]+.*$
于 2013-07-22T21:37:59.010 に答える