ウェブサイトのコンテンツのタイプに依存し、PageRank にも依存する場合があります。めったに更新されない情報を提供する静的なページは、1 か月おきにアクセスされる可能性があり、1 日に多くの投稿がある人気のブログは、1 日に数回クロールされる可能性があります。(ただし、ブログの場合、通常、ブログ ソフトウェアは検索エンジンに ping を送信するため、オンデマンドでクロールされます)
これらはトラフィックの少ないサイトのフォーラム投稿であるように思われるため、週に数回クロールされるはずです。現在、Alexa でのランキングが 8,000,000 未満である私のウェブサイトでさえ、ほぼ毎日のように robots.txt リクエストで毎週から隔週でクロールされます。
似た内容のページは自動的にグループ化されるはずですが、グループ化されていない場合は、他の回答者の rel="canonical" ヒントを試してください。
@Chris: いいえ、その設定はサイトがクロールされる頻度を変更するのではなく、クロール中に Google がページをリクエストする速度のみを変更します。これは誤解を招く設定であり、ヘルプ ページで明確に示されているにもかかわらず、多くの人がその間違いを犯しています。