Facebook の URL スクレーパーにはサイズ制限がありますか? ウェブサイトで数冊の本を入手できます。HMTL ファイルサイズが特定のサイズ (~390KB) 未満のものはスクレイピングされ、適切に読み取られますが、より大きな 4 つはそうではありません。これらの大きなアイテムは 200 応答コードを受け取り、正規 URL が開きます。
これらのページはすべて同じテンプレートを使用して作成されています。唯一の違いは、各ブック内のコンテンツのサイズと、各ブックがサイトの他のページに作成するリンクの数です。
- 正規の URL をクリックします
- Firebug を Firefox または Chrome の開発者ツールでネットワーク タブ 3 に開きます。
- 「スクレイパーがあなたの URL について見ているものを正確に見る」をクリックします。
- 失敗した場合は空白のページ、成功した場合は HTML が表示されます
失敗:
- https://developers.facebook.com/tools/debug/og/object?q=http%3A%2F%2Frcg.org%2Fbooks%2Ftapom.html
- https://developers.facebook.com/tools/debug/og/object?q=http%3A%2F%2Frcg.org%2Fbooks%2Ftbgpu.html
- https://developers.facebook.com/tools/debug/og/object?q=http%3A%2F%2Frcg.org%2Fbooks%2Fttjc.html
- https://developers.facebook.com/tools/debug/og/object?q=http%3A%2F%2Frcg.org%2Fbooks%2Ftbdse.html
成功:
- https://developers.facebook.com/tools/debug/og/object?q=http%3A%2F%2Frcg.org%2Fbooks%2Fthogtc.html
- https://developers.facebook.com/tools/debug/og/object?q=http%3A%2F%2Frcg.org%2Fbooks%2Faabibp.html
- https://developers.facebook.com/tools/debug/og/object?q=http%3A%2F%2Frcg.org%2Fbooks%2Ftww.html
- https://developers.facebook.com/tools/debug/og/object?q=http%3A%2F%2Frcg.org%2Fbooks%2Ftsosw.html
- https://developers.facebook.com/tools/debug/og/object?q=http%3A%2F%2Frcg.org%2Fbooks%2Fsyottc.html
- https://developers.facebook.com/tools/debug/og/object?q=http%3A%2F%2Frcg.org%2Fbooks%2Fttigtio.html
- https://developers.facebook.com/tools/debug/og/object?q=http%3A%2F%2Frcg.org%2Fbooks%2Faadac.html
- https://developers.facebook.com/tools/debug/og/object?q=http%3A%2F%2Frcg.org%2Fbooks%2Fsiud.html
- https://developers.facebook.com/tools/debug/og/object?q=http%3A%2F%2Frcg.org%2Fbooks%2Ftuyc.html