私は最近、ここでスクリーンスクレイピングとそれがどのようなタスクになるかについてかなり考えています。それで私は次の質問をします。
サイト開発者として、JSONの結果など、ユーザーが画面をスクレイピングするのを防ぐための単純なAPIを公開しますか?
これらの結果はキャッシュを実装する可能性があり、ダウンロードされる可能性のある大量のマークアップよりもトラフィックがはるかに少なくなります。
私は予防を考えていませんが、こすることを思いとどまらせています。
スクレイピング帯域幅サンプル
((users *(%/ 100))*((freq * 60)* 24))*ファイルサイズ
- ユーザー:200,000
- ユーティリティを使用しているユーザーの割合:5
- ファイルサイズ:1kb
- 周波数:1分
方式:
((users *(%/ 100))*((freq * 60)* 24))*ファイルサイズ
10,000 * 1440 * 1
14400000kbまたは13.73291015625gb
JSONの結果が200バイトであるとすると、現在は(10,000 * 1440 * 0.2)または1日あたり2.74658203125gbになります。
これは、1日あたり約11GBのトラフィックの変化です。
私のStackOverflowプロファイルは参考のために96kです。
この質問の理由により、ユーザープロファイルからJSONの結果を求めるようになりました:
http ://stackoverflow.uservoice.com/pages/general/suggestions/101342-add-json-for-user-information
他の開発者がこのタイプのAPIを公開するかどうか、そして帯域幅を減らすためにこれらのAPIを提供する価値があるかどうかを知りたいと思いました。