2

ユーザーによるクリックをログに記録するアプリケーションがあります。問題は、これらのクリックがTwitterを介してプッシュされているため、t.coとのすべてのリンクが短くなっていることです。このため、Twitterは、おそらくロギングやスパム保護などを行うために、さまざまなIPから7〜15回リンクをヒットしているように見えます。問題は、これが実際のユーザーからのものではない私のアプリの7〜15回の「クリック」をログに記録することです。

訪問が実際のユーザーからのものなのか、単にcURLされているのか、ボットやスパイダーからのものなのかを検出する方法があるのではないかと思います。

うまくいったと思われる方法の1つは、http://www.projecthoneypot.org/のAPIを使用て、私のサイトにアクセスしているIPが既知のボットからのものであるかどうかを確認することでした。役立つgem(http://cl.ly/GlT8)を見つけましたが、使用しようとするとNETDNSエラーが発生し続けました。

私はアイデアが新鮮です。本当に助けていただければ幸いです!

4

1 に答える 1

1

Twitter はUser-Agent:http ヘッダーを適切に設定する必要があるため、それらをフィルターで除外できます。これはもちろん偽造できますが、それは始まりです。

でレールのヘッダーを取得できますrequest.headers["User-Agent"]

于 2012-05-20T00:37:08.897 に答える