ruby-on-rails-3 - Rails：ボットIPを検出して、短いpingを回避します

Question

ユーザーによるクリックをログに記録するアプリケーションがあります。問題は、これらのクリックがTwitterを介してプッシュされているため、t.coとのすべてのリンクが短くなっていることです。このため、Twitterは、おそらくロギングやスパム保護などを行うために、さまざまなIPから7〜15回リンクをヒットしているように見えます。問題は、これが実際のユーザーからのものではない私のアプリの7〜15回の「クリック」をログに記録することです。

訪問が実際のユーザーからのものなのか、単にcURLされているのか、ボットやスパイダーからのものなのかを検出する方法があるのではないかと思います。

うまくいったと思われる方法の1つは、http：//www.projecthoneypot.org/のAPIを使用して、私のサイトにアクセスしているIPが既知のボットからのものであるかどうかを確認することでした。役立つgem（http://cl.ly/GlT8）を見つけましたが、使用しようとするとNETDNSエラーが発生し続けました。

私はアイデアが新鮮です。本当に助けていただければ幸いです！

score 1 · Accepted Answer

Twitter はUser-Agent:http ヘッダーを適切に設定する必要があるため、それらをフィルターで除外できます。これはもちろん偽造できますが、それは始まりです。

でレールのヘッダーを取得できますrequest.headers["User-Agent"]。

ruby-on-rails-3 - Rails：ボットIPを検出して、短いpingを回避します

1 に答える 1

Related

Reference