Ruby に Mechanize gem を使い始めましたが、Web サーバーが Mechanize エージェントからのアクティビティを検出してブロックできる方法はあるのでしょうか?
はいの場合、Mechanize がサイトを破棄または訪問するのをブロックするコードまたは手順は何ですか?
Ruby に Mechanize gem を使い始めましたが、Web サーバーが Mechanize エージェントからのアクティビティを検出してブロックできる方法はあるのでしょうか?
はいの場合、Mechanize がサイトを破棄または訪問するのをブロックするコードまたは手順は何ですか?
自動化されたプロセスがサイトにアクセスしていることを検出する方法はいくつかあります。
これらは必ずしも Mechanize が実行されていることを示しているわけではありませんが、サイトをスクレイピングしているコードのフィンガープリントです。
彼らはそれについて何ができますか?
サーバーとネットワークハードウェアに応じて、これらのことを行うにはさまざまな方法があります。
この質問は、StackOverflow のトピックとはかなり無関係であり、おそらくhttps://serverfault.com/またはhttps://webmasters.stackexchange.com/で質問する必要があります。
robots.txt ファイルを作成して、人々がそれを尊重してくれることを期待できます。
User-Agent 文字列でブロックを開始すると、IE のふりをすることができます。