PHP アプリケーションを開発しました。その主な目的は、データベースからデータを取得することです。マシンリクエストを使用してデータベースからすべてのレコードをフェッチしないようにしたい(つまり、人間以外のリクエスト、つまりCURLなどのメカニズムによって行われたリクエストを意味します。通常、CAPTCHAを介してそのようなリクエストを防ぎます。)
検索エンジンだけに私のデータを取得させ、他の誰もデータを取得させないようにするにはどうすればよいでしょうか?
PHP アプリケーションを開発しました。その主な目的は、データベースからデータを取得することです。マシンリクエストを使用してデータベースからすべてのレコードをフェッチしないようにしたい(つまり、人間以外のリクエスト、つまりCURLなどのメカニズムによって行われたリクエストを意味します。通常、CAPTCHAを介してそのようなリクエストを防ぎます。)
検索エンジンだけに私のデータを取得させ、他の誰もデータを取得させないようにするにはどうすればよいでしょうか?
質問を開くために、リンクをクリックすると、ブラウザが stackOverflow サーバーにリクエストを送信し、このページを要求しました。これは cURL が行うことと同じですが、JavaScript を処理できない点が異なります。繰り返しになりますが、ブラウザーに代わって JavaScript を解析しませんでした。またまた番組でした。
私が本当に強調する必要があったのは、事実上、マシンがユーザー アクティビティを偽造するのを防ぐ方法はないということです。
しかし、興味がある場合は、ここにいくつかのトリックがあります。個人的には、人間が直接関与しない方法を好みます。
ユーザー エージェントでボットをブロックすることはできません。cURL およびその他のプログラムは、要求を行うときに、ユーザーが指定した別のユーザー エージェントを使用できます。
Google ウェブ マスター セントラルで Googlebot の動作を調整できます。フラッド制御メカニズムと一致するようにしてください。また、ユーザー エージェントに依存しないように Google がアドバイスしていることを覚えておいてください。