キャプチャ フィルターの理論的なアイデア。サーバーがどうにかして簡単に答えることができ、ユーザーも答えることができるユーザーの質問をします。共有された回答は、ユーザーとサーバーの両方が知っている一種の公開鍵になります。
スタック オーバーフロー関連の例:
ユーザー XYZ の評判ポイントはいくつですか?
ヒント: この情報については画面の横を参照するか、このリンクをたどってください。ユーザーは、既知のスタック オーバーフロー ユーザーからランダムに取得される可能性があります。
より一般的な例: どこに住んでいますか? あなたが住んでいる場所の土曜日の午前 9 時の天気はどうでしたか? ヒント: yahoo 天気を使用し、湿度と一般的な条件を提供します。
次に、ユーザーが回答を入力します
シアトル 所により曇り、湿度 85%
コンピューターは、実際に当時のシアトルの気象条件であったことを確認しています。
答えはユーザーに固有のものですが、サーバーにはその答えを調べて確認する方法があります。
質問の種類はさまざまです。しかし、アイデアは、人間が調べなければならない事実とサーバーが簡単に調べることができる事実の組み合わせの処理を行うということです。このプロセスは 2 つの部分からなる対話であり、ある程度の相互理解が必要です。一種の逆回転試験です。計算可能なデータを提供できることを人間に証明してもらいますが、計算可能なデータを生成するには人間の知識が必要です。
別の可能な実装。あなたの名前は何ですか、そしてあなたはいつ生まれましたか?
人間は既知の答えを提供し、コンピューターはデータベース内の情報を検索できます。
ボットによってデータベースにデータが入力される可能性がありますが、ボットは関連する事実をまとめるためのインテリジェンスを備えている必要があります。サーバー側のデータベースまたはルックアップ テーブルから、明らかなスパムのようなプロパティを体系的に取り除くことができます。
実装には欠陥や詳細を解決する必要があると確信しています。しかし、コンセプトはしっかりしているようです。ユーザーは、サーバーが検索できる事実の組み合わせを提供しますが、サーバーは、尋ねられるべき組み合わせの種類を制御できます。組み合わせはランダム化でき、サーバーはさまざまな戦略を使用して共有された回答を検索できます。本当の利点は、回答の中で何らかのプロファイリングと自分自身の啓示を提供するようにユーザーに求めていることです。これにより、ボットが体系的であることはさらに困難になります。多数のコンピューターが、多くのサーバーで同じ回答を使用し始め、次のようなキャプチャ形式を使用し始めます。
私は1972年午後3時45分生まれのロボットです。
次に、そのような応答をプロファイリングし、ネットワーク全体で使用してボットをブロックし、数回の反復後に自動化を効果的に無効にすることができます.
これについてさらに考えてみると、ブログ投稿にコメントするための基本的な読解力テストを実装するのは興味深いことです。ブログ投稿の終了後、ライターは読者に質問を投げかけることができます。質問は各ブログ投稿に固有のものにすることができ、ユーザーがコメントする前に実際に読む必要があるという追加の利点があります. 投稿の最後に簡単な質問を書いて、回答をサーバー側に保存し、無意味な質問を並べてデータベースにソルトすることができます。
この投稿では、紫色のキャプチャ技術について話しましたか? サーバー側の回答 (偽、いいえ)
これはキャプチャに関する投稿でしたか?サーバー側の回答 (はい、はい)
これはマイケル・ジャクソンについての投稿でしたか?サーバー側の回答 (偽、いいえ)
いくつかの質問をランダムな順序で提示し、その順序を重要なものにすると便利です。たとえば、上記は = no、yes、no です。順序をシャッフルして、いいえとはいの両方の答えがあるナンセンスな質問を組み合わせます。