1

人々が私たちのデータを盗むのを防ぐことは不可能であることはわかっていますが、私は大規模なデータベースを持っており、少なくとも自動化されたスクリプトが私のデータベースを盗むのを防ぎたいと思っています.

これまでの私の考え:

  • JavaScript を使用するか、HTML をエンコードする = 重く、簡単にデコードできます
  • 検索用の recaptcha = ありえない、ユーザーは私のウェブサイトを離れてしまう
  • サイトの HTML にランダムなデータとタグを挿入して、正規表現のリップを回避する = 良い?

どんなアイデアでも大歓迎です。

4

3 に答える 3

2

なぜ人々はあなたのデータベースを盗もうとするのでしょうか? 彼らがそうするなら、なぜそれが重要なのですか?彼らに十分ではないことを求めるでしょうか?

ポリシーを明確にし、会社の法務部門が文言を確認したことを確認してください。無許可のシンジケーションが許可されていないこと、およびそれを防止するために法的手段を講じることを明確にすることで、これを思いとどまらせてください。

または、さらに良いのは、承認されたシンジケーションを奨励することです。人々は、許可された方法で行う賢明な方法がない場合にのみ、無許可のシンジケーションを実行します。

技術的な対策はある程度の効果があるかもしれませんが、特に有能ではない、または決断力のない人を思いとどまらせるだけです。

于 2010-11-14T17:46:45.233 に答える
1

あなたが提案した解決策はどれもうまくいきません。優れたスクリプト ライターは、それらを簡単に回避できます。しかし、アプリケーション サーバー側には、これに対する技術的な解決策があります。それは、レート制限を実装することです。特定の IP アドレスからの検索を、たとえば 10 秒ごとに 1 回だけ許可します。これにより、サイトからの自動データ マイニングが非常に遅くなります。

于 2010-11-14T17:48:54.457 に答える
0

Alexa はランダムなタグをマークアップに挿入すると思いますが、それをマイニングしようとすると、かなりの時間を費やしました...<span class="a5r">35</span><span class="et4">52</span><span class="arer">16</span>スタイルシートもダウンロードしてレンダリング ルールでは、それが何になるべきかを理解できませんでした。

しかし... 十分に辛抱していれば、数値を「レンダリング」してマイニングすることもできたのですが、それは私にとって価値がありませんでした。ページリクエストを人間が可能な量に制限することは、おそらくうまくいくでしょう(50 /分程度)。

于 2010-11-14T17:47:52.070 に答える