1

みんな !

共有 Web ホスト (LAMP、ルート アクセスなし) で自動コンテンツ クローラーをブロックする簡単な方法はあるのでしょうか。

例えば。大量の jpg 画像のコレクションがあり、誰かが自動プログラム (php など) を作成して、すべての画像データをダウンロードすることにしました。

クライアント側で画像を復号化するためにjavascriptを使用することを考えていたので、クローラーによってすべてのデータを収集することがより困難またはより多くの労力になります。しかし、JavaScript をサポートしていないブラウザーへの影響と、そのようなクローラーを防止する有効性についてはわかりません。

もちろん、優れた検索エンジンのクローラーは許可されるべきです。

画像以外に、テキスト、オーディオ、またはビデオ コンテンツはどうですか? それらにどのように対処すればよいですか?

4

2 に答える 2

1

あなたのコンテンツがなんらかの形式の認証の背後に隠されていなければ、真剣に試みれば誰でもあなたのコンテンツを手に入れることができます. とはいえ、ファイルの使用を少し難しくするために、いくつかの対策を講じることができ.htaccessます。

ホットリンク (別のサイトからファイルを参照すること) を防ぐには、次のコードを追加して、末尾が gif、jpg、js、または css で、自分のサイトがHTTP_REFERER.

RewriteEngine on
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http://(www\.)?mydomain.com/.*$ [NC]
RewriteRule \.(gif|jpg|js|css)$ - [F]

ユーザー エージェントによるアクセスをブロックすることもできます (完全なリストはこちら)。

RewriteEngine On 
RewriteCond %{HTTP_USER_AGENT} ^BlackWidow [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Zeus 
RewriteRule ^.* - [F,L]

ブロックしたい「悪い」ボットを特定した場合は、IP でブロックします。

order allow,deny
deny from 123.45.67.89
allow from all
于 2012-11-08T04:46:33.667 に答える
0

これは、「自分のコンテンツを盗まれないようにするにはどうすればよいか」という最も多く寄せられる質問の 1 つです。

簡単な答えは、できません。人間に対してでさえありません。ただし、ここでは説明しないいくつかのトリックを使用して、到達を困難にすることもできます。

誰かがあなたのコンテンツを盗むのを完全にブロックできない理由は、その人があなたの Web サイトにアクセスすると、そのページの出力を物理的にダウンロードするからです。出力とは、サーバーがクライアントに送信するものです。

この時点で、クライアントはブラウザが表示または使用したすべてのものに完全にアクセスでき、これを停止することはできません。画像を撮影したくない場合は、オンラインに公開しないでください。

注: 画像に透かしを入れて、盗まれた場合にロゴを入れることができますが、ほとんどの場合、それはデザインにとって魅力的ではありません

これが役立つことを願っています!

于 2012-11-08T04:45:58.440 に答える