0


ライブ テストにはホスティングを使用しますが、アクセスを保護し、検索エンジンのインデックス作成を防止したいと考えています。たとえば、(サーバー ディレクトリ構造) public_html 内:

_private
_bin
_cnf
_log
_ ... (より多くの既定のディレクトリ ホスティング)
testpublic
css
images
index.html


私はindex.html がすべての人に表示され、他のすべてのディレクトリ (「testpublic」を除く) が表示されるようにします。非表示で保護されたアクセスと検索エンジンをインデックスに登録しないでください。

ディレクトリ "testpublic" 公開してほしいのですが、検索エンジンでインデックスに登録されていない可能性があります。これが可能かどうかはわかりません。

2 つのファイル .htaccess が必要であることを理解するには。
1 つは "public_html" の一般的なもので、もう 1 つは "testpublic" に固有のものです。

.htaccess 一般 (public_html) は次のようになるはずです:

AuthUserFile /home/folder../.htpasswd
AuthName "test!"
AuthType Basic
require user admin123

< FilesMatch "index.html">
Satisfy Any
</ FilesMatch>


適切なプロパティでファイルを作成するのを手伝ってくれる人はいますか? ありがとうございました!

4

1 に答える 1

1

ルート フォルダーにある robots.txt ファイルを使用できます。標準を遵守するすべてのロボットは、このファイルに従い、ファイルとフォルダーのインデックスを作成しません。

すべての (*) クローラーに先に進み、何もインデックス付けしないように指示する Robots.txt の例。

User-agent: *
Disallow: /

.htaccess ファイルを使用して、サーバー (Apache を想定) が提供するものと表示されるディレクトリ インデックスを微調整できます。その場合、追加します

IndexIgnore *

.htaccess ファイルに、インデックスを許可しないようにします。

更新 ( https://stackoverflow.com/users/1714715/samuel-cookへのクレジット):

ボット/クローラーを具体的に停止し、その USER AGENT 文字列を知りたい場合は、.htaccess

<IfModule mod_rewrite.c>
  RewriteEngine on
  RewriteCond %{HTTP_USER_AGENT} Googlebot
  RewriteRule ^.* - [F,L]
</IfModule> 

お役に立てれば。

于 2013-01-05T03:55:34.897 に答える