★検索エンジン回避★


METAタグの記述例

<META name="robots" content="noindex,follow">
ロボットが現在訪れているページをインデックスせずにそこにあるリンク先のページはインデックスする。

<META name="robots" content="index,nofollow">
ロボットが現在訪れているページのみをインデックスする。リンクは追わない。

<META name="robots" content="noindex,nofollow">
ロボットが現在訪れているページもインデックスせずリンクも追わない

<META name="robots" content="noarchive">
グーグルにキャッシュされないという状態になります。
現在すでにキャッシュされている場合でもこのタグを入れておけば次の巡回時にキャッシュが消えます。

<META http-equiv="refresh" content=5;URL=http://domain.com">
このタグがあるとほとんどのロボットはインデックスしません。
なぜならこのタグはダミーのページをロボットに取らせて
メインサイトに持ってくるというスパムとして使われたからです。


検索エンジンに登録に登録したくないページには以下のタグを貼ってください。

念の為、大文字版と小文字版がありますが種類はこれぐらいだと思います。

これを<HEAD>の部分に入れることにより検索エンジンに掛かるのを回避できます。

<META NAME="" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE">
<META NAME="GOOGLEBOT" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE">
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE">
<META NAME="LIBWWW-PERL" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE">
<META HTTP-EQUIV="ROBOTS" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE">
<META HTTP-EQUIV="" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE">
<META name="robot-control" content="deny-all">
<META name="robot-control" content="deny-quote">
<META name="robot-control" content="deny-analysis">


ついでにrobots.txtを空白のtextで作り。以下の内容を記述して各ディレクトリに置きましょう。

User-agent:*
Disallow:/