SYNCERのロゴ
アイキャッチ画像

検索エンジンにインデックスさせない方法

コンテンツを検索エンジンにインデックス(登録)されたくない場合は、HTMLに専用のmeta要素を追加します。

サンプルコード

name属性に"robots"、content属性に"noindex"を指定します。これを、head要素内に挿入して下さい。

<meta name="robots" content="noindex">

デモ

下記のページは、Googleにインデックスされません。urlで検索して確認してみましょう。

demo.html

<!DOCTYPE html>
<html>
<head>
	<title>Googleにインデックスされないページ</title>
	<meta name="robots" content="noindex">
</head>
<body>
	<p>このページはGoogleにはインデックスされません。</p>
</body>
</html>

デモページを開く

備考

noindexとは?

検索エンジンのクローラー(情報を取得するプログラム)に対して、「このページを登録しないで下さい」という意思を伝えるのが、先に紹介したmeta要素です。

どんなコンテンツに付ける?

まだ開発段階のページ、管理者用のページなどに付けるのがいいでしょう。「アクセス(人気)が低いページなどはSEOのためにGoogleにインデックスさせない方がいい」などといった奇天烈な意見も稀に見かけますが、それは間違いです。

robots.txtによる一括指定

個別のページごとに記述するのが面倒な場合、robots.txtを使えばまとめて指定できます。「このディレクトリ内のページ全部ダメ」などの、パターンマッチによる一括指定ができて大変便利です。

初心者にも分かる!robots.txtの作り方

強制力はない

強制力はありません。Googleなどの信用できるクローラーはこういった記述に従ってくれますが、従ってくれない行儀の悪いクローラーも世の中には多数存在します。それらに対しては、別途、ip制限など物理的な対策が必要です。

クローラーを特定したい

name属性の"robots"は「全てのクローラーに対して」という意味です。例えば、Googleの検索エンジンだけにする場合は、クローラーの名前("googlebot")を指定します。

クローラーのbot名
アイキャッチ画像
robots.txtに指定できる、クローラーのbot名をまとめてあります。
  • Twitterでシェア
  • Facebookでシェア
  • Google+でシェア
  • はてなブックマークでシェア
  • pocketに保存
  • LINEでシェア
更新履歴
2017年6月22日 (木)
コンテンツを公開しました。