メタタグの正しい使い方：SEOとサイト制御

2025.06.30

メタタグの正しい使い方：SEOとサイト制御の要

メタタグの正しい使い方：SEOとサイト制御の要

ウェブサイトのSEO（検索エンジン最適化）を適切に行う上で、検索エンジンのクローラーにどのようにサイトを扱ってほしいかを伝えることは非常に重要です。そのための主要なツールの一つが、HTMLの<head>セクションに記述するメタタグです。

このメタタグを正しく理解し、活用することで、サイトのインデックス状況をコントロールし、望まないページのインデックスを防ぐなど、SEO戦略を強化することができます。

メタタグとは？

メタタグは、検索エンジンのロボット（クローラー）に対して、そのページをどのように処理すべきかを指示するためのものです。具体的には、以下の項目をコントロールできます。

インデックス（Index）: そのページを検索エンジンのインデックスに登録するかどうか。
フォロー（Follow）: そのページ内のリンクをたどって、他のページをクロールするかどうか。

これらの指示は、複数のキーワードを組み合わせることで、より詳細な制御が可能です。

主要な属性と値

タグは、content属性に特定の値を記述することで、検索エンジンに指示を出します。主な値は以下の通りです。

index (または all):
- 意味: そのページを検索エンジンのインデックスに登録することを許可します。
- デフォルト: このタグがない場合、通常はindex,followとして扱われます。明示的に指定する必要はほとんどありませんが、過去にnoindexを設定していて解除したい場合に利用します。
noindex:
- 意味: そのページを検索エンジンのインデックスに登録しないように指示します。
- 用途: ログイン後のページ、テストページ、個人的な情報が含まれるページ、品質の低いコンテンツ、重複コンテンツなどを検索結果に表示させたくない場合に非常に有効です。
follow (または all):
- 意味: そのページ内のリンクをたどって、他のページをクロールすることを許可します。
- デフォルト: indexと同様に、このタグがない場合、通常はindex,followとして扱われます。
nofollow:
- 意味: そのページ内のリンクをたどらないように指示します。
- 用途:
  - 信頼できない外部サイトへのリンクがある場合。
  - 広告リンクやアフィリエイトリンクなど、リンクジュース（PageRank）を渡したくない場合。
  - ユーザー生成コンテンツ（コメント欄など）のスパムリンク対策。
none:
- 意味: noindex, nofollow と同義です。インデックスせず、リンクもたどらないように指示します。

その他の便利な属性値（Googlebot向け）

Googleは、より詳細な制御のために、追加の属性値を提供しています。これらはGooglebotにのみ適用されますが、主要な検索エンジンはGoogleですので、設定しておくと良いでしょう。

noarchive:
- 意味: そのページのキャッシュ（スニペットの下に表示される「キャッシュ」リンク）を検索結果に表示しないように指示します。
- 用途: コンテンツの頻繁な更新があり、古いキャッシュを表示したくない場合などに使用します。
nosnippet:
- 意味: 検索結果に表示されるスニペット（ページの要約テキスト）や動画プレビューを表示しないように指示します。
- 用途: 著作権で保護されたコンテンツや、コンテンツの一部が検索結果に表示されるのを避けたい場合に利用します。
max-snippet:[数値]:
- 意味: 検索結果に表示されるスニペットの最大文字数を指定します。
- 例: <meta name="robots" content="max-snippet:50"> (スニペットを50文字に制限)
max-image-preview:[none|standard|large]:
- 意味: 検索結果に表示される画像プレビューの最大サイズを指定します。
- 例: <meta name="robots" content="max-image-preview:large"> (大きな画像プレビューを許可)
notranslate:
- 意味: 検索結果に表示される翻訳オプションを提供しないように指示します。
unavailable_after:[日付]:
- 意味: 指定した日付以降、そのページを検索結果から削除するように指示します。
- 用途: 期間限定のイベントページなど、特定の期間が過ぎたら検索結果に表示したくない場合に便利です。日付はRFC 850形式で指定します。
- 例: <meta name="robots" content="unavailable_after: 2025-12-31T23:59:59Z">

記述例

基本的な記述方法は以下の通りです。

HTML

<!DOCTYPE html>
<html lang="ja">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>ページタイトル</title>

    <meta name="robots" content="index, follow">

    <meta name="robots" content="noindex, follow">

    <meta name="robots" content="noindex, nofollow">
    <meta name="robots" content="none">

    <meta name="googlebot" content="noindex, nosnippet">

    <meta name="googlebot" content="max-snippet:50, max-image-preview:large">

</head>
<body>
    </body>
</html>

ポイント:

name="robots" はすべての検索エンジンに対応します。
name="googlebot" のように特定の検索エンジン名を指定すると、その検索エンジンにのみ適用されます。複数の設定がある場合、より具体的な指定（例：googlebot）が優先されます。

注意点とよくある間違い

robots.txtとの違い:
- robots.txt: クローラーがサイトのどの部分にアクセスできるかを制御します。これはクロールをブロックするもので、すでにインデックスされたページを検索結果から削除するものではありません。
- <meta name="robots">: クロールされたページをインデックスするかどうか、リンクをたどるかどうかを制御します。
- 重要: robots.txtでクロールをブロックされたページは、<meta name="robots">タグの内容を読み取ることができません。したがって、noindexを設定したいページは、robots.txtでクロールをブロックしてはいけません。 クローラーがページにアクセスできる状態である必要があります。
noindexとnofollowの併用: noindex, nofollowを設定すると、そのページはインデックスされず、そのページ内のリンクもたどられません。
意図しないnoindex: 開発環境のサイトやステージングサイトにnoindexを設定し忘れると、意図せず検索結果に表示されてしまうことがあります。逆に、本番サイトで誤ってnoindexを設定してしまうと、トラフィックが激減する可能性がありますので、細心の注意を払ってください。
クロールの遅延: <meta name="robots">の設定を変更しても、検索エンジンがすぐに反映するとは限りません。クロールの頻度や重要度によって、反映まで時間がかかる場合があります。

まとめ

<meta name="robots">メタタグは、検索エンジンのクローラーに対して、ウェブページをどのように処理すべきかを正確に指示するための強力なツールです。index、noindex、follow、nofollowといった基本的な属性値を適切に使いこなすことで、ウェブサイトのSEOを効果的に管理し、望むべきページが検索結果に表示されるようにコントロールできます。

特にnoindexを使用する場合は、robots.txtとの連携をよく理解し、クローラーが正しくメタタグを読み取れるようにすることが重要です。定期的にサイトのインデックス状況を確認し、必要に応じてこのタグを調整することで、常に最適なSEO状態を保つことができます。