目次
クローラーはHTMLファイル以外も読み込む
クローリングを確認する方法
・Googleサーチコンソールを開く
・実際にデータを確認する
クローラーはHTMLファイル以外も読み込む
先述したように、クローラーはWebサイト上の様々な情報を読みこみます。
HTMLファイル以外で、クローラーが読みこむファイルや情報の代表例は以下のとおりです。
・ PHPファイル
・ Flash内やJavaScriptによって生成されたリンク
・ PDFファイル
・ WordやPowerPointなどによって作成されたファイル
ここで押さえるべきことは、クローラーは文字を認識して、その情報を基に検索順位を決めているということです。
つまり、Webサイト内に入っている画像や音声などを認識することはありません。
そのため、画像にはAlt属性などの代替テキストを入れるなどの施策を行いましょう。
クローリングを確認する方法
クローリングを確認する方法は、以下のとおりです。
・ Googleサーチコンソールを開く
・ 実際にデータを確認する
それぞれ順番に解説します。
Googleサーチコンソールを開く
Googleサーチコンソールとは、Googleが提供している無料ツールのことです。
Googleサーチコンソールでは、Webサイトがどれだけクロールされているかを確認したり、クロールのリクエストを行えます。
Googleサーチコンソールで、Webサイトのクロール状況を確認する方法は以下のとおりです。
・ Googleサーチコンソールにログインし、左サイドバーから「設定」を選択する
・ 「クロールの統計情報」から「レポートを開く」を選択する
上記の手順を踏むことで、クロールの統計情報のグラフが表示され、どの程度クロールしているのかを視覚的に確認できます。
実際にデータを確認する
Googleサーチコンソールを使わずに、クローリングを確認する方法があります。
Googleの検索窓に、クロールの有無を確認したいWebサイトのURLを入力し、検索結果として該当するWebサイトが検索結果として出てくれば、クロールされている証です。
また、キャッシュを表示することで、いつGoogleが情報を更新したのかを確認できます。
もし、Webサイトを更新したつもりであるにも関わらず、キャッシュの表示が更新前の日付である場合は、サーチコンソールからクロールのリクエストを送りましょう。