ページが存在しない時のGoogleに嫌われない方法

|
HTTPステータスコードってご存知ですか?
HTTPにおいてWebサーバからのレスポンスの意味を表現する3桁の数字からなるコードです。

参考ページ:ステータスコード

通常、ページが存在しないときは、こんなページがでますよね。
例:エックスサーバーのページが存在しない場合の表示
404.jpg


通常、存在しないページがリクエストされた場合は、404エラーが返されるはずです。200のステータスコードは「リクエストは成功し、レスポンスとともに要求に応じた情報が返される。」という状態です。通常ページ見てる時はだいたい200になっているはずです。

だけど、ページが存在しない場合に、HTTPステータスコードが200を返しているサイトがあります。その方法のことを「ソフト404」といいます。逆に通常の404を返す場合は、「ハード404」と呼ばれてます。

ソフト404:ページが存在しない&200 OK
ハード404:ページが存在しない&404 Not Found

本題、Googleに嫌われない方法ですが、こっそりGoogleのヘルプページに書いてあります。

ソフト 404 エラーのページ

通常、存在しないページがリクエストされた場合は、サーバーから 404(見つかりません)エラーが返されます。この HTTP レスポンス コードにより、ページが存在しないことがブラウザと検索エンジンに明示されます。その結果、ページのコンテンツ(存在する場合)は検索エンジンからクロールされず、インデックスにも登録されません。

存在しないページへのリクエストに応答する際には、404(見つかりません)または 410(存在しない)を常に返すことをおすすめします。404 レスポンス コードが返されるときに、独自の 404 ページがサイトで表示されるように設定すると、ユーザーの利便性を高めることができます。たとえば、最も人気のあるページのリスト、ホームページへのリンク、フィードバック リンクが記載されたページを作成できます。また、ウェブマスター ツールのカスタム 404 ウィジェットを使用して、サイトに検索ボックスや他のサイト検索オプションを追加することもできます。ただし、404 メッセージを表示するページを作成するだけでは不十分です。正しい 404 または 410 HTTP レスポンス コードを返すことも必要です。

Googleは、ソフト404を使っているページを見ぬいくことができるようですが、対応は完全ではないようです。完璧ではないというのは、200を返しているエラーページが存在しているものとして、インデックスされてしまうからです。

インデックスされて、ページが増える分にはいいじゃんと思うかもしれないですが、予期せぬ問題が発生する場合もあります。

Googleにおいてはページの品質ってすごく大事です。なのに、存在しないページがインデックスに残ってしまうと品質が悪いページがドメイン乗っていると思われてしまう事になるからです。

ただし、ドメイントラストが高い場合は問題にはならないようです。
例えば、Yahooブログなんかもソフト404ですね。
↓の画像はページが存在しないときの画面です。リンクはこれ

yahoo404.jpg

結論としては、基本的にソフト404は仕掛けないほうが無難にきらわれませんという所ですね。
無理やりドメイントラスト上げて、リクエストのクエリを使ったりした場合、膨大にコンテンツ増やしてセッション数増やす事もできますけどね。危険なので、あまり推奨しないです。

カテゴリ

ウェブページ

  • images

このブログ記事について

このページは、yutaが2010年12月 9日 00:58に書いたブログ記事です。

ひとつ前のブログ記事は「こんなのあり?Googleクエリの同義語」です。

次のブログ記事は「Googleから発表された悪質業者を排除するアルゴリズムって何?」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。