サイトURLの統一ってどこまで重要なの?

そもそもググるという行為により、Googleのデータベースに登録されたインデックスからの検索結果を、アルゴリズムによってRank付けされた順にブラウザに表示されるのであって、今回のポイントはURL表記の問題がアルゴリズムに影響を及ぼすかどうか、いうことになります。

ですからアルゴリズムの問題を考える以前に、Search Consoleから自分のサイトの適切なページが適切なURLでインデックスにキチンと登録されていることを確認しとく、話しはそれからということになります。

ホスト名wwwと末尾スラッシュ(trailing slash)の有無の問題

日本とインドネシアの友好関係を願って・・・というよりも単にイケてるドメイン名が思い浮かばなかったので、契約時の独自ドメイン名をindonesia-japan.comとベタに決めてしまいましたが、ブラウザからアクセスする際の表記はwww付きに統一しております。

このwwwはホスト名にあたりますが、ロリポップの設定ではサブドメインにあたり、このwww付きサブドメインをwwwなしと同じディレクトリを指すように設定をしないと、www有りURLが機能しません。

http://www.indonesia-japan.com
http://indonesia-japan.com

一般的にはwwwの有無は、Googleには別ドメインと認識され、それぞれで同じサイトが表示されてしまうとPage Rank(バックリンクの多さで決まる検索順位)が分散されると言われていますが、Google検索エンジン開発責任者であるMatt Cutts氏の言葉を聞くと、wwwの有無があっても、きちんと同一サイトと判断してくれるような印象を受けます。

現在Googleの検索アルゴリズムは、バックリンクの数によってリンクの価値を評価するというページランク(PageRank)主義から、そのサイトが信頼できる人物が記述した価値ある情報内容であるかどうかであるAuthor Rank重視にシフトしています。

これは同時にwwwの有無によってペナルティ対象である重複サイトと判断されることもないと理解できます。

また末尾スラッシュの有無の問題ですが、試してみると分かりますが、ChromeとFireFoxはスラッシュつけても自動的にスラッシュを消す仕様、IEはスラッシュなしでも自動的にスラッシュをつける仕様になっています。

要はブラウザ上のURL表記が統一しないことで、検索上は大きな問題ない、でもユーザーを一瞬とまどわせることで利便性を損なっている可能性は否定できませんよ、くらいなもんだと思います。

URL表記の問題は、結局は検索エンジンスターターガイドにあるように、ユーザーがサイトにアクセスするときの利便性という観点から考えるべきものです。

ブラウザからアクセスされる際のURL表記の統一方法

だからSEOという観点よりもユーザーの利便性という観点からURLの統一を行いたいのですが(やっていることは一緒ですが・・・)一般的にはApacheのmod_rewriteモジュールに対して、wwwなしのアクセスURLはwwwありのURLに正規表現でリライト(rewrite)処理、またはリダイレクト(redirect)処理を指示する必要があります。

このリダイレクト処理はApatchのhttpd.confに書きますが、レンタルサーバーでは通常それができないので、ディレクトリ内の.htaccessファイルに記述するのが一般的です。

が、WordPressの場合は、管理画面からURL統一の設定が簡単に出来ます。

1.ロリポップの管理画面からサブドメインとしてwwwを設定することでwww付きURLを有効にする。
2.WordPressは管理画面の「設定>一般」の「サイトのアドレス(URL)」にwww付きURLで記述。

これだけでmod_rewriteモジュールへの指定なしにURLがwww付きに統一されます。

HTTPS通信でのアクセスでは.htaccess自体が読まれていない?

GoogleがHTTPS通信であることを検索アルゴリズムの中で考慮するという話が出ましたので、このサイトも独自SSL通信にしたわけですが、今のところ解決できない問題が1個あります。

独自SSL証明書が有効なのはwww付きのみなので、例のmod_rewriteでwww無しURLをwww付きにリライト、またはリダイレクトしたいのですが、どうもHTTPS通信で来たアクセスの場合には、この.htaccess自体を読んでくれないのか、読んでもmod_rewrite設定が機能しないのか、httpd.confを確認しないと検証のしようがない・・・。

https://www.indonesia-japan.com ⇒ 独自SLL有効
https://indonesia-japan.com ⇒ 独自SLL無効 ⇒ mod_rewriteでリライト出来ない

httpd.confの中でのVirtualHost設定中のAllowOverrideで.htaccess による設定の上書きを許可してあげて、FollowSymLinksオプションを有効にしてあげないとダメみたいです。

ただしwww付きURLでGoogleのデータベースにインデックスされれば、wwwなしでアクセスできないとしてもマイナス対象にはならないと思いますので、今のところ様子見状態でございます。

ただバケツから水漏れしているような感触で気持ち悪いかな・・・。

こんな投稿も読まれています