ずいぶん前に、Googleサイトマップについて書いていました。そしてGoogleが提供するツールがPythonスクリプトであるということを書いて、しかし私の使っているサーバではPythonが使えないということも書きました。その一連の文章の最後に次のようなこといっていました:
もし私がやるとしたら、ローカルのファイルを見て、それをXMLだかテキストファイルだかに整形して保存するようなスクリプトを作ると思います。どうせやるんだったら、RSSにするという手もあるかなあ。RSSをGoogleに渡しつつ、RSSリーダーを使っているユーザーにも便利を提供できる。この場合は、更新履歴を使ってやればいい感じかも知れませんね。
今回の文章は、これら文書の続編であります。
Googleサイトマップは、Googleが提供するツールによって作成されるサイトマップだけでなく、いくつかの形式で提供されるサイトマップをサポートしています。それは、OAI-PMH、RSS 2.0、Atom 0.3そしてテキストファイルなのですが、この中で私が使うとしたら、まずはRSSであると考えました。
RSSとAtomはBlogツールやニュースサイトで用いられていることも多く、RSSリーダーを用いることで更新情報を極めて効率的に把握することができます。私もいくつかのBlogやニュースサイトをRSSを利用して購読しており、その便利さはもう手放せないほど。だから上記のサイトマップの対応形式を見て、その時にはRSSかAtomを採用しようという決意を固めていたのでした。
ですが、なぜRSSだったのか。それはですね、私の頼りにしているサイトのひとつThe Web KANZAKIに詳細な解説があったからです。なので私はその記事にしたがい、RSS 1.0でサイトマップを作成。Safariに読み込ませてみても問題がなかったので、よしこれでいこうと考えて、しかしそうは簡単にはいかなかったんですね。
実はこれ最初から気付いていたのですが、GoogleサイトマップはRSS 1.0に対応していないんですよね。だから、せっかく書いたRSSも受け付けてもらえず、エラーを吐く始末。ああ、駄目だこりゃ。RSS 1.0ではだめだったか。ということで、今度はAtom 0.3に鞍替えというわけですよ。
なぜRSS 2.0を使わなかったのかといいますと、それは日付の形式が問題だったんです。RSS 1.0やAtomでは、日付はW3C-DTFつまりYYYY-MM-DDThh:mm:ssTZDの形式が使えるのですが、RSS 2.0ではSat, 07 Sep 2002 00:00:01 GMTだなんていう風に書く必要があって、正直私はこの形式には慣れません。慣れないことをすると失敗しやすいというのは心理であると思っているのですが、だから最初からRSS 2.0を使うつもりはなかったのです。
Atomは1.0がもうじきFinalに移行するみたいですが、その辺の最新事情にはどうにも疎いもので、それにGoogleサイトマップが対応するのはAtom 0.3だというもので、もう無駄をするのは嫌ですからAtom 0.3で作成することに決めました。
私が参考にしたサイトは、やっぱりThe Web KANZAKIの記事で、他にはPRE-DRAFTの文書やAtom 0.3のリファレンス。けど一番役に立ったのは、実際に発行されているAtom feedで、そういったものを見て試行錯誤しながら、必要最低限の要素を使って、こととねのAtomを書いたのでした。id要素なんてのを見れば一目瞭然なのですが、明らかにThe Web KANZAKIを参考しています。そして、これをGoogleサイトマップに与えてみれば、見事通過しましてね、なのでこととねの更新はAtom 0.3を使っておこなうと決まったのでした。
さて、Googleサイトマップにこうして情報を与えてやって、どれだけ効率よくインデックスに追加させられてるのかというと、それはまったくわかりません。実は私は実験的にBlogを起こしてみているのですが(お試しBlogとは別に)、昨年十二月に公開して、AtomをGoogleサイトマップにも引き渡して、なのにまだインデックスに追加される気配がありません。
だから、このサイトマップというのは、そんなに期待するほどのものでもないのかも知れないというのが実感です。それよりも、定期的にサイトを更新していることのほうがずっと重要なんじゃないかと思っています。