こととねXHTML化を開始する

こととねのドキュメントは、主にHTML 4.01 Strictによって作成されています。

こととねの利用に関する諸注意

XHTML化に着手

 現在、当WebサイトこととねはHTML 4.01 Strictによってマークアップされています。特に新しいことをしたいわけでもない私にとっては、それで充分だったからです。ですが、そう思いながらもずっとこととねをXHTML化したいという気持ちはどこかにありました。別にXHTMLにしたからなにが変わるというような話でもありません。セマンティック・ウェブに向けた第一歩としてHTMLをXHTMLに変換するところからはじめよう、という話も、実際にその恩恵が見えてこないためにあまり乗り気にもなれない、そんな風に思っていました。でも、それでもXHTML化したい気持ちはあったんです。なぜかといわれると、情報の利用簡便性を促進できるなら、それに関わりを持ちたいと考えたからで、そしてそうした試みについて知りながら、一向にXHTML化に着手しないことに負い目を感じていました。

 なぜXHTML化しなかったかというと、理由は極めて単純です。こととねの公開している文書があまりにも多すぎて、その作業量を考えるだけで嫌になったからという、本当に消極的な理由です。

 実をいうと、こととねのマークアップを見直すのはこれで二度目です。一度目はいつだったかというと、2001年の夏、DTDもついていない似非HTMLをHTML Strictに書き直したのです。思えば、この体験があんまりに大変であったために、XHTML化はよそうと、そういう気持ちになったのだと思います。でも、思うところがあって、XHTML化に着手すると決めました。

2006年11月17日
日々思うことなど 2006年をXHTML化しました。

XHTML化に踏み切った理由

 あまりに大変そうだからという理由で先送りにされてきたXHTML化に今になって取り組もうと決めた理由は、あるソフトウェアの存在でした。そのソフトウェアとはazurボイジャーのリリースする青空文庫に特化されたテキストリーダーです。しかし、なぜ青空文庫リーダーがこととねのXHTML化に関わるというのでしょうか。

azur
azurで青空文庫を開いたところ

 単純な理由です。azurは青空文庫だけでなく、一般のWebページをも開くことができ、そしてその表示能力はこととねを読むのに実に適していると思われたからです。今ご覧のとおり、こととねはかなりテキスト量の多いサイトです。こうした、文字主体のサイトをブラウズするにはazurがかなり適していると思われます。文書を縦書きに整形し表示してくれる、はっきりいうとそれがazurの売りで、中心的な機能です。ですがこのシンプルな機能が、日本文を読むには非常に適しているとわかって、まさしく侮りがたし。私はかつてテキストブラウザLynxにほれ込み、こととね読むならこいつだー、といっていたことがありましたが、しかしこのソフトに出会ってからは日本語読むならazurだと思うようになりました。ほら、だって、こととねがこんな風に読めるんですから。

azur
azurでこととねを読む

 しかし、これだけではこととねをXHTML化する理由にはなりませんね。こととねXHTML化の理由を説明するには、もうひとつ別のページを見ていただく必要があるでしょう。

azur
azurで短歌を読む

 そう、こととねには一部短歌が公開されているのです。高品位に縦書き表示をしてくれるazurは短歌を読むのに最適です。そしてその短歌のページには、珍しく読みを説明しようという意図が見えたのです。当初、読みは括弧でくくって表現されていました。どうせ縦書きになるでなし、短歌はそもそもWebには向かんよと思っていた私は、横書きに妥協するに際しルビを打つ必要も感じなかったのです。そもそも私はXHTMLのルビのマークアップは不満でした。美しくないと不満でした。それに、ルビを表示するUAの少なさにも不満でした。UAが表示するルビの読みにくさにもまた不満でした。だから私はルビは使わず、それゆえHTMLの表現で満足していたのです。

 ですが、azurはルビを美しく表現してくれます。いや、完璧ではありません。完璧ではありませんが、でもこれまで見たどのUAよりも美しくルビを表示してくれて、これならいけると思ったのです。むしろ、azurが表示してくれる縦書きの世界に、無粋に割って入る括弧付きの読みが煩わしかった。これをなんとかできればと思い、ルビを使えればと思い、すなわちここにXHTMLに移行する理由が生じたのです。

 これまでXHTML化を思いながらぐずぐずと先延ばしにしてきましたが、ここにXHTML化すると決めて、けれどその作業は大変でしょう。ですが、時間がかかろうともいつか達成したいと思っています。

2006年11月18日
日々思うことなどをXHTML化しました。
2006年11月19日
ちょっとだけインタビューこととねの作者ってこんな人こととねストリングス倶楽部私のお気に入りリンクをXHTML化しました。

XHTML化の手順

 XHTML化すると決めたまではよいとして、問題はそれをどのようにしておこなうかでした。理想は複数のファイルをまとめて処理できるコンバータですが、信頼性の問題もあり、なかなかこれと決めることができず、またHTMLをXHTMLに書き換えるスクリプトを書くにしても、なにしろ自分のやることなので信用ができないときています。なので、面倒でもひとつずつ変換していくと決めたのでした。

 このあたりDreamweaverは便利で、HTMLをXHTMLに変換してくれる機能がついています。これを使えば、なるたけHTMLの構造には手を付けず、タグのみをXHTMLのものに変換してくれます。空要素には終了タグの省略を示すスラッシュを過不足なくつけてくれるし、lang属性にxml:lang属性を、a要素のname属性にもid属性を補ってくれるなど、結構気の利いた変換をしてくれます。これは使えるというわけで、ただ残念なのはバッチ処理でディレクトリ丸ごと変換みたいな手が使えないことでしょうか。なので、ファイルをひとつひとつ開いては、メニューから変換を選んでコンバートという、手間な作業をしています。

 なおDreamweaverが書き換えるXHTMLは1.0 のTransitionalです。なので変換が終わったディレクトリを対象に、DTDの置き換えをします。チェックなしでXHTML 1.0 StrictのDTDを宣言するわけですが、もともとがHTML4.01 Strictからの変換なので、おそらく問題となるようなことはないでしょう。おかげで想像していたほど大変な作業ではありませんでした。

2006年11月20日
わたしの愛した機械をXHTML化しました。

変換漏れの確認

 なにぶん手作業での変換指示なので、どこかで漏れが生じるのではないかと、そういう予感がひしひしとするものですから、事前に確認の方法についても考えてあります。

 今回の変換は、HTML 4.01 StrictからXHTML 1.0 Strictへの移行です。一旦XHTML 1.0 Transitionalを経由し、最後にDTDを置き換えるという話はすでにしました。つまり、これらのファイルの一番特徴的に違っているところはなにかといえば、DTD、文書型定義であるとそういうわけ。もうここまで話せばおわかりだろうと思います。そう、私は変換作業を完了したと判断した時点で、全ファイルに対して検索をおこなう予定です。対象はまずはHTML 4.01 StrictのDTD。これで引っかかったものが取り残された文書であるというわけです。

 けど、私はこれに加えてもう二回検索をおこなう予定です。それはなぜかといいますと、XHTML 1.0 TransitionalからStrictへのDTD置き換え忘れも発生するかも知れないと思うからです。これがまず一回。で二回目はHTML 4.01 TransitionalのDTDを探します。これ、一体なんでかというと、Dreamweaver MXのデフォルト文書型定義がHTML 4.01 Transitionalであるからなんです。そう。HTML 4.01 TransitionalからHTML 4.01 StrictへのDTD置き換えを忘れたうえに、さらにまたXHTML化からも取り残されるファイルが出るかも知れないと、そこまで考えています。言い換えればこれは、私が自分のやることを信じていないということにほかならないのですが。

 ともあれ、一ファイルたりとも変換し忘れのないよう、万全を期す所存です。

2006年11月21日
食い意地、飲み意地、これ人間の基本をXHTML化しました。

XHTML化の副作用

 副作用といっても、悪い話じゃありません。むしろいい話、効用といってもいいような話であります。

 私はDreamweaverのXHTML変換は、ただ単純に今あるHTMLをXHTMLにするだけであると思っていたんです。それこそ文字置換の要領でですね。正直、自分でも作ろうと思ったらできるかな、なんて思っていました。Dreamweaverの書くHTMLなら、タグ内部で改行したりはないはずだから、空要素だけに気をつければ、後はそれほどでもないかなって思っていました。

 ところが甘かったね。なんと、Dreamweaverの変換は、ある程度のValidationもやってくれるみたいなんですよ。今回の作業において、img要素にalt属性がありませんぜと指摘されたのが数回、style要素にtype属性がありませんぜと指摘されたのが一回、けど、多分これ変換作業を続けていけばもっと増えるでしょう。とりあえず、現在私が怖れているのはFlashを使ったページの変換です。私はそれらページを変換する際には、古いembed要素を撤廃するつもりでいます。だって今やアクセスのほとんどはIE6かFirefox、Safariです。そこにまれにOperaとiCabが混ざる。こんな状況ですから、正直レガシーなUAに配慮する必要はないだろうと判断しました。それに私のサイトの場合、ナビゲーションにFlashを使っているわけでもない。じゃあなおさらembed撤廃でいいだろうと思ったのです。

 正直、長年の胸のつかえがとれたようです。私はルール違反だと知りながらembedを残していた。ですが、そうした妥協をついに排除することができます。また、長く気付かれずにあった文法違反に気付くことができた。これだけでも、今回のXHTML化には意義があったなと思います。

2006年11月22日
その時、僕は風景の一部になりたいと思ったをXHTML化しました。
2006年11月23日
音楽あれこれある日の書架から世界への扉「語学の部屋」Au coin du mondeをXHTML化しました。

もうひとつ気になっていたこと

 さて、ここでもうひとつ白状しますと、以前のHTMLファイルにはちょいとまずいかなっていう点があったのです。それも今回のXHTML化で解消されて、ああよかったー、てな感じなのですが、では一体それはなにかといいますと、HTMLのタグを大文字で書くか小文字で書くかという問題。実はこととねのHTMLはある時期を境にして、大文字小文字が切り替わっていたのです。

 その時期というのは、単純にいうとWebオーサリングツールを切り替えた時期です。私が最初に使っていたソフトはなにかというとクラリスホームページというやつで、これが実に困りもの。いや別にクラリスホームページに限らずとも、これくらいの時代のWebオーサリングツールにはろくなものはなかったので、特にこれだけが悪かったというわけではないんですけどね。

 クラリスホームページがいかに悪かったかは過去の記事にゆずるとして、このソフトが書くHTMLはタグが大文字だったのです。対して、その後使うようになったDreamweaverはというとタグが小文字。もちろん設定を変更したら大文字でも小文字でも好きなようにできるのですが、基本的に私はデフォルトで使いますから、このソフト切り替えによってタグ大文字時代、小文字時代がくっきりと分けられたのです。

 でも、その後クラリスホームページのHTMLはすべて書き換えられます。iCabを導入し、HTMLにルールがあることを知り、文法に違反する部分を修正したことがありまして、それがこの文書冒頭にていっていたHTML Strictへの変換作業なのですが、このとき、機械的に修正できる部分はすべてそのように変更したのでした。そしてその結果、ひとつの文書内に大文字タグと小文字タグが混在するという、非常に麗しくない状況が成立して、いや、これは別に文法違反ではないのです。HTMLではタグの大文字小文字を区別しないのですから。ですが、あまりにも一貫しないその作法に、私はなんとかしたいなあと思う気持ちを持ち続けていたのです。

 ですが、タグを小文字で書く必要のあるXHTMLに変換することで、そうした大文字小文字の混在はすべて解消されます。非常に地味な、表に見えにくい部分ではありますが、私としてはずっと気にしてきた部分ですから、これが解消されるというのは結構嬉しいことであったりします。

2006年11月24日
耳にするもの目にするもの、動かざるして動かしむるものをXHTML化しました。

誤算と修正

 機械的にDreamweaverのXHTML変換機能に任せていればいいと思っていた、今回のXHTML化作業ですが、思わぬ誤算がありました。

 まず第一点。うまくDreamweaverがXHTML化できないページが存在したこと。具体的にいいますと、「ときめきメモリアルONLINE」Geek's Sideのトップページが問題でした。このページは、ソースを見てみれば一目瞭然なのですが、文書内に複数のscript要素を抱えていて、それぞれにそこそこの長さのJavaScriptが書かれています。おそらくそれが問題になりました。これらのためにXHTML変換が途中でとまってしまい、しかたがないので目視で確認しながらXHTML化をおこないました。これが第一点。

 それともうひとつの誤算。これも「ときめきメモリアルONLINE」Geek's Sideに関係するのですが、JavaScriptで書かれる部分に関しては、Dreamweaverの手も及びません。例えばGeek's Sideのトップページにあるバナーの切り替えスクリプト。このバナー、img要素をJavaScriptで書いているのですが、これが変換されないので手で書き直す必要があり、そしてnoscript要素内のimg要素においても同様、手で終了を示すスラッシュを書き加えてやらねばなりませんでした。

 そして、最後に、これは当然というしかないのですが、外部JavaScriptファイルに記述されているHTMLは自動ではXHTMLにはなりませんわな。いや、DOMを使っているのはいいのですが、つまりはdocument.writeってやってるのが問題。具体的にいうとTMO授業時間割あたりですね。この場合空要素が問題になるわけですから、つまりはcol要素にそれぞれ終了のスラッシュを書いてやる必要があったのでした。

 困ったことに、iCabのエラーリポートはこれらの誤りを指摘しませんから、気付かれないでそのままになっているものもあるかも知れません。さらにいえば、全ページを検査したわけでもないので、どこかにエラーが残っている可能性があります。多分、多分大丈夫だと思うのですが、まあ、いずれのんびり少しずつチェックしていきたいと思います。

 そんなわけで、全部のページに対して変換漏れの確認の確認をして、当座の予定通り、XHTML化を完了させました。17日に開始して25日完了ですから、一週間ちょっとですか、まずまずの段取りであったと思います。けど、まだ今回のXHTML化に関して、やっておかないといけないことが残っています。一体それはなんでしょう?

2006年11月25日
ゲームゲームゲーム僕のお絵かき計画開かない眼をXHTML化しました。

注意書きをあらためる

 やっておかないといけないこと、それは変わってしまった状況を正しく伝えるということであろうかと思います。つまり注意書きを書き換える必要があったのです。

 そんなわけで、HTML 4.0 Strictを使っていますという個所をXHTML 1.0 Strictに書き改めて今回のXHTML化作業はすべて完了。できればここにazurでの閲覧がお勧めですとの記述を含めたかったのですが、どこにどういれてもおかしくなると思われたので断念。昔ながらのLynxがお勧めという文章をそのまんま残しています。

 実はもう一点手を入れたいと思っていることがあって、それはなにかというとルビの扱いなのですが、実はこととねの文書には一部読みがspan要素によって指定されているところがあるのです。ですが、なにしろspan要素title属性で読みを示しているものだから、よっぽど運がよいとか偶然が働いたりしないことには気付かれないと思います。そうしたものをruby要素にあらためるべきかどうなのか。でも、今はそれについては考えないでおこうと思います。

 なので、注意書きをあらためたことをもって作業は完了しました。よって以下に注意書きを引用しておきましょう。

こととねのドキュメントは、XHTML 1.0 Strictでマークアップされています。

こととねの利用に関する諸注意


わたしの愛した機械へ トップページに戻る

公開日:2006.11.17
最終更新日:2006.11.26
webmaster@kototone.jp
Creative Commons License
こととねは、クリエイティブ・コモンズ・ライセンス(表示 - 継承 2.1 日本)の下でライセンスされています。