日本語で書いてあるWebページの文字コードは今何が一番多いのだろうかと
テストケースを書いていて思ったのだが、ページをgetしてタイトルを抜き出す処理である。抜き出した文字列を UTF-8 に変換しなければならないのだが、私のページは Phinloda is here が JIS、裏表が EUC-JP なので、これはテストできる。ところが、Shift_JIS で公開しているページでタイトルが日本語のものがない。
そこで、Shift_JIS でタイトル日本語のページはどこかないか、という話だが、FPROG とかだともうすぐテストできなくなるのでダメだし、ふと思いついたのは、すのもののページである。すのものさんのサイトは google で「すのもの」で探せばトップに出てくるし、外から見るときも便利なのだ。ということで、テストに使わせていただいた。ちなみに、ほりもとあきら氏のページも確か Shift_JIS だったと思ったが、タイトルがアルファベットだけなのだ。
まあトップページにこだわる必要はないのだが。テスト用に自分でページ作るのがよさそうだ。
すのものさんで何故か思い出した全然関係ないネタ。この前、冬桜の紹介をTVで放送していた。その冬桜は秋に咲くというのである。秋に咲くのなら秋桜ではないのかと言ったら、「秋桜はコスモスだ」と速攻で突っ込まれて自爆するハメに。
| 固定リンク

コメント