私のホームページは意味もなく増え続けていて、内部どうしのリンクでさえ切れている箇所が相当数あった。今までどこがどのように切れているのかわからなかったが、まず wget を利用してある程度のリンク切れを検出することができた。かなりの数はわかったのだが、それでもなお多数リンク切れはあるようだ。リンク切れを検出するプログラムは世の中に多く出回っているはずで、実際多数見つかったのだが、どうも私の求めている要求とは違う。仕方がないので、自分で作ってみた。大昔の私なら C や C++ で、一昔前の私なら Ruby や Perl で作ったはずだろうが、今の私は Python を使っている。Ruby には申し訳ないが、たまたま最近の本でウェブクローラを Python で作る本を見てそのプログラムを参考にしたので、Python で作るのが一番楽だと判断した次第だ。なんとか形になって多数内部のリンク切れを検出して、やっとこさ直した。これで長年もやもやしていた懸案が一つ解決した。
セコメントをする