読者です 読者をやめる 読者になる 読者になる

正規表現

例によって授業準備以外のことで忙しい。連休に入ってやっていた仕事もその一つ。どなたかがホームページビルダーで作られたページをせこせこと手直ししていた。ホームページビルダーは使う人にもよるのだろうが,とにかくぐちゃぐちゃな出力をしてくれるんだと認識した。例えば<FONT>タグがまったく同じ内容でも平気で二重三重に重ねてかかれていたりする。<TABLE>タグだらけなのは,これは作成者の所為かもしれない。これらのタグを削除していてわからないことがでてきた。どなたか奇特な方,教えてください。
<FONT>タグを削除しようとするとき,例えばsedでこう書いてみました。(実際に作業に使ったのはサクラですが)

s/<FONT .*>//

当然ながら,これではうまく行きませんでした。なぜなら,次のようなソースがあるからです。

<FONT SIZE=+2>大きいのが好き</FONT>

最長一致だから,全部消えてしまいますよね。消したいのは当面<FONT SIZE=+2>だけなのに。
これ最初に見つけた「>」までをヒットさせるにはどのようにすればいいのでしょうか?
しかたないから順に見つけたタグを拾いながら削除して行ったのですが,また同じような仕事をする羽目になる可能性もありますので,今後のためにどなたか教えてください。