ソフト詳細説明
ホームページで御馴染のHTMLは改行を<br>であらわしているので普通の検索ソフトでは行またがり検索ができないんですよねぇ。それでとりあえず<br>を改行に置換えることを中心にした単純なツールを作ってみました。将来はタグ総てを取り除く対象にする予定なのでプログラム名は"DeHTML"としました。
【処理内容】
・ファイル中の改行記号はHTML文書内では無意味なので削除する。(^_^)
ただし<PRE></PRE>間は除く
・ファイル中の<br>などを改行に置換える。(^_^)
・<head><title><html><h4>とあと少しと</...>を削除する
・<,>などを<>のような普通の表記に戻す
< は <
> は >
& は &
"は "
® は (R)
©は (C) にそれぞれ変換します。
・処理単位にまたがっている可能性のある場合は常識的な範囲の長さであれば、しかるべき処理をおこなう
・処理結果を順次ファイルに吐き出す。(^_^)吐き出す先のファイルは入力HTMLファイルの拡張子を変更したものをDeHTMLが開く。