HTMLタグ削除・置換ツール for Win16
CNNのホームページにWorldTalk for PC-VANでアクセスしてLarry King Live のトランスクリプションを入手しました。当然のことながらキャッシュされてHDDに残ったのはHTML文書です。Larry King Liveのファイルだけに関してですが、1論理行([*]行の始めから改行記号まで)の長さはめちゃくちゃ長いし([*]Elisでは複数行に分離されるし・・・)、このままでは通常の検索ソフトでは取りこぼしが多くなることが予想されますし、だいたい改行の位置が画面と大きく異なります。検索すらできない場合すらあるかもしれません。[実際に検索ソフトを暴走させたことがあります(^_^;)]でFINETにあったフリーソフトをダウンロードしてタグをとろう試みたものの、大きすぎてファイルを読み込めません(;_;)。しかし50000バイト前後とけっして巨大なファイルではありません。これでは逆立ちしても使い物にならないので作成を開始しました
ホームページで御馴染のHTMLは改行を<br>であらわしているので普通の検索ソフトでは行またがり検索ができないんですよねぇ。それでとりあえず<br>を改行に置換えることを中心にした単純なツールを作ってみました。将来はタグ総てを取り除く対象にする予定なのでプログラム名は"DeHTML"としました。現在はほぼすべてのタグを取り外せるはずです。ただし、確認はしていませんので、もし外せていないのがあれば教えてください。
最近はWWW用オートパイロットソフトが出まわっていますので、かき集めたファイルのタグをまとめて外すという使い方もできるでしょう。
HTML関係の資料購入費、動作確認用HTML文書入手のための課金・通信費の援助を御願いしたいのでシェアウェアとします。1回試してしまえば処理済みテキストの山が出来てしまいますが(^_^;)ぜひ経済的援助を御願いします。
ソフト名: | DeHTML for Win16 |
---|---|
動作OS: | Windows 3.1 |
機種: | 汎用 |
種類: | シェアウェア :315円 |
作者: | 浜口 崇 |
このソフトは有料ソフトです。
※消費税の増税に伴い、ソフト詳細説明や動作環境等に表示されている価格と、実際の価格が異なる場合がございます。ご購入前に必ずご確認ください。
※送金前に「シェアウェアの送金について」をお読み下さい。
郵便振替あり
※詳細はソフトをダウンロード後、ご確認ください。