DeHTML for DOS

HTMLタグ削除ツール for DOS


ソフト詳細説明

 CNNのホームページにWorldTalk for PC-VANでアクセスしてLarry King Live のトランスクリプションを入手しました。当然のことながらHDDに残ったのはHTML文書です。このままでは通常の検索ソフトでは取りこぼしが多くなることが予想されますし、だいたい改行の位置が画面と大きく異なります。で、FINETにあったフリーソフトをダウンロードしてタグをとろう試みたものの、大きすぎてファイルを読み込めない。しかしけっして巨大なファイルではない。検索ソフト作者の私にとってはこれでは使い物にならないので、大きなファイルもものともしない専用ツールの作成を開始しました。

 ホームページで御馴染のHTMLは改行を<br>であらわしているので普通の検索ソフトでは行またがり検索ができないんですよねぇ。検索の度に検索ソフトで変換するよりもあらかじめ変換しておいた方が速いですしね。一行の長さもとてつもなく長いものがあったりしますので、それでとりあえず<br>を改行に置換える単純なツールを作ってみました。将来はタグ総てを取り除く対象にする予定なのでプログラム名は"DeHTML"としました。Windows版では削除のほか置換も出来ますのでそちらもご利用ください。

 えっ、Netscapeでもテキスト形式での保存が出来るじゃないかって?そういわれてしまえばみもふたもありませんが、たくさんのファイルを取り込むときにすべてのファイルに対して人間が同じ動作をくり返すというのはスマートじゃないですね。Web自動巡回ソフトで集めたファイルはどうしますか?そんなものはソフトに任せていればいいんです。

【処理内容】
・拡張子をみてバイナリファイルの疑いがある場合は作業をスキップ。
・ファイル中の改行はHTML文書内では無意味なので削除する。(^_^)
・ファイル中の<br>を改行に置換える。(^_^)
・タグを削除する。ものによっては改行に置換える。
・&gt;&lt;&amp;&quot;などを><&"に変換
・処理結果を順次出力用ファイルに吐き出す。(^_^)

【文字コードについて】
JIS/日本語EUC->SHIFT-JISの変換が利用できます。不完全かもしれませんが。

利用条件・試用期間中の制限など

 HTML関係の資料購入費、動作確認用HTML文書入手のための課金・通信費の援助を御願いしたいのでドネーションウェアとさせていただいております。1回試してしまえば処理済みテキストの山が出来てしまいますが(^_^;)よりよいソフト開発のためぜひ開発経費の援助を御願いします。

動作環境

DeHTML for DOSの対応動作環境
ソフト名:DeHTML for DOS
動作OS:MS-DOS
機種:IBM-PC
種類:シェアウェア :315円
作者: 浜口 崇 

お支払い

このソフトは有料ソフトです。
※消費税の増税に伴い、ソフト詳細説明や動作環境等に表示されている価格と、実際の価格が異なる場合がございます。ご購入前に必ずご確認ください。

※送金前に「シェアウェアの送金について」をお読み下さい。

その他のお支払い

郵便振替あり
※詳細はソフトをダウンロード後、ご確認ください。

ユーザーの評価(0人):0
コメント:0
>>コメントを見る

最優秀ダウンロードソフト決定戦
お気に入りのソフトに投票しよう!

■関連キーワード

削除  タグ  HTML 


「変換」カテゴリーの人気ランキング

  1. HTML2TXT HTMLで書かれているファイルからタグを取り除き、CRをCRLFに変換(ユーザー評価:0)
  2. HTML tools convert CSV or Text file to HTML file.(ユーザー評価:0)
  3. マルチHTMLファイル作製F型 テキストファイルからHTMLファイルを作ります F型(ユーザー評価:0)
  4. HtmTag いわゆるタグ除去ツールとは逆のことをする(ユーザー評価:0)
  5. htm2txt HTML→TEXT 変換ソフト(表をサポート)(ユーザー評価:0)

カテゴリーから選ぶ


その他のコンテンツ
ちょい読み!
コミック
SELECTION