HTMLの表をカット&ペーストしたテキストファイルをCSV形式に変換
HTMLの内容をカット&ペーストしてテキストファイルを取り出すと、見栄えのために本文中に改行コードや行頭のスペースが多数挿入された形のテキストデータが得られます。これらを削除して本文だけを取り出すフィルタプログラムを以前 DelCR という名前で発表しました。今回はその親戚にあたるフィルタプログラムです。
HTMLの表をカット&ペーストしてテキストファイルを取り出すと、やたらとスペースだらけのテキストデータが得られます。このテキストデータを注意深く調べると、スペースの数にある規則性があり、それを利用すると、元の表データがかなり正確に再現できることがわかりました。本プログラムでは、行頭のスペースの数を数えることにより、CSV形式の表データを作り出します。
本プログラムはDOSのフィルタプログラムですが、WINDOWS環境からも簡便に使えるようにちょっとした工夫をしています。そのため、少し制約はありますが、加工したいテキストファイルをドラッグ&ドロップすることで、本プログラムを利用できるようになっています。
ソフト名: | 2CSV |
---|---|
動作OS: | Windows Me/2000/NT/98/95 MS-DOS |
機種: | IBM-PC |
種類: | フリーソフト |
作者: | 森川 治 |