cwex105.lzh ( Filesize: 77,799 )
Corpus Wizard は元々英語だけを扱う事を全体としたソフトでしたが、それだけではユ
ーザーの拡大が見込めないので、多言語対応が可能になるようにしました。
日本語用と英語用のもの(英語用は日本語Windows用と英語Windows用の2種類)が収録さ
れています。日本語用のものは速いけど誤認識する可能性のあるものと、ちょっと遅い
けど誤認識しないものの2種類が入っています。誤認識が気になる場合はJAPOLD.LZH内
のものを使って下さい。
単語のきりだし方法などはこのDLLを修正すれば可能です。
【日本語版】
単語境界の判定基準
原則として文字種(漢字・かな・カナなど)が変わったところ
ただし一部の文字については単語の先頭に来ないのでそれなりの処理をしているつもり。
その他の特徴
2バイト文字のファイル名も正しく扱えるはず
注意事項
1行単位で処理する関係上、行またがりは事前に解消していなければならない。
【英語版】
単語境界の判定基準
原則として区切り文字によって区切られるところ。ただし'(アポストロフィ)は英数字に挟まれていれば単語の一部であるとみなす。コンマは数字に挟まれていれば数字の一部であると判断する。
その他の特徴
2バイト文字のファイル名は誤作動のもと
【英語(デフォールト)版】
日本語Windows上で英語を扱うためのものです。
単語境界の判定基準
原則として区切り文字によって区切られるところ。ただし'(アポストロフィ)は英数字に挟まれていれば単語の一部であるとみなす。
その他の特徴
2バイト文字のファイル名も正しく扱えるはず
ソフト名: | Corpus Wizard Multi-Language Extension |
---|---|
動作OS: | Windows NT/95 |
機種: | 汎用 |
種類: | フリーソフト |
作者: | 浜口 崇 |