類字抽出ツール 1.00A

RuijiFilter100A.zip ( Filesize:  1,889,798 )

ダウンロードはこちら

※ボタンを押すとダウンロードが始まります。

ダウンロード

ソフト詳細説明

類字とは、同じ意味の文字で全角/半角あるいはひらがな/カタカ
ナ、大文字/小文字による表示が異なる文字のことで、以下の事例
があります。
・事例
NO-1. シャーベット
NO-2. シャ-ベット ※NO-1の長音符が半角ハイフン
NO-3. シャーベット
NO-4. しゃーべっと
NO-5. しやーべつト
NO-6. シャーヘ゛ット ※"ベ"の濁点が分離して 2文字に分裂

例えば、表計算ソフトでデータベースを作成している場合、人間は
上記の事例を全て同じ意味の文字として認識できますが、集計等の
作業をシステム処理する場合は問題(※)となる可能性があります。
※問題例
同じ意味のデータが、別個のデータとしてシステム処理される
上記事例の場合、表計算ソフトのカウント関数等で"シャーベット"
の個数を数えると意味的な結果=6 に対してカウント結果=1 となる

この問題は、複数の類字を一つの文言に統一すれば解決します。
そのためには、まず類字の有無を確認することが必要です。
類字の有無は、表計算ソフトのフィルタ機能でも確認できますが、
データが大量の場合、その確認作業は大きな手間がかかります。

本ソフトは、大量のデータから類字のみを抽出して確認する作業を
ごく簡単な操作で自動処理して手助けします。
また、重複が許されないデータ(例.シリアル番号等)を簡単に確認
するツールとしてもご利用いただけます。

動作環境

類字抽出ツールの対応動作環境
ソフト名:類字抽出ツール
動作OS:Windows 10/7
機種:IBM-PC
種類:フリーソフト
作者: HRC