日本語・英語混在文に強いOCRソフト、数式を含む理系文書もOK、結果は LaTeX, MathML, Word2007等
InftyReader は、印刷物をスキャンした画像から、文字認識を行い、電子文字データにするOCRソフトです。
印刷文書を電子化するためのOCRは、たくさん出ていますが、InftyReader は、従来、文字認識が難しいとされている、数式構文や画像が混在するような文書も、認識できるように、研究開発されました。
また、1行中に日本語と英語(欧文)の部分が混在している場合でも、高精度な認識結果が得られます。
PDF ファイルを認識して LaTeX や Word などの編集可能なデータに変換することもできます。
結果は、さまざまな形式に出力でき、LaTeXのソースファイル、HTML(数式部分はMathML)、XML(MS WORD2007に対応)、また、Texから数式記号などを除いた Human Readable TeXにも保存できるので、多様な目的に対応します。
さらに、数学用文書エディタ InftyEditor (http://www.sciaccess.net/jp/InftyEditor)
と組み合わせることにより、スキャンした画像と認識結果を同時に表示して、認識結果を修正・編集することが容易に行えます。
その後、InftyEditorからも、同様にLaTeX、HTML(MathML)、XML(MS WORD2007に対応)、PDFなどに出力できるので、OCR結果を確実に利用することができます。
日本語部分の認識には国内の2つのトップメーカーの認識エンジンを組み合わせて用いていますので、最高認識結果を得ることができるようになっています。
また、英語やフランス語などの欧文の認識には3つのOCRエンジンが用いられる贅沢な仕様になっています。
文書中の図などは、画像として文書中に保存されます。
これまでに約20万ページに及ぶ数学専門論文誌の電子化実績をもち、数学特有の文字記号や、複雑な構文の数式にも、高い認識率を実現しました。
日本語と英語の部分を自動で抽出し、それぞれ専用のOCRエンジンを呼びだしていますので、日英混在分でも認識率が下がることがありません。
語学の教材やテストなどのような文書の認識にも力を発揮します。
今までのOCRで満足できなかった方にも、是非、試していただきたいソフトです。
インストール後、延べ15日間は無料で使用できます。
(試用期間には全く使わなかった日は含めません。従って、例えば月に3日程度しか使わなければ数ヶ月にわたって試用することも可能です。)
試用期間終了後も継続してのご利用をご希望の方は、購入手続きをしていただく必要があります。
購入された1ライセンスで、お一人2台のパソコンにインストール出来ます。
2台のパソコンで使用した後に、いずれかのパソコンを更新する場合はメールでご連絡下さい。新しいパソコンでの使用を可能にする手続きをいたします。
ソフト名: | InftyReader |
---|---|
動作OS: | Windows XP/NT |
機種: | 汎用 |
種類: | 製品:試用可 :98,000円 |
作者: | 特定非営利活動法人サイエンス・アクセシビリティ・ネット |
このソフトは有料ソフトです。
※消費税の増税に伴い、ソフト詳細説明や動作環境等に表示されている価格と、実際の価格が異なる場合がございます。ご購入前に必ずご確認ください。
※詳細はソフトをダウンロード後、ご確認ください。