Amazonの「なか見!検索」機能や、Jコミなどの書籍画像から、文字画像やtxt形式のテキストデータを自動抽出
「Amazonサンプル画像テキストデータ自動抽出ツール」は、Amazon(http://www.amazon.co.jp/)及びJコミ(http://www.j-comi.jp/)で、書籍画像からテキストデータを自動抽出するツールです。
「UrlListに指定されたURLを巡回する」モードでは、指定されたAmazonやJコミのURLをもとに、書籍画像を自動取得し、一括でテキストデータ抽出を行います。
Amazonの場合は、立ち読み機能(「なか見!検索」)で提供しているサンプル画像から、Jコミの場合は、サイトで公開されている全文から、文字画像やテキスト直データをtxt形式で抽出することが可能です。
抽出結果のテキストファイルは、一般のテキストエディタ等で開いたり編集したりすることが可能です。
テキストデータ抽出ツールとしてではなく、Amazonサンプル画像自動収集ツール、Jコミ画像自動収集ツール、及び画像トリミングツールとしてご利用頂くことも可能です。
また、「ImageUrlListに指定された画像URLを巡回する」モードでは、指定された書籍用画像のURLを自動巡回し、文字画像やテキスト直データをtxt形式で抽出します。
このモードでは、AmazonやJコミ以外の画像URLや、PC上に保存してあるローカルのファイルパスを指定することが可能です。
この方法を使えば、自宅でスキャナ等を使用して紙の本から自家生産した電子書籍や、電子書籍ソフトで表示したページを手動で画面キャプチャして作成した書籍画像に対して、当ツールに取り込むことが可能です。
テキスト抽出処理に関しては、バイナリファイル化したライブラリを用いて高速で処理を行います。文字画像ライブラリは6万以上用意しており、今後のアップデートによって随時拡張していきます。
公式対応本に関しては95%以上の精度で抽出します。
公式対応本以外に対しても、部品画像ライブラリを自家生産することで、高い精度での抽出が可能です。
ライブラリ自家生産用の機能として、「部品画像ライブラリ出力モード(手動入力/自動入力)」や「フォント文字画像出力モード」を用意しています。
また、当ツールを使用して電子書籍画像のトリミング処理を行った後に、他社製のOCRソフトを使用してテキストデータ抽出を行うことも可能です。
起動時にライセンスキーを入力しなかった場合は、試用版として起動します。
試用版には以下の機能制限を設けています。
起動回数制限または使用制限に達した場合、ツールは強制終了します。
・起動回数制限(10回)
・使用制限(取得可能回数は10回まで)
・タスクスケジューラにプログラム登録時、自動起動できない
(ライセンスキーの確認ダイアログが表示されるため)
ライセンスキー購入の前に試用版を動作させて、
ツールが正しく動作することを必ずご確認ください。
ソフト名: | Amaz○nサンプル画像テキストデータ自動抽出ツール |
---|---|
動作OS: | Windows 8/7/Vista/XP/Me/2000/NT/98/95 |
機種: | 汎用 |
種類: | シェアウェア :648円 |
作者: | OrangeWorks |
このソフトは有料ソフトです。
※消費税の増税に伴い、ソフト詳細説明や動作環境等に表示されている価格と、実際の価格が異なる場合がございます。ご購入前に必ずご確認ください。
※送金前に「シェアウェアの送金について」をお読み下さい。
銀行振り込み/郵便振替/その他送金方法あり
※詳細はソフトをダウンロード後、ご確認ください。