« ダビング10と、江戸町奉行 | トップページ | MVPen 使用レビュー Vol.8 OCR精度Ⅱ »

2008年5月28日 (水)

MVPen 使用レビュー Vol.7 OCR精度Ⅰ

 Vol.1はこちら
 前回までMVPenの読み取り精度について書いてきました。
最初はここで終わりにしようと思っていたのですが、Vol.4で書いたとおりMVPenは、10分間何も書かないと電源が切れてしまいます。
この点は設定時間を、せめて30分ぐらいに変えられるとよかったんですが……

 いったん節電モードに入ると、電源を再び入れても前のデータに追記ができないので、ページが変わってしまいます。(前のデータは自動保存される)
僕は、当初はMVPenをノート代わりに使おうと思っていました。
データは「Hamana」という漫画ビューアーで閲覧すれば、ページめくりをしたように見えるエフェクトもかけられるので、いい感じになると思っていたのです。

 しかし節電のため自分の思わぬところでページが変わってしまう可能性があるので、OCRを使ってテキスト保存した方がいいような気がしてきました。
そこで今回はOCRの変換精度についてレポートします。
下の画像はMVPenを使って実際にデータを読み込んだ画像です。

Dr220

人気blogランキングへ

 このブログの5月25日の記事の冒頭部分です。

 若干乱れたところもありますが、概ね良好に読み取れているのではないかと思います。
紙の上に残った文字はこれです。

Dr225

  使用したのはA罫7mm幅のレポート用紙です。
下の方のスケールは、1センチ刻みの目盛りです。

 細かいところで誤差が目立つところもあります。
たとえば3行目の「シ」の文字がつぶれています。
これはおそらく一つ目の点から二つ目の点に移動するときに、ペン先が紙面をかすってしまったためだと思います。
「過」の文字のしんにょうの部分は、2画目から3画目に移るときに、いったん紙面から離れたペン先が、再び紙面に着くときに微妙にずれたものだと思います。

 データの取り込みなどを管理するソフト「ノートテーカー」上で、変換したいファイルを呼び出して、

Dr230

 「α」と書かれたツールボタンをクリックすると、自動的に「My Script Notes」というOCRソフトが立ち上がり、それだけで変換が終わります。

Dr255

 右側の変換結果を拡大すると、

Dr260

 全61文字のうち誤変換は2文字という結果でした。
変換効率は今回は96.7%ということでした。
このデータで変換には、8秒程度かかりました。(400字なら52秒くらいか?)

 予想通り取り込みの時点でつぶれていた「シ」の文字は「想」と認識されたようです。
その反面「過」の文字は問題なく変換されています。
2行目の「す」の文字は、理由は分かりませんが、カタカナの「オ」になっています。

 意図的に、かな、カタカナ、漢字、数字、アルファベットが入り交じった、意地悪な文章を選んだのですが、その割に好成績だったのではないかと思います。

 ただこの文例は、僕が持てる全ての力を注ぎ込んで最大限ていねいに書いたものです。
(これ以上は僕には無理……)

 ではもっといいかげんにかいたら、どうなるでしょうか?
次回はそれについて書きます。

 MVPen使用レビュー Vol.8 OCR精度Ⅱへ

ぺんてるから発売された同機能の「airpenMINI」です。クリップが大型になりペン先のスイッチが感圧式になったとのことで、使い勝手と書き味の滑らかさがアップしたようです。
↓ ↓ ↓ これです。

割安な「PC接続タイプ」があるようです。
3000円程、お得なようです。
↓ ↓ ↓ これです。

|

« ダビング10と、江戸町奉行 | トップページ | MVPen 使用レビュー Vol.8 OCR精度Ⅱ »

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/179348/41363360

この記事へのトラックバック一覧です: MVPen 使用レビュー Vol.7 OCR精度Ⅰ:

« ダビング10と、江戸町奉行 | トップページ | MVPen 使用レビュー Vol.8 OCR精度Ⅱ »