tesseract-ocr in ios
DESCRIPTION
TRANSCRIPT
0@reiji1020
0長崎県立大学シーボルト校国際情報学部情報メディア学科 2年
0 Obj-C/Unity4/JavaScript/C#
0 http://reiji1020.hatenablog.com/
文具メーカーからはスマホやタブレット用アプリと連動した商品が続々と発売されていますね
ShotNote(KING JIM製)
0ノートタイプ、付箋タイプ、ホワイトボードタイプが用意されている。
0日時、ページを読み取りデータに付加することができる
0 OCRすごい!
0企業発Appにしか搭載されていないのが残念…
0日本語を読んでほしいとは言わないから英語だけでも読めるとすごい
Tesseract-OCR
0フリーの文字認識ライブラリ
0最初はHPが開発していたが今はGoogleが支援・開発を行なっている
0生い立ちなど詳しいことはGoogle先生に聞いてみてね
0ダウンロードは以下のURLから
http://code.google.com/p/tesseract-ocr/
0インストールはWindowsだととても簡単。インストーラがあるので一発インストール
0 Macはmacportに対応しているのでこれまたインストールは簡単
sudo port install tesseract
0 Tesseract-OCRのライブラリはC/C++で書かれている
→Objective-Cでも使うことができる!
但しObj-Cソースコードの拡張子を*.mからObj-C++ソースコードの*.mmに変えなければならない
(obj-C++形式で書いていないソースコードも*.mmに変えておかないとビルドが通らない)
OpenCVと比較して
0 OpenCVでパターンマッチングを行おうと試みたが、実用的な精度が出ず断念
0 IplImageとUIImageの変換を行わなければならない
0 UIImageはRGBAの4チャンネル
0 IplImageはBGRの3チャンネルで扱う
0アプリ内で撮った写真を処理にかけるときは少々面倒である
0カメラ起動ボタンをタップするとカメラが起動
0必要部分をトリミング(自由に切り出せるように改良の余地あり)
0 Useボタンを押すと処理開始
0処理が終わると下に結果が表示される
0メリット0 処理速度がとても速い
0 英数の精度はとても良い
0 日本語も中々精度が高い
0 フリー
0デメリット0 角度を調整してあげないと誤認識が生じる(1→/)
0 数字と英語が混じっている文章では(フォントによって)0(ゼロ)とO(オー)、1とI(アイ)の誤認識が生じる0読み取りたい文章に合わせて言語ライブラリを絞ろう。
0参考スライド:http://www.slideshare.net/takmin/tesseract-ocr