tesseract-ocr in ios

14

Upload: saya-katafuchi

Post on 22-Nov-2014

4.743 views

Category:

Technology


3 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Tesseract-OCR in iOS
Page 2: Tesseract-OCR in iOS

0@reiji1020

0長崎県立大学シーボルト校国際情報学部情報メディア学科 2年

0 Obj-C/Unity4/JavaScript/C#

0 http://reiji1020.hatenablog.com/

Page 3: Tesseract-OCR in iOS

文具メーカーからはスマホやタブレット用アプリと連動した商品が続々と発売されていますね

Page 4: Tesseract-OCR in iOS

ShotNote(KING JIM製)

0ノートタイプ、付箋タイプ、ホワイトボードタイプが用意されている。

0日時、ページを読み取りデータに付加することができる

Page 5: Tesseract-OCR in iOS

0 OCRすごい!

0企業発Appにしか搭載されていないのが残念…

0日本語を読んでほしいとは言わないから英語だけでも読めるとすごい

Page 6: Tesseract-OCR in iOS

Tesseract-OCR

0フリーの文字認識ライブラリ

0最初はHPが開発していたが今はGoogleが支援・開発を行なっている

0生い立ちなど詳しいことはGoogle先生に聞いてみてね

Page 7: Tesseract-OCR in iOS

0ダウンロードは以下のURLから

http://code.google.com/p/tesseract-ocr/

Page 8: Tesseract-OCR in iOS

0インストールはWindowsだととても簡単。インストーラがあるので一発インストール

0 Macはmacportに対応しているのでこれまたインストールは簡単

sudo port install tesseract

Page 9: Tesseract-OCR in iOS

0 Tesseract-OCRのライブラリはC/C++で書かれている

→Objective-Cでも使うことができる!

但しObj-Cソースコードの拡張子を*.mからObj-C++ソースコードの*.mmに変えなければならない

(obj-C++形式で書いていないソースコードも*.mmに変えておかないとビルドが通らない)

Page 10: Tesseract-OCR in iOS

OpenCVと比較して

0 OpenCVでパターンマッチングを行おうと試みたが、実用的な精度が出ず断念

0 IplImageとUIImageの変換を行わなければならない

0 UIImageはRGBAの4チャンネル

0 IplImageはBGRの3チャンネルで扱う

0アプリ内で撮った写真を処理にかけるときは少々面倒である

Page 11: Tesseract-OCR in iOS

0カメラ起動ボタンをタップするとカメラが起動

0必要部分をトリミング(自由に切り出せるように改良の余地あり)

0 Useボタンを押すと処理開始

Page 12: Tesseract-OCR in iOS

0処理が終わると下に結果が表示される

Page 13: Tesseract-OCR in iOS

0メリット0 処理速度がとても速い

0 英数の精度はとても良い

0 日本語も中々精度が高い

0 フリー

0デメリット0 角度を調整してあげないと誤認識が生じる(1→/)

0 数字と英語が混じっている文章では(フォントによって)0(ゼロ)とO(オー)、1とI(アイ)の誤認識が生じる0読み取りたい文章に合わせて言語ライブラリを絞ろう。

Page 14: Tesseract-OCR in iOS

0参考スライド:http://www.slideshare.net/takmin/tesseract-ocr