遺伝的アルゴリズムを用いた特徴選択 によるパターン認識

Post on 04-Jan-2016

89 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

遺伝的アルゴリズムを用いた特徴選択 によるパターン認識. ○. 同志社大学三木 光範 同志社大学廣安 知之 同志社大学大学院永松 秀人. 研究背景. 商品管理システムの現状 バーコードが主流 タグ自体にコストがかかる 特殊な商品(多品種少量)を扱うのが困難 タグの不要なシステム 販売時に商品を撮影しデータベース上の 商品画像と比較する 画像認識 により商品管理を行う. 画像認識による商品管理システム. アクセサリの商品管理 撮影時の置き方によって同一物体が異なる 見え方をする際の画像認識. 画像認識のための処理. 前処理部 2値化 - PowerPoint PPT Presentation

TRANSCRIPT

遺伝的アルゴリズムを用いた特徴選択によるパターン認識

同志社大学 三木 光範同志社大学 廣安 知之同志社大学大学院 永松 秀人○

研究背景

商品管理システムの現状バーコードが主流タグ自体にコストがかかる特殊な商品 ( 多品種少量 ) を扱うのが困難

タグの不要なシステム販売時に商品を撮影しデータベース上の商品画像と比較する

画像認識により商品管理を行う

画像認識による商品管理システム

アクセサリの商品管理撮影時の置き方によって同一物体が異なる見え方をする際の画像認識

画像認識のための処理 前処理部

2 値化

特徴量抽出部特徴量データの抽出

識別部特徴量データベースとのマッチングにより識別

最も単純な識別すべての特徴量データを用いた識別

特徴量は撮影条件,対象物体に依存同一物体が異なる見え方を示す場合もある

すべてのデータが識別に用いられるとは限らない

特徴量を用いた識別

特徴量 幾何学的特徴量→形状に関する特徴量

統計的特徴量 →色に関する特徴量

特徴量抽出例 ( 変化なし )

特徴量 撮影例 1

撮影例 2

誤差 (%)

面積 2437 2787 1.8

モーメント 0.6548 0.6352 3

外周囲長 342.9 344.4 0.4

全周囲長 605.2 607.6 0.4

例:指輪

誤差:撮影例 1 を基準としたときの   撮影例 2 の変化量

撮影例1

撮影例2

特徴量抽出例 ( 変化あり )

特徴量 撮影例 1

撮影例 2

誤差 (%)

面積 16110 17237 7

モーメント 0.3895 0.5219 34

外周囲長 1369.8 2035.5 48

全周囲長 3775.8 4490.2 19

例:ネックレス

誤差:撮影例 1 を基準としたときの   撮影例 2 の変化量

撮影例1

撮影例2

ある対象物体,ある特徴量で変動が大きくなるものが存在

信頼性の高いデータと信頼性の低いデータに分別される

信頼性を考慮したマッチングが必要 重み係数 w を定義

特徴量データ

最適な重み係数を決定する 最適化問題

安定 不安定

面積 周囲長

例: 候補数 1000 個 特徴量数 30 個重み係数の組み合わせは 2 の 30 乗加えて 1000 候補に対して決定する

遺伝的アルゴリズム (GA) を用いる

重み係数

特徴量1

特徴量2

特徴量3

・・・ 特徴量 j

Item 1 0 1 1 ・・・ 0

Item 2 1 0 0 ・・・ 1

: : : : ・・・ :

Item i w(i,1) w(i,2) w(i,3) ・・・ w(i,j)

遺伝的アルゴリズム (GA)

生物の進化を模倣した最適化アルゴリズム 母集団に対して,遺伝的操作を繰り返し適用 多点探索により,大域的な探索に優れている

母集団

個体

GA を用いた特徴選択

識別に最適な重み係数の組み合わせをGA で決定する

画像認識問題の定式化

重み係数 w の最適な組み合わせを決定する w の値を並べて N ビットの 2 進記号列を遺伝子型 適合度により候補が決定

iX

size

Z

Y

:データベース上の候補

:入力画像

:入力と比較される データベース上の候補:使用する特徴量の数

実験

実画像を 2 種類用意特徴量データベース,入力画像

対象画像内訳

統計的特徴量

幾何学的特徴量

特徴量データ

2 値画像

オリジナル画像

分類 個数( 個 )

指輪 10

ピン 9

ネックレス 6

その他 6

合計 31

画像例

幾何学的特徴量

統計的特徴量

特徴量一覧

面積 2 次モーメント 絶対最大長パターン幅 円相当径 外周囲長全周囲長 包絡周囲長 丸さの度合い円形度 尖状度 最大弦長フェレ長 投影長 等分径切片長 フラクタル次元

平均値 分散 標準偏差歪度 尖度

GA パラメータ

個体数 100

設計変数 ( 特徴量数 )

39

染色体長 39

交叉率 0.6

交叉法 2 点交叉選択法 トーナメント選択トーナメントサイズ 4

突然変異率 0.025(=1/39)

評価方法

実験結果の評価法入力画像が候補の何番目に提示されたか?

入力画像適合度18.889119

6.812660

第一候補

第二候補

第一候補

実験結果

87% の確率で一意に識別可能 全ての特徴量を使用した識別と比較して約 20% の性能向上

識別例

特徴量の使用度合い

面積比較的どのような対象においても安定

周囲長形が変化する対象では不安定

指輪 87%(7/8)

ピン 77%(7/9)

ネックレス 16%(1/6)

その他 100%(4/4)

指輪 100%(8/8)

ピン 100%(9/9)

ネックレス 66%(4/6)

その他 100%(4/4)

識別に有効な特徴量を自動的に決定

まとめ

GA を用いた特徴選択による画像認識の提案

アクセサリを用いた実験87% の確率で一意に識別可能特徴量を選択しない場合と比較して

20% の性能向上

同一物体が異なる見え方を示す場合( 特徴量が変動する条件下 ) において有効人の顔認識等への応用

質疑応答

パターン認識

パターン認識問題観測されたパターンを,あらかじめ定められた複数の概念のうちの一つに対応させる処理

画像認識指紋認証 ,etc

音声認識音声ワープロ ,etc

優れた認識技術の開発

特徴選択

人間は優れた画像認識機能を有する特徴を選択的に抽出し,統合する

特徴選択与えられた特徴量の中から,識別に有用な特徴量の組み合わせを選択する

識別処理における計算コストの低減識別能力の向上

マッチングのフローチャート

商品ごとに最適な重み係数が存在商品一つ一つに対して GA を適用

入力画像 Y とデータベース上の各候補  を順に比較する

iX

iX

周囲長 面積 平均値 分散・・・

マッチング方法

商品A

周囲長 面積 平均値 分散・・・商品B

入力画像と前処理 撮影条件

バックライト上に配置カメラ位置は固定商品の置き方は自由

前処理2 値化

商品例(指輪)

商品例(ネックレス)

商品例(ピン)

商品例(その他)

認識例

その他 ピン

識別部におけるマッチング手法テンプレートマッチング

特徴量を用いたマッチング

基準となる画像と入力画像との重ね合わせ

特徴量データの比較によるマッチング

マッチングの概念

似通ったデータのみを用いてマッチングを行う

誤差が大きすぎるのは変動の激しい特徴量

DBデータ2DBデータ1 110100

011011

人間によるマッチング結果特徴量データだけによるマッチング

人間 GA

第一候補 pin-01 pin-01

第二候補 pin-02 etc-02

人間 GA

第一候補 ring-03 ring-03

第二候補 ring-01 ring-01

ring-04 を入力

pin-01 を入力

人間 GA

第一候補 pin-02 pin-02

第二候補 Necklace-02 Necklace-01

pin-02 を入力

人間・ GA ともに認識できるそれぞれの商品の特徴量データに違いが存在

フラクタル次元

次元の概念元の図形を n 分割し,できた相似な図形を

m ,次元を D とする

等分割した数の数元の図形と相似な図形

log

loglog mD n

直線:

正方形:

15log5

225log5

フラクタル次元

次元の概念を非整数まで拡張したもの

直線は 1 次元正方形は 2 次元立方体は 3 次元

コッホ図形

コッホ図形は 1.262 次元

262.13log

4log4log

10

103

円形度,尖状度,丸さの度合い

円形度真円で 1 となり,複雑なほど 0 に近づく

尖状度正方形,真円で 1 となり,とがっているほど小さくなる

丸さの度合い真円で 1 となり,複雑なほど大きくなる

4

)( 2

面積絶対最大長

2)(

4

周囲長面積

絶対最大長パターン幅

歪度,尖度 歪度

濃度ヒストグラムの形状が対称な形からどれだけずれているかを表したもの

尖度濃度ヒストグラムの分布がどれだけ平均値の回りに集中しているかを表したもの

3

1

0

3 )()(

n

i

iPiS

4

1

0

4 )()(

n

i

iPiK

)(iP :平均値 :標準偏差

:濃度ヒストグラム

評価関数

未知の入力 item X

特徴量 w1,w2,w3候補 A,B,C適合度

入力を A としたとき,他の候補 (B,C) と比べてどれだけ離れているか ?

31

Da

DcDb

評価関数

未知の入力 item X

特徴量 w1,w2,w4候補 A,B,C適合度

入力を B としたとき,他の候補 (B,C) と比べてどれだけ離れているか ?

31

Db

DcDa

top related