Download - 第17回関西CVPRML勉強会 (一般物体認識) 1,2節
![Page 1: 第17回関西CVPRML勉強会 (一般物体認識) 1,2節](https://reader034.vdocuments.mx/reader034/viewer/2022052304/55a19e2d1a28ab315c8b4645/html5/thumbnails/1.jpg)
Bag-of-Features に基づく物体認識(2) 一般物体認識
関西CVPRML勉強会 2012/02/18
川西康友 (@yasutomo57jp )
1.はじめに 2.一般物体認識とは
*スライド中で適当にGoogle画像検索で拾ってきた画像を使用しています
![Page 2: 第17回関西CVPRML勉強会 (一般物体認識) 1,2節](https://reader034.vdocuments.mx/reader034/viewer/2022052304/55a19e2d1a28ab315c8b4645/html5/thumbnails/2.jpg)
背景
デジカメの普及・Webへのアップロード
大量の画像データがWeb上に存在
でも・・・
画像の整理は超大変
人手でタグ付け
EXIF, GPS情報を元にタグ付け
自動的にできたら嬉しい
(Picasaから引用)
![Page 3: 第17回関西CVPRML勉強会 (一般物体認識) 1,2節](https://reader034.vdocuments.mx/reader034/viewer/2022052304/55a19e2d1a28ab315c8b4645/html5/thumbnails/3.jpg)
一般物体認識
意味カテゴリーを画像から認識する研究
一般的なシーンの意味カテゴリー
画像に含まれる物体の意味カテゴリー
養鶏場の写真 空
山
森
鶏
鶏舎
田舎だと一般的なシーン
![Page 4: 第17回関西CVPRML勉強会 (一般物体認識) 1,2節](https://reader034.vdocuments.mx/reader034/viewer/2022052304/55a19e2d1a28ab315c8b4645/html5/thumbnails/4.jpg)
一般物体認識 40年以上前から研究されている 人間
数万種類の対象を認識できる
計算機 数種類でも自動的に特定することは困難 現状では…
実用化レベル:人間の正面顔認識程度
計算機にとって非常に難しい問題の一つ
![Page 5: 第17回関西CVPRML勉強会 (一般物体認識) 1,2節](https://reader034.vdocuments.mx/reader034/viewer/2022052304/55a19e2d1a28ab315c8b4645/html5/thumbnails/5.jpg)
何が難しいの?
同一カテゴリーに含まれる画像の範囲が広い
見た目変化の大きさ・他カテゴリーとの類似
「A」という文字認識 「ラーメン」という一般物体認識
A A A A A A
C B
意味カテゴリーをどのように定義するのかが重要
![Page 6: 第17回関西CVPRML勉強会 (一般物体認識) 1,2節](https://reader034.vdocuments.mx/reader034/viewer/2022052304/55a19e2d1a28ab315c8b4645/html5/thumbnails/6.jpg)
何が難しいの?
撮影した環境が統制されていない
「ラーメン」という一般物体認識
「画像の真ん中にどかんとラーメンが写っている」 という環境
環境が統制されているので
まだ認識できそうだが…
![Page 7: 第17回関西CVPRML勉強会 (一般物体認識) 1,2節](https://reader034.vdocuments.mx/reader034/viewer/2022052304/55a19e2d1a28ab315c8b4645/html5/thumbnails/7.jpg)
何が難しいの?
撮影した環境が統制されていない
「ラーメン」という一般物体認識
![Page 8: 第17回関西CVPRML勉強会 (一般物体認識) 1,2節](https://reader034.vdocuments.mx/reader034/viewer/2022052304/55a19e2d1a28ab315c8b4645/html5/thumbnails/8.jpg)
難しさ
「一般的な名称」が表すカテゴリーの広さ
特定の制約下で撮影されたものではない画像
画像処理・認識問題としては以下が困難
特徴抽出
認識モデル構築
学習データセット構築
![Page 9: 第17回関西CVPRML勉強会 (一般物体認識) 1,2節](https://reader034.vdocuments.mx/reader034/viewer/2022052304/55a19e2d1a28ab315c8b4645/html5/thumbnails/9.jpg)
どういう処理の流れ?
学習フェーズ カテゴリ分の認識画像セットを用意
特徴抽出
分類器の学習
認識フェーズ 未知の画像を用意
特徴抽出
分類
学習用画像セット
特徴抽出
分類器の学習
未知の画像
特徴抽出
分類
分類結果
学習フェーズ 認識フェーズ
![Page 10: 第17回関西CVPRML勉強会 (一般物体認識) 1,2節](https://reader034.vdocuments.mx/reader034/viewer/2022052304/55a19e2d1a28ab315c8b4645/html5/thumbnails/10.jpg)
何ができるの?
画像全体のカテゴリー分類
養鶏場の写真 田舎だと一般的なシーン
![Page 11: 第17回関西CVPRML勉強会 (一般物体認識) 1,2節](https://reader034.vdocuments.mx/reader034/viewer/2022052304/55a19e2d1a28ab315c8b4645/html5/thumbnails/11.jpg)
何ができるの?
画像のアノテーション
田舎だと一般的なシーン
空
山
森
鶏
![Page 12: 第17回関西CVPRML勉強会 (一般物体認識) 1,2節](https://reader034.vdocuments.mx/reader034/viewer/2022052304/55a19e2d1a28ab315c8b4645/html5/thumbnails/12.jpg)
何ができるの?
画像ラベリング
空
田舎だと一般的なシーン
山
森
鶏 地面
![Page 13: 第17回関西CVPRML勉強会 (一般物体認識) 1,2節](https://reader034.vdocuments.mx/reader034/viewer/2022052304/55a19e2d1a28ab315c8b4645/html5/thumbnails/13.jpg)
何ができるの?
カテゴリー物体検出
田舎だと一般的なシーン
鶏はどこですか?
![Page 14: 第17回関西CVPRML勉強会 (一般物体認識) 1,2節](https://reader034.vdocuments.mx/reader034/viewer/2022052304/55a19e2d1a28ab315c8b4645/html5/thumbnails/14.jpg)
何ができるの?
カテゴリー領域抽出
田舎だと一般的なシーン
鶏の領域は?
![Page 15: 第17回関西CVPRML勉強会 (一般物体認識) 1,2節](https://reader034.vdocuments.mx/reader034/viewer/2022052304/55a19e2d1a28ab315c8b4645/html5/thumbnails/15.jpg)
近年の技術的進歩 (1) 新しい画像表現・特徴量
3節
(2)機械学習手法の進歩 4,5節
(3)Webによるデータセット構築の容易化 7節
(4)計算機の高速化・大容量化 Web上での公開
ソフトウェア データセット
研究を始めやすい環境→研究が加速
![Page 16: 第17回関西CVPRML勉強会 (一般物体認識) 1,2節](https://reader034.vdocuments.mx/reader034/viewer/2022052304/55a19e2d1a28ab315c8b4645/html5/thumbnails/16.jpg)
詳細は…以降の発表で明らかに! 今回の私の発表はここまでです