کامپیوتر و برق دانشکده ،اصفهان صنعتی دانشگاه مصنوعی...

40
کامپیوترانشکده برق وصفهان، ده صنعتی انشگا دا هوش مصنوعی گروهوضوع سمینار م آماریلگوشناسیه ایدگاره از دتم بازشناسی چهیس سFace Recognition System (State-of-the-art) ی شناسایمینار درس سری الگو آما نگارندهکبریاندق علی احمدصا م2280288 ستاد اانی دکتر صفای بهار28

Upload: independent

Post on 20-Feb-2023

1 views

Category:

Documents


0 download

TRANSCRIPT

دانشگاه صنعتی اصفهان، دانشکده برق و کامپیوتر

گروه هوش مصنوعی

موضوع سمینار

سیستم بازشناسی چهره از دیدگاه الگوشناسی آماری

Face Recognition System (State-of-the-art)

آماری الگوسمینار درس شناسایی

نگارنده

محمدصادق علی اکبریان

2280288

استاد

دکتر صفایانی

28بهار

2

مبسم اهلل الرحمن الرحی

3

فهرست مطالب

5 .............................................................................................................................................................. دهیچک

2................................................................................................................................................................ مقدمه

2................................................................................................................................................... ....خچهیتار.1

7 ............................................................................................................... ...چهره یبازشناس یمفهوم یبند میتقس.8

2 .......................................................................................................................................... .…گزارش ساختار.8

2 ............................................................................................................................... چهره یبازشناس ستمیس کار روند

11........................................................................................................................................... چهره یرفضایز یمعرف

15................................................................................................................................. آن شینما و هرهچ یساز مدل

15............................................................................................................. ..……چهره یفصا مقابل در ریتصو یفضا .1

12 ...................................................................................................................... هیپا توابع و یاصل یها چندشاخه. 8

12 ................................................................................................................................... یاصل یها محور زیآنال. 8

12 ......................................................................................................................................... ابعاد و ژهیو فیط. 4

17................................................................................................................................... ..……یخط یرفضایز .5

17.......................................................................................................... …....…مربوطه یکهایتکن و ژهیو چهره. 5.1

12....................................................................................................................... ....…یاحتماالت ژهیو یفضا. 5.8

12............................................................................................................ ..…سیشرفیف: یخط کننده کیتفک. 5.8

12................................................................................................................................... ……یرخطیغ یرفضایز .2

12............................................................................................................ یرخطیغ PCA و یاصل یها یمنحن. 2.1

Fisher .................................................................................................80 و PCA تمیالگور در کرنل از استفاده. 2.8

81........................................................................................................................................ چهره یرفضایز یریادگی

84....................................................................................................................................................چهره صیتشخ

84......................................................................................................................... .…چهره صیتشخ بر یا مقدمه .1

84.............................................................................................. ظاهر بر یمبتن یروشها و یریادگی بر یمبتن یروشها. 8

87....................................................................................................................................... چهره یاجزا یگذاز نشان

4

87................................................................................................................................................... ...مقدمه .1

82........................................................................................................................ چهره یاجزا صیتشخ مورکیفر. 8

82........................................................................................................................................ چشم یساز یمحل. 8

80............................................................................................................................. ….ها چشم انهیم خط. 8.1

80................................................................................................................... ….دایکاند یها چشم صیتشخ. 8.8

81....................................................................................................... ……...چشم یدایکاند از یبردار رنمونهیز. 8.8

81....................................................................................................................... ها چشم جفت یبند دسته. 8.4

88..................................................................................................................................... چهره یبازشناس یکاربردها

88................................................................................................................................................... …مقدمه. 1

88............................................................................................................................................ چهره ییشناسا. 8

88.......................................................................................................................................... یدسترس کنترل. 8

84...................................................................................................................................................... تیامن. 4

85...................................................................................................................................... ینظارت یها ستمیس. 5

82 ......................................................................................................................................... هوشمند یکارتها. 2

82 ............................................................................................................................................... قانون یاجرا. 7

87........................................................................................................................................................ یبند جمع

82.............................................................................................................................................................. مراجع

5

چکیده

هدف در سیستم بازشناسی چهره، پیدا کردن تصویری است که ویژگی های بسیار مشابهی )شبیه ترین( با تصویر چهره ورودی را

دارد. در این گزارش ابتدا مفاهیم استفاده شده با زبانی ساده بیان شده است. سپس در هر شاخه روش های موجود معرفی، بررسی و

ن روش موجود تا کنون معرفی و شرح داده شده است.مقایسه شده اند و نهایتا بهتری

مقدمه 6

فصل اول

مقدمه

بازشناسی چهره عملی است که انسان ها به صورت روتین و روزمره در زندگی خود با دقت باالیی انجام میدهند. افزایش روزافزون

ردازش های خودکار بر روی تصاویر رایانه های خانگی، سیستم های ارزان قیمت روی میزی باعث شده تا توجه های زیادی روی پ

شامل بازشناسی ها، تعامل انسان و کامپیوتر و مدیریت چند رسانه ای جلب شود. پروژهش ها و توسعه هایی در زمینه بازشناسی

چهره نیز به همین دالیل در حال انجام و گسترش است.

ت در بازشناسی مزایایی دارد. در کنار طبیعی بودن و بازشناسی چهره نسبت به دیگر روش های بیومتریک نظیر تشخیص اثر انگش

غیر قابل بروز بودن این نوع بازشناسی، مهم ترین مزیت بازشناسی چهره این است که صورت میتواند در هر فاصله ای گرفته شود و

معرفی شد، ویژگی های چهره باالترین سازگاری را در Heimeyerپوشش داده شود. در بین شش ویژگی بیومتریکی که توسط

داشته اند. بازشناسی چهره به عنوان یکی از قدرتمند MRTD (Machine Readable Travel Documents)سیستم های

یا وترین تکنولوژی های بیومتریک در پیشرفت هایی در دستگاههای عکس برداری، ذخیره سازی حجم زیادی از تصاویر در حافظه

وب و افزایش امنیت نقش بسیار مهمی را ایفا کرده است.

تاریخچه .1

مطرح شد. سپس یک فاصله 1278در پایان نامه دکتری ایشان در سال Takeo Knadeاولین سیستم بازشناسی چهره توسط

بر روی نمایش Sirovich and Kirbyزمانی زیادی بین این کار و کار بعدی در زمینه بازشناسی چهره بوجود آمد تا زمانی که

تند. این کار بهره جس 1nalysisPrincipal Component Aچهره در فضاهای با ابعاد کم کار خود را آغاز کردند و از الگوریتم

د یک تحول عظیم در زمینه بازشناسی چهره ایجاد کنند. دیگر نقاط بتوانن Eigenfaceئه با ارا Turk and Pentlandسبب شد تا

8Linear Discriminant Analysis، که از الگوریتم Fisherfaceدر زمینه بازشناسی چهره بوجود آمد شامل: روش عطفی که

برای Gabor jetبرای بدست آوردن دقتی باالتر استفاده میکرد. استفاده از فیلتر های محلی همچون PCAپس از اعمال الگوریتم

ره دیگر روشی بود که بعده ها برای بازشناسی چهره ارائه شد. سپس طراحی های بدست آوردن بهینه تر ویژگی های بر روی چه

برای تشخیص بالدرنگ چهره پیشنهاد شد. Adaboostیادگیری

1 PCA 2 LDA

مقدمه 7

یکی از چالش هایی که هنوز بازشناسی چهره سعی در مقابله با آن را دارد، این است که بازشناسی در محیط هایی در شرایط نامعلوم

کنید در یک فضا، تصاویر در نورهای متفاوت باشند، یا چهره ها در حالت مختلفی تصویر برداری شده باشند. عالوه انجام شود. فرض

بر این سیستم بازشناسی باید توانایی آن را داشته باشد که به صورت بهینه از پایگاه داده های بسیار بزرگ نیز استفاده کند.

تقسیم بندی مفهومی بازشناسی چهره .2

. تصدیق 4و شناسایی چهره 8د در دوحالت کار کند: تصدیق چهرهنوان یک سیستم بیومتریک، سیستم بازشناسی چهره میتوانبه ع

چهره درگیر یک عمل تطبیق یک به یک است که چهره مورد سوال واقع شده را با تصویر چهره ثبت شده که شناسایی آن اثبات

اشاره E-passportشده است مقایسه میکند. از کاربرد های این حالت میتوان به تصدیق افراد در بحث مهاجرت و یا در زمینه های

کرد.

یک عمل تطبیق یک به چند در چهره هاست که تصویر چهره مورد سوال واقع شده را در مقابل چندین چهره شناسایی چهره درگیر

منتخب انجام میدهد. در برخی از کاربردهای این حالت، نیاز است که تنها یک چهره مشابه یافت شود. در یک سیستم نظارتی یا

های مشابه هستیم. در این نوع کاربردها با تعریف یک سطح آستانه نیازمند چیزی بیش از پیدا کردن چهره watchlistبررسی

اطمینان، تمامی تصاویر چهره هایی که امتیاز شباهتشان باالتر از سطح آستانه قرار بگیرد گزارش میشوند.

ن نور، جهت گیریهمانطور که قبال هم اشاره شد، کارایی یک سیستم بازشناسی چهره به طور عمده ای وابسته به پارامترهایی چو

و حاالت چهره، سن شخص، مو، چیز هایی همچون عینک، کاله و غیره که بر روی صورت پوشانده میشوند و حرکت وابسته است. بر

اساس اینگونه پارامترها، میتوان کاربردهای بازشناسی چهره را به گونه ای دیگر تقسیم بندی کرد: سناریویی که کاربر با سیستم

و سناریویی که کاربر با سیستم همکاری نمیکند. همکاری میکند

و پاسپورت 2، کنترل دسترسی فیزیکی5کاربردهایی چون ورود به کامپیوتراولین حالت، که کاربر با سیستم همکاری دارد در

ه جهت صورت الکترونیکی که از کاربر خواسته میشود تا با قرار دادن چهره اش در یک مکان خاص و یک حالت خاص )مثال اینک

چگونه باشد، یا اینکه چشم ها باز باشد و صورت حالت طبیعی داشته باشد و غیره( با سیستم همکاری کند خودش را نشان میدهد.

حالت دوم که از کاربر خواسته نمیشود با سیستم همکاری داشته باشد، بیشتر در سیستم های نظارتی کاربرد دارد. در این نوع کاربرد

کاربر بخواهد از شناسایی شدن فرار کند. با در نظر گرفتن فاصله ی بین چهره و دوربین، بازشناسی چهره در فواصل ها ممکن است

کم )کمتر از یک متر( در سیستم های همکارانه مانند کنترل دسترسی مسئله ای با کمترین درجه سختی است. در حالی که

در یک سیستم نظارتی بیشترین چالش ها را از آن watchlistمانند شناسایی بازشناسی در فواصل زیاد و در حالت غیرهمکارانه

خود کرده است. در همه این حاالت، و همچنین حاالت بین این دسته بندی ها میزان نور بیشترین چالش را در سیستم های

بازشناسی چهره بوجود می آورد.

3 Face Verification 4 Face Identification 5 Login 6 Physical Access Control

مقدمه 8

ساختار گزارش .3

ناسی چهره در فصل دوم معرفی میشود. فصل سوم به معرفی زیرفضای چهره میپردازد. در ادامه این گزارش روند کار سیستم بازش

فصل چهارم به نمایش چهره در زیرفضا و فصل پنجم مربوط به مفاهیم یادگیری زیرفضای چهره میشود. در فصل ششم سیستم

چهره مورد بررسی قرار میگیرد. فصل تشخیص چهره معرفی میشود و در فصل هفتم الگوریتم ها و محیطهای شناسایی عناصر روی

هشتم نیز کاربرد هایی از سیستم بازشناسی چهره در مباحث دولتی و تجاری را مورد بررسی قرار میدهد.

چهره بازشناسی سیستم کار روند 9

فصل دوم

روند کار سیستم بازشناسی چهره

شیء سه بعدی در شرایطبازشناسی چهره یک مسئله بصری در زمینه بازشناسی آماری الگو میباشد که در آن چهره به عنوان یک

متاوت نور، جهت گیری، حالت و دیگر پارامتر ها نیازمند شناسایی شدن بر اساس تصاویر مورد نیاز است. به طور کلی یک سیستم

بازشناسی چهره شامل چهار ماژول میباشد: محلی سازی چهره، نرمال سازی، استخراج ویژگی و تطبیق که به صورت مختصر در

ح آن میپردازیم.ادامه به توضی

روند کار یک سیستم بازشناسی چهره . 1 تصویر

فضای چهره ها را از پس زمینه شان جدا میکند. در حالتی که بازشناسی چهره در یک ویدئو مورد بررسی قرار تشخیص چهره

به صورت پیوسته پیگیری شود که این کار با استفاده از frameمیگیرد، چهره ای تشخیص داده شده است باید در بین چندین

ماژول های پیگیری چهره میتواند صورت پذیرد. از آنجایی که چهره تشخیص داده شده، یک تخمین جزئی از محل و مقیاس چهره

ا، بینی، دهان مکان های خاص چهره همچون چشم ه face landmarkingارائه میدهد، نشان اختصاصی گذاشتن بر روی چهره یا

به نجام میرسد. alignmentیا ماژول landmarkingو محیط صورت را مشخص میکند. این کار با ماژول

برای نرمال کردن هندسی و نرمال کردن از نظر اندازه شدت نور صورت میپذیرد. این فاز به علت حضور روش نرمالسازی چهره

ازمند نرمالیزه کردن بردار ویژگی ها هستند، برای بازشناسی چهره الزم و ضروری های نوینی که مقاوم به جهت و نور هستند و نی

است. نرمالسازی هندسی چهره را با استفاده از برش چهره به یک فریم استاندارد نگاشت میکند. در نرمالسازی از نظر شدت نور،

ال میشود.چهره با استفاده از پارامترهایی چون شدت نور و میزان خاکستری بودن نرم

تصویر، ویدئو: ورودی•

چهره به همراه : خروجی•landmark

چهره و محلی سازی landmarks

چهره به همراه : ورودی•landmark

چهره نرمال شده: خروجی•

نرمالسازی چهرهچهره نرمال شده: ورودی•

ویژگی های چهره: خروجی•

استخراج ویژگی

ویژگی های چهره، : ورودی•پایگاه داده

شناسه چهره: خروجی•

تطبیق ویژگی ها

چهره بازشناسی سیستم کار روند 10

از چهره بر روی چهره های نرمال شده اعمال میشود تا اطالعات برجسته و نمایانی که در جداسازی چهره ها استخراج ویژگی

کارآمد هستند را استخراج کنند. اینگونه استخراج ویژگی در مقابل تغییرات هندسی و شدت نور مقاوم خواهد بود. ویژگی های

یق چهره ها مورد استفاده قرار میگیرد.استخراج شده برای فاز تطب

از ویژگی های استخراج شده به عنوان صورت ورودی در تطبیق های یک به یک یا یک به چند استفاده میکند. تطبیق چهره

خروجی تطبیق یافته برای سیستم های یک به یک به صورت بله یا خیر میباشد و در سیستم های بازشناسی یک به چند، خروجی

ونه است که یک شناسه و یک سطح اطمینان را به سیستم بازمیگرداند. چالش برانگیز ترین قسمت در این سطح پیدا کردن یک به گ

پارامتر خوب برای میزان شباهت بین تصاویر است.

چهره زیرفضای معرفی 11

فصل سوم

معرفی زیرفضای چهره

توان با موفقیت به طور بالدرنگاکنون می با وجود اینکه تکنولوژی بازشناسی چهره به طور چشمگیری پیشرفت کرده است و هم

برای تصاویر و ویدئوهای ضبط شده تحت شرایط دلخواه اجرا شود، بازشناسی چهره هنوز یک تالش سخت است خصوصا برای حاالتی

یاد باشد.ای زها عملیات بدون قیدی همانند متغیر بودن نور، جهت تصویر، انسداد و حالت چهره به طور قابل مالحظهکه در آن

توان از زیرفضای چهره یا از دیدگاه منوفولدی روشن کرد.این امر را می

های تحلیل زیرفضا برای بازشناسی چهره بر اساس این حقیقت است که یک کالس)دسته( از الگوهای مورد نظر، مانند چهره، تکنیک

تواند یک تعداد زیادی پیکسل می 4022با 24*24بیتی 2در یک زیرفضا از فضای تصویر ورودی وجود دارد. برای مثال، یک تصویر

2564096ها را نشان دهد. با این حال، بین ها و چهرهها، خانههای الگوهایی مانند درختاز کالس > حالت ممکن، تنها 109864

تواند با یچنین طرز نمایشی میابد. بنابراین، نمایش پیکسلی تصاویر افزونگی زیادی دارد و ابعاد کسر کوچکی به چهره، اختصاص می

و یا کمتر( 40تعداد کمی )معموال PCAو یا eigenfaceمحدود کردن الگوهای مورد نظر به تصاویر، به شدت کاهش یابد. روش

ی هاها به عنوان پایه eigenfaceکند. با استفاده از از مجموعه تصاویر آموزشی چهره استخراج می eigenfaceمحورهای اصلی و یا

واند تشود و یک چهره میی یک بردار ویژگی با ابعاد کم نمایش داده میزیرفضای چهره، یک تصویر چهره به صورت فشرده به وسیله

های مدلسازی زیرفضا، پیشرفت چشمگیری را در بازسازی شود. استفاده از تکنیک eigenfaceبه صورت ترکیب خطی از چند

ده است. تکنولوژی بازشناسی چهره ایجاد کر

ی اجزا ها عبارتند از حاالت مختلف نمایش چهره در حالیکه چندشاخه غیره چهره عبارتند از همهی چهرهو یا توزیع همه 7چندشاخه

جز چهره.

یابیم.اگر این چندشاخهها را در فضای تصویر مورد بررسی و آزمایش قرار دهیم، آنها را بسیار غیرخطی و غیرمحدب می

چندشاخههای دو شخص را در bو قسمت دهدچندشاخه چهره را در مقابل چندشاخه غیرچهره نمایش می aشکل زیر قسمت

دهد.چندشاخه چهره نشان می

7 Manifold

چهره زیرفضای معرفی 12

. نمایش زیر فضای چهره از غیرچهره و زیرفضای چهره های مختلف8 تصویر

شدن بین چندشاخه چهره و غیرچهره در فضای تصویر و بازشناسی چهره تواند به صورت یک عمل تمایز قائل تشخیص چهره، می

های اشخاص مختلف در چندشاخه چهره در نظر گرفته شود.تواند به عنوان عمل تمایز قائل شدن بین چهرهمی

محورهای اصلی ی سه تا از اولینوسیلهکه به PCAشکل زیر، غیرخطی بودن و غیر محدب بودن چندشاخههای چهره را در زیرفضای

دهد.گسترده شده است را نشان می

دهد. باشد. هر پالت چندشاخههای سه فرد مختلف را در سه رنگ متفاوت نشان میهای تصویر اصلی میهای رسم شده از دادهپالت

تصویر چهره از روبه رو برای هر شخص است. 24ها شامل داده

چهره زیرفضای معرفی 13

PCA. نمایش دو بعدی سه محور اول الگوریتم 8 تصویر

پارامتر به 11گروه به ترتیب( بر روی هر تصویر چهره با 4یک تبدیل )تبدیل افقی، چرخش، تغییر مقیاس اندازه و تبدیل گاما برای

ها داده شده است که تن تصویر چهره تبدیل یافته ایجاد کرده است. هر تصویر تبدیل یافته طوری برش 11تدریج متغیر اجرا شده و

آید. منحنی نشان داده شده در این شکل، چنین تایی از تصاویر برش داده شده به دست می 11شامل ناحیه چهره باشدو یک دنباله

فضای 8بر روی PCAمنحنی برای هر شخص وجود دارد. فضای سه بعدی 24دهد و بنابراین نمایش می PCAای را در فضای دنباله

ها را مشاهده کرد. توان غیرخطی بودن این تراژکتوریمختلف نگاشت شده است. میدوبعدی

چهره زیرفضای معرفی 14

نشان داده شده است خط سیر PCAتوان موارد زیر را برداشت کرد. اول اینکه از آنجایی که این مثال در فضای از شکل باال، می

انتظار است. دوم اینکه باوجود اینکه این تصاویر چهره، تری)غیرخطی و غیرمحدب( در فضای تصویر اصلی مورد )تراژکتوری( پیچیده

های قابل توجهی در خط ای )گاما( قرار گرفت، پیچیدگیهای هندسی و تغییرات نور نقطهی دو بعدی تحت تبدیلدر یک صفحه

های خارج صفحه( مورد انتظار است.بعدی)مانند چرخش 8های هندسی در فضای سیر)تراژکتوری( برای تبدیل

آن نمایش و چهره سازی مدل 15

فصل چهارم

مدل سازی چهره و نمایش آن

تصاویر مربوط به چهره ها عموما به عنوان آرایه ای از پیکسل ها با ابعاد بسیار باال معرفی میشوند که متعلق به چندشاخه هایی است

که ذاتا ابعاد کمی دارند. در ادامه در مورد فضای چهره و ابعاد آن به طور دقیق تر صحبت خواهد شد.

لیز های کامپیوتری که بر روی تصاویر چهره ها صورت میگیرد، با سیگنال های بصری )بازتاب نوری که از سطح چهره برگردانده آنا

میشود( سر و کار دارد که به وسیله سنسور های دیجیتال به عنوان آرایه هایی از مقادیر پیکسل ها ثبت میشود. پیکسل ها میتوانند

توانند فقط معرف شدت نور باشند. در این گزارش و عموما در مباحث مربوط به تصاویر حالت دوم در نظر معرف رنگها باشند و یا می

گرفته میشود. بعد از اینکه تصویر چهره به صورت قابل قبولی مراحل نرمالیزه شدن را پشت سر گذاشت و همچنین به یک اندازه

بعدی فضای چهره با نوشتن مقدار mnنقطه یا یک بردار در یک فضای رسید، آرایه پیسکل ها را میتوان معرف یک nدر mثابت

پیکسلش در یک ترتیب ثابت در نظر گرفت. مهمترین مسئله ای که در آنالیز چنین تصاویری مطرح است، ابعاد این آرایه هاست که

وجود داشته باشند. در ادامه فاکتورها و منظور از ابعاد، تعداد محورهایی است که الزم است برای مشخص کردن یک نقطه از داده ها

پارامترهایی مورد بحث قرار میگیرند که در ابعاد تصاویر چهره موثر هستند.

فضای تصویر در مقابل فصای چهره .1

2میمشخص شود. بنابراین، ابعاد اس برای مشخص کردن یک تصویر تصادفی در فضای تصویر، ابتدا نیاز است که مقدار هر پیکسل

میباشد که حتی برای تصاویر با اندازه متوسط نیز مقدار زیادی است. روش های mnاین فضا به وسیله معرفی شدن با پیکسل ها،

بازشناسی و دسته بندی که بر روی این گونه از نمایش ها کار میکنند، عمدتا از یک سری معایبی رنج میبرد که به ابعاد مربوط

یاد میشود. "رین به ابعادنف"میشود. از این معایب با

کنترل کردن داده های با ابعاد باال، مخصوصا در زمینه های بازشناسی از طریق شباهت و تطبیق، از نظر بار محاسباتی -

بسیار سنگین و پرهزینه است.

یی ه صورت نمادر روش های پارامتریک، تعداد پارامترهایی که نیازمند تخمین زده شدن میباشند معموال با افزایش ابعاد ب -

افزایش میابند. معموال این تعداد بسیار بیشتر از تعداد تصاویر در مجموعه آموزش میباشد که عمل تخمین را در فضای

تصویر مخدوش میکند.

8 Nominal

آن نمایش و چهره سازی مدل 16

به طور مشابه، در روش های غیر پارامتریک نیز پیچیدگی نمونه ها بوجود می آید. یعنی تعداد تصاویری که مورد نیاز است -

میابد.افزایش

با این وجود، سطح زیادی از صورت یک سطح صاف میباشد که یک بافت منطقی دارد. بنابراین، نمونه بردازی از همه پیکسل ها به

صورت ناخواسته ای چگال است. مقدار یک پیکسل در تصویر چهره وابستگی شدیدی با مقادیر پیکسلهای همجوار خود دارد. عالوه

ار کنترل شده و تحت شرایط خاص است. به عنوان مثال، هر نمای روبروی چهره، تقریبا متقارن است، بر این، نمایش چهره بسی

چشمها در کنار هستند، بینی در وسط تصویر قرار دارد، و غیره. سهم بسیار زیادی از نقاط در فضای چهره به صورت فیزیکی چهره

میگویند که چهره میتواند در بستری محدودتر نمایش داده شود که را معرفی نمیکنند. بنابراین شرایط و محدودیت های طبیعی

اصطالحا به این فضا و بستر محدودتر زیرفضای چهره گفته میشود. در ادامه مختصرا به طرز نمایش های گوناگونی که برای زیرفضای

چهره معرفی شده اند میپردازیم.

9چندشاخه های اصلی و توابع پایه .2

ه یک زیر فضای چهره را به وسیله چندشاخه های اصلی که در یک فضا با ابعاد باالی فضای تصویر تعبیه شده بسیار متداول است ک

است مدلسازی کنیم. ابعاد باالی باطنی و ذاتی آن، به وسیله ی درجه آزادی در زیرفضای چهره مشخص میشود. هدف آنالیز زیرفضا

به وسیله توابعی از مقادیر 10ستخراج حاالت اصلی چندشاخه است. حاالت اصلیمشخص کردن و تعیین این تعداد و درجه آزادی و ا

پیکسل ها محاسبه میشود که به آن توابع پایه چندشاخه اصلی گفته میشود.

11آنالیز محور های اصلی .3

اه از محورهای این روش به عنوان یکی از روش های قدرمتند در کاهش ابعاد معرفی میشود که بر اساس استخراج یک تعداد دلخو

از یک سری اطالعات چند بعدی کار میکند. اولین محور اصلی یک ترکیب خطی از ابعاد اصلی میباشد که بیشترین واریانس 18اصلی

-nامین محور اصلی نیز یک ترکیب خطی از ابعاد اصلی است که بیشترین واریانس را با توجه به متعامد بودن به Nرا شامل میشود.

ول دارد. جزئیات بیشتر و دقیقتر در کالس الگو شناسی آماری دکتر صفایانی و کتاب الگوشناسی آماری مرجع درس محور اصلی ا 1

آمده است.

13طیف ویژه و ابعاد .4

میباشد که ابعاد فضای جدید را معرفی میکند و بیانگر ابعاد ذاتی چندشاخه kیک مسئله بسیار مهم در مبحث کاهش بعد، پیدا کردن

(. 8011شد. تا کنون هیچ روش آماری برای این تعداد برای سیگنال های بصری طبیعی پیچیده معرفی نشده است )تا سال اصلی میبا

برای ساده سازی این مسئله میتوان فرض کرد که در فضای نویزی که سیگنال های مورد نظر تعبیه شده اند )در مثال ما نقطه ای

9 Principal Manifolds and Basis Functions 10 Principal Modes 11 Principal Component Analysis 12 Principal Components 13 Eigenspectrum and Dimensionality

آن نمایش و چهره سازی مدل 17

زیاد است. به صورت 14باال، میزان نسبت سیگنال به نویزست( در یک فضا با ابعاد بسیار که از زیرفضای چهره نمونه برداری شده ا

آماری، این بدان معنا است که واریانس داده در حالت اصلی چندشاخه نسبت به واریانس در فضای متمم آن بیشتر است. این فرض

امین مقدار ویژه برابر iبه طیف ویژه مربوط میشود که بیانگر مجموعه از مقادیر ویژه ماتریس کواریانس داده ها میباشد. میدانیم که

جستجو برای پیدا کردن مکانی است که در kامین محور اصلی میباشد. بنابراین یک الگوریتم معقول برای تعیین تعداد iیانس وار

ام به شدت کاهش میابد. یک طیف ویژه معمولی برای مسئله بازشناسی چهره و تعداد طبیعی iطول طیف ویژه افزایشی مقدار ویژه

ل زیر نمایش داده شده است.برای آن طیف در شک kبرای انتخاب

. طیف مقدار ویژه معمولی و تقسیم آن به دو زیرفضای متعامد4 تصویر

که بوسیله محدودیت های محاسباتی جهت گیری میشود، به هزینه تطبیق با استفاده از چدشاخه های اصلی kدر عمل، انتخاب

استخراج شده و تعداد تصاویر چهره وابسته است.

در ادامه به معرفی روش های کاهش بعد تصاویر چهره و نمایش آن در زیرفضاهای خطی و غیر خطی میپردازیم.

زیرفضای خطی .5

ترین حالت آنالیز چندشاخه اصلی تحت این فرض بوجود می آید که چندشاخه اصلی خطی است. بعد از اینکه فضای شاید ساده

اصلی با استفاده از تفریق میانگین عکسها از تک تک تصاویر به چهره میانگین جابجا میشود، زیرفضای چهره یک زیرفضای خطی از

فی روش هایی میپردازیم که تحت این فرض خطی بودن و حالت کلی تر آن فضای تصویر میشود. در این قسمت مختصرا به معر

یعنی چندخطی بودن کار میکنند.

15چهره ویژه و تکنیکهای مربوطه .5.1

برای آنالیز چهره و نمایش آن مطرح شده بود که تحوالت زیادی را در این زمینه PCAدر برخی پژوهش ها در گذشته استفاده از

استفاده میکرد. علت این eigenfaceمطرح کردند، از مفهوم 1220در سال Kirby and Sirovichای که بوجود آورد. در مقاله

14 Signal to Noise Ratio 15 Eigenface and Related Techniques

آن نمایش و چهره سازی مدل 18

ساخته میشد هم اندازه تصاویر چهره های ورودی بود. در شکل زیر نمونه PCAنامگذاری این بود که بردارهای پایه ای که به وسیله

باالیی نمایش داده شده است. ای از چهره میانگین و یک تعدادی از چهره های ویژه

. چهره ویژه: چهره میانگین در سمت چپ به همراه هفت چهره ویژه باالتر5 تصویر

بعدی kبرای هر تصویر میانگین گیری شده و یک نمایش PCAهر تصویر چهره بر روی زیرفضای اصلی تصویر شده است. ضرایب

از آن را ارائه میدهد. زمانی که یک تصویر آزمون بر روی زیر فضا تصویر میشود، فاصله اقلیدسی بین بردار ضرایبش و بقیه تصاویر

نیز کمینه PCAنمایش داده شده محاسبه میشود. بسته به اینکه فاصله برای کدام تصویر کمینه میشود، و همچنین خطای بازسازی

ان متعلق بودن به یکی از تصاویر آشنا به عنوان یک چهره جدید یا یک غیر چهره دسته بندی میشود.شود، تصویر به عنو

16فضای ویژه احتماالتی .5.2

در اصلی ترین نسخه چهره ویژه، کاهش ابعاد بود. شباهت بین دو تصویر چهره با استفاده از اختالف نرم های اقلیدسی PCAنقش

صورت میگرفت که بر روی زیر فضا نگاشت شده بودند. این روش بعده ها گسترش یافت که با استفاده از شباهت احتمالی به جای

Moghaddamری از چگالی احتمال کار میکند. )اطالعات بیشتر و دقیق تر در مقاله شباهت اقلیدسی بر اساس یک تخمین پارامت

and Pentland)

17تفکیک کننده خطی: فیشرفیس .5.3

زمانی که تغییرات ذاتی در نور و حالت چهره بوجود می آید، بیشترین تغییرات در داده ها بر اساس این تغییرات خواهند بود. تکنیک

PCA تخاب یک زیرفضایی را دارد که بیشترین تغییرات و دگرگونی ها را در خود نگه میدارد و بنابراین شباهت در بیشتر تاکید بر ان

زیرفضای چهره لزوما با هویتش مشخص نمیشود. توضیحات بیشتر در تکلیف آخر درس الگو شناسی آماری و درس الگوشناسی آماری

ست که از آنجایی که در عمل ماتریس پراکندگی درون کالسی یک ماتریس مطرح شده است. فقط نکته ای که قابل ذکر است این ا

قابل محاسبه گردد، سپس FLDکاهش داده تا معیار PCAابتدا ابعاد را با استفاده از تکنیک Fisherfaceتکین میباشد، الگوریتم

FLD .را برای کاهش بیشتر اعمال میکند

که از روش چندخطی Tensorface، روش 12روش های آنالیز محورهای مستقلن، الگوریتم های دیگری نیز همچون روش بیزی

SVD بهره جسته است و روش های از این قبیل برای کاهش بعد و نمایش تصاویر چهره در زیرفضای خطی معرفی شده اند. در ادامه

داخته میشود.به معرفی مختصری از الگوریتم های کاهش بعد و نمایش تصاویر چهره در فضاهای غیرخطی پر

16 Probabilistic Eigenspace 17 Linear Discriminant: Fisher 18 ICA

آن نمایش و چهره سازی مدل 19

زیرفضای غیرخطی .6

در این قسمت به بررسی یک سری از تکنیک هایی که در آن ها فرض بر خطی بودن چندشاخه اصلی نیست را مورد بررسی قرار

Fisherو PCAغیر خطی و منحنی های اصلی، استفاده از کرنل در الگوریتم های PCAمیدهیم. در این قسمت الگوریتم هایی چون

سی قرار خواهند گرفت.مورد برر

19غیرخطی PCAمنحنی های اصلی و .6.1

به این صورت است که تصویر معکوس چندشاخه در فضای اصلی یک سطح با ابعاد 80ویژگی تعریفی چندشاخه های اصلی غیرخطی

قاط داده ها و درحال کمینه کردن مجموع فواصل بین ن "از میان داده ها گذر کرده است"کمتر غیرخطی )منحنی مانند( است که

یاد میشود. نمونه ای از این را میتوان در شکل زیر "منحنی اصلی"و تصویر سازی آنها بر روی سطح است که معموال از آن به عنوان

مشاهده کرد.

. منحنی اصلی که در چندشاخه غیرخطی نشان داده شده است2 تصویر

( میباشد که از یک NLPCAغیرخطی ) PCAیکی از ساده ترین روش های محاسبه چندشاخه های اصلی غیرخطی، استفاده از

شبکه عصبی مصنوعی چندالیه کمک میگیرد که در شکل زیر نمایش داده شده است.

19 Principal Curves and Nonlinear PCA 20 Nonlinear Principal Manifold

آن نمایش و چهره سازی مدل 20

( برای محاسبه چندشاخه اصلی غیرخطیAutoassociative. یک شبکه عصبی چندالیه خودشرکت پذیر )7 تصویر

که یک تابع f(x)یک چندشاخه با ابعاد پایین تر را شکل میدهد که این کار را با استفاده از تابع bottleneckدر شکل باال الیه

نگاشت کننده غیر خطی است و به عنوان یک مجموع وزن دار سیگموئیدی پیاده سازی شده است انجام میدهد. محورهای اصلی که

معرفی شده اند، یک نگاشت معکوس با یک تابع بازسازی غیرخطی مشابه به yبه عنوان نتیجه از آنها یاد میشود و در شکل باال با

به بازتولید ورودی ها با دقت هرچه بیشتر میپردازند. دارند که g(y)نام

Fiو PCAاستفاده از کرنل در الگوریتم .6.2 sher 21

بر اساس اعمال کردن یک نگاشت KPCAبوسیله مقدارویژه کرنل زنده شده است. روش پایه 88یرا آنالیز محورهای اصلی غیرخطیاخ

خطی در فضای ویژگی حاصله حل میکند که فضای ویژگی PCAی یک غیرخطی بر روی ورودی صورت میگیرد. سپس مسئله را برا

جدید دارای ابعادی بیشتر از فضای ویژگی اصلی میباشد و احتمال آن هم هست که فضای ویژگی جدید ابعادی به سمت بینهایت

ز تابع شت مجبور است با استفاده اداشته باشد. از آنجایی که در ابعاد فضا در این نوع نگاشت به شدت افزایش می یابد، این گونه نگا

آمده است و در این گزارش از پرداختن به آن صرف KPCAکرنل تئوری مرسر را ارضا کند. جزئیات این روش در کتب مختلف با نام

نظر میکنیم.

KPCAالگوریتم بر شبکه عصبی و منحنی های اصلی پرداخت. این برتری این است که KPCAدر اینجا میتوان به برتری الگوریتم

شود و همچنین به دانش پیشین ساختار overfittingیه یک بهینه سازی غیرخطی نیاز ندارد، تحت شرایطی قرار نمیگیرد که دچار

شبکه یا تعداد ابعاد جدید نیاز ندارد.

21 Kernel PCA and Kernel Fisher methods 22 Nonlinear Principal Component Analysis

چهره زیرفضای یادگیری 21

فصل پنجم

یادگیری زیرفضای چهره

( و PCAعمل بازشناسی چهره است. از آنالیز محورهای اصلی )چند دهه اخیر گواه بر یک موفقیت بزرگ در یادگیری زیرفضا در

الگوریتم آنالیز تفکیک کننده خطی فیشر، یک تعداد بسیار زیادی الگوریتم کاهش ابعاد برای انتخاب موثر ترین زیرفضا برای نمایش

با استفاده از هزاران پیکسل که در و تفکیک چهره ها پیاده سازی شده است. ثابت شده است که چهره انسان همانگونه که میتواند

ه دآرایه هایی با ابعاد باال انکد شده اند نماش داده شوند، به طور ذاتی میتوانند زیرفضاهای با ابعاد بسیار کم نمایش داده شوند. استفا

در دسته بندی کمک بسیار زیادی کرده است. "نفرین بر ابعاد!!!"از زیر فضا برای نمایش چهره به کاهش

برای انتخاب زیرفضایی با PCAمیباشد که از الگوریتم Eigenfaceولین روش زیرفضا برای بازشناسی چهره روش چهره ویژه یا ا

بیشترین قدرت نمایش چهره برای نمایش مجموعه از تصاویر چهره بهره می جوید. این روش فضاهای ویژه اصلی را که با یک مجموعه

واریانسی که در فضای نگاشت شده برای یک PCAند را استخراج میکند. به صورت ریاضی وار، از چهره های آموزشی همکاری میک

ابعاد خاص داده شده است را بیشینه کرده، وابستگی تصاویر چهره های آموزشی را در فضای نگاشت شده حذف کرده

(uncorrelatedرا با ( و همچنین اطالعات مشترک بین ظاهر تصاویر )تصاویر چهره های آمو )زشی( و هویت فرد )برچسب جاری

فرض اینکه چهره ها به صورت گوسی توزیع شده اند بیشینه میکند. بنابراین، این روش با موفقیت بسیار باالیی برای بازشناسی چهره

ه بند ها دست مورد استفاده قرار گرفته است. با نگاشت تصاویر چهره بر روی زیرفضایی که با الگوریتم چهره ویژه مشخص میشود،

میتوانند برای بازشناسی در این زیر فضا مورد استفاده قرار بگیرند. یکی از مهمترین و اصلی ترین محدودیت های الگوریتم چهره

ویژه این است که برچسب تصاویر چهره نمیتوانند در روند یادگیری ماتریس نگاشت برای کاهش ابعاد نمایان شوند. از این سو الگوریتم

برای نمایش زیر فضا در مسئله بازشناسی چهره مطرح شد تا این مشکل را برطرف سازد. بر خالف الگوریتم چهره ویژه، دیگری

class specificبه دنبال زیرفضاهای خطی است که متناسب با کالس هر داده است. اصطالحا به دنبال Fisherfaceالگوریتم

linear subspace بعدی که در ها میگردد. الگوریتم کاهشFisherface استفاده شده است الگوریتم آنالیز تفیک کننده خطی

بین کالسی را بیشینه میکند و هم پراکندگی درون کالسی داده چهره 88میباشد که به صورت همزمان هم پرداکندی FLDAفیشر یا

پایین ترین میگردد که جداپذیری کالس های در فضای ویژگی به دنبال یک زیر فضای با ابعاد FLDAرا کمینه میکند. الگوریتم

مختلف بعد از نگاشت شدن به زیر فضا با همان قدرت قبلی باقی بماند. اگر کالس ها از یک توزیع گوسی نمونه برداری شده باشند،

ینه میکند. را بین کالس های مختلف بیش KLمیزان میانگین همگرایی FLDAو همه همراه با کواریانس ماتریس یکسانی باشند،

کارایی خوبی در زمینه بازشناسی چهره از خود نشان داده است، ولی محدودیت هایی را هم دارد که در FLDAبا اینکه الگوریتم

اطالعات تفکیک کننده ای را که در ماتریس کواریانس کالس های مختلف است را FLDAادامه به آن اشاره خواهد شد. الگوریتم

گوریتم هر کالس را با یک توزیع گوسی مدل میکند، بنابراین این روش نمیتواند یک نگاشت مناسب زمانی که دور میریزد. این ال

23 Scatter

چهره زیرفضای یادگیری 22

( هستند برای دسته بندی بعدی mixture modelنمونه ها از چندین توزیع مختلف یا از توزیع ها پیچیده )مانند مدل ترکیبی یا

معموال تحت شرایط حالت یا جهت و تحت نورهای مختلفی گرفته میشود و سطح پیدا کند. در مبحث بازشناسی چهره، تصاویر چهره

( mixture of Gaussiansکیفیت های متفاوتی دارند. بنابراین بهتر است که فرض کنیم تصاویر چهره ها از ترکیبی از گوسی ها )

مشکل FLDAد فضای ویژگی باشد، الگوریتم هستند. مشکل دیگر آن این است که زمانی که اندازه مجموعه آموزشی کوچکتر از ابعا

undersampled .را دچار میشود

برای حل مشکالتی که در باال به آن اشاره شد، تعدادی روش و الگوریتم در سالهای اخیر مطرح و معرفی شدند. مخصوصا مشکل

undersampled فی شده شامل شرایط بهینه سازی بودن این الگوریتم بیش از همه مورد توجه قرار گرفت. الگوریتم های معر

برای آنالیز تفکیک کننده های جنرال شده میشود، فریمورک انتخاب زیرفضای یکپارچه و یک الگوریتم دو مرحله ای با استفاده از

QR Decomposition میباشند. مسئله مهم دیگری که وجود دارد این است که الگوریتمFLDA با مشکل جداسازی کالس ها

وزن های یکسانی را بر روی هر جفت کالس قرار میدهد در حالی که زوج کالس FLDAیشود. این به این خاطر است که مواجه م

هایی که به هم نزدیک تر هستند باید بیشتر مورد توجه قرار بگیرند، زیرا احتمال خطای بیشتری متوجه آنها خواهد شد. روش های

با معرفی یک تابع وزن FS-FLDAیا fractional-step FLDA. مثال الگوریتم زیادی برای حل این مشکل پیشنهاد شده است

Approximate pairwise accuracyبا نام FLDAدهی برای حل این مشکل پیاده سازی شد. یک روش دیگر وزن دهی برای

criterion ویژه به دست بیاید.مطرح شد. برتری این الگوریتم این است که ماتریس نگاشت از طریق تجزیه مقادیر

یادگیری چندشاخه یک تکنیک جدید برای کاهش ابعاد در بازشناسی چهره میباشد که توجهات زیادی در سالهای اخیر به خود

جلب کرده است. دلیل این امر این است که تصاویر چهره روی یک چندشاخه با ابعاد پایین قرار میگیرند. الگوریتم های زیادی برای

، نگاشت ویژه الپالس ISOMAP(، الگوریتم LLEساختار ذاتی چندشاخه یک مجموعه چهره مانند تعبیه خطی محلی )تقریب زدن

(LE نگاشت ویژه ،)Hessian (HLLE( نگاشت توپوگرافیک تولیدی ،)GTM( و هم ترازی فضای محلی نانژانت ،)LTSA) معرفی و

outرا به عهده خوانندگان محترم قرار میدهم. همه این الگوریتم ها مشکل پیاده سازی شده اند. توضیح الگوریتم های معرفی شده

of sample را دارند و بنابراین یک سری خطی سازی ها برای حل مشکلشان مطرح شده است. )مانند الگورریتم هایlocality

preserving projections وdiscriminative locality alignmentست که الگوریتم های یادگیری ( در مجموع ثابت شده ا

در بهره برداری از اطالعات هندسی محلی موثر تر FLDAو الگوریتم PCAچندشاخه در مبحث کاهش بعد از الگوریتم هایی چون

و بهتر عمل میکند.

طی از که با استفاده از محورهای متعامدی که هر کدام یک ترکیب خ FLDAو PCAبر خالف الگوریتم های کاهش بعدی چون

ویژگی های فضای اصلی است و همچنین نگاشت بر روی این محور ها صورت میگیرد به فضای کمتری دست پیدا میکنند، الگوریتم

از لحاظ sparseمحورهایی که با فقط تعداد کمی از ویژگی های فضای باال را انتخاب میکند. زیرفضای sparseکاهش بعد

sparseفهم تر و ملموس تر نیز هست. یکی از معروف ترین الگوریتم کاهش ابعاد بردار ویژگی روانشناسی و فیزیولوژیکی نیز قابل

بر روی محورهای فضای با sparsityرا با اضافه کردن شرایط PCAمعرفی شده است که الگوریتم استاندارد Sparse PCAبا نام

نیز اخیرا به عنوان یکی دیگر از الگوریتم های کاهش Manifold elastic net (MEN)ابعاد پایین تر تعمیم میدهد. الگوریتم

را از طریق اضافه کردن پارامتر پنالتی شبکه کشسانی sparseمعرفی شده است. این الگوریتم یک ماتریس نگاشت sparseابعاد

( فرموله میکند که میتواند lassoیک یادگیری چندشاخه تفکیکی به دست می آورد و مسئله را به عنوان السو ) lossبر روی میزان

داده ها را مختصر و sparsityفواید و برتریهای بسیاری دارد، زیرا اوال خاصیت sparseبه راحتی حل شود. در مجموع، یادگیری

چهره زیرفضای یادگیری 23

کوتاه و ساده تر میکند، بنابراین میزان محاسبات در فضای با بعد کم جدید و همینطور دسته بندی و بازشناسی در آن بسیار ساده و

میتواند وزن های متغیرهای حالت اصلی را کنترل کردهد و میزان واریانسی که از sparsityکارآمد تر خواهد شد. ثانیا خاصیت

ا با کمترین افزایش در باالس کاهش میدهد. بنابراین مدل یادگیری میتواند به صورت بهتری تعمیم ممکن ر overfittingطریق

یک فهم و ترجمه بهتری نسبت sparsityبیابد و دقت بازشناسی باالتری را برای چهره های دست کاری شده به دست آورد. و نهایتا

هدف مدل و متغیرها را نشان میدهد. این امر برای درک و فهم بازشناسی به مدل را تولید میکند و بنابراین یک رابطه واضحی بین

چهره بسیار مهم تلقی میشود.

یکی از فرضیات اساسی که در بازشناسی چهره مطرح است که در بحث کاهش ابعاد نیز شامل میشود، این است که نمونه های

independent and identically distributed (i.i.d)صطالحا آموزش و آزمون مستقل و عینا و بطور یکسان توزیع شده اند. ا

هستند. با این حالت خیلی محتمل است که این فرض در واقع نادیده گرفته شود. برای مثال، تصاویر چهره های آزمایشی و آزمون

ود و یا حتی امکان دارد تحت شرایط حالت های مختلف، جهت ها و پوستژر های مختلف و حتی در شرایط نوری نابرابر گرفته ش

( در اینجا Transfer Learningعکسی که به عنوان تست گرفته شود در مجموعه آموزشی وجود نداشته باشد. یادگیری تبادلی )

به عنوان یک شمای یادگیری جدید برای مقابله با اینگونه مشکالت پدیدار میشود. با استفاده مناسب از اطالعات و دانشی که از

رهای دامنه کمکی )داده های آموزشی( به دست آمده است، این امکان وجود دارد که کارایی کارهای دامنه هدف )داده های طریق کا

برای یادگیری زیرفضا نیز مطرح شده است. نشان داده شده است که با 84آزمون( را ترقی دهیم. ایده تبادل داده های بینا دامنه ای

دلی، کارایی بازشناسی بر روی مواردی که تصاویر چهره در داده های آموزشی و آزمایشی به صورت استفاده از یادگیری زیرقضای تبا

i.i.d نیستند، میتواند به صورت قابل توجهی در مقایسه با الگوریتم های یادگیری زیرفضایی چونPCA وFLDA افزایش و بهبود

یابد.

24 Cross Domain Knowledge

چهره تشخیص 24

فصل ششم

تشخیص چهره

مقدمه ای بر تشخیص چهره .1

اولین مرحله در سیستم خودکار بازشناسی چهره میباشد. قابلیت اعتماد این قسمت تاثیر عمده بر عملکرد و قابلیت 85چهره تشخیص

استفاده کل سیستم بازشناسی چهره دارد. اگر یک عکس یا یک ویدئو به سیستم داده شود، یک تشخیص دهنده چهره ایده آل باید

ن توجه به جایگاهشان، اندازه و مقیاسشان، زاویه و جهتشان، سن و حالتشان پیدا کرده و مشخص بتواند تا محل تمامی چهره ها را بدو

کند. عالوه بر این، عمل تشخیص باید صرف نظر از شرایط نوری خارجی و محتوای تصویری یا ویدئویی بودن صورت گیرد.

برای چهره در تصاویر و ویدئوهای رنگی(، حرکت )برای تشخیص چهره میتواند با استفاده از چنین نشانه انجام شود: رنگ پوست )

چهره در ویدئو(، شکل سر و صورت، سیمای چهره و یا ترکیبی از این پارامترها. موفق ترین الگوریتم تشخیص چهره مربوط به روشی

تصویر ورودی به وسیلهبهره میگیرد. عملیات یک چنین سیستمی به صورت زیر انجام میشود: یک 82میشود که تنها از ظاهر چهره

یک زیرصفحه در تمامی مکان های مختلف و مقیاسهای مختلف اسکن میشود. تشخیص چهره به عنوان دسته بندی کردن الگو در

این زیرصفحه به عنوان چهره یا غیر چهره عمل میکند. دسته بندی چهره/غیرچهره از طریق داده های آموزشی چهره و غیر چهره و

روش های یادگیری آماری عمل یادگیری را انجام میدهد.با استفاده از

و روش های مبتنی بر یادگیری مورد بحث قرار میگیرند. در پژوهش های appearance-beasedدر این فصل مختصرا روشهای

خواهد شد، زیرا تاکنون این نوع الگوریتم ها موفق ترین روش ها در adaBoostاخیر تاکید زیادی بر الگوریتم های مبتنی بر روش

بحث سرعت و دقت تشخیص بوده اند. ولی در این گزارش از پرداختن به آن صرف نظر کرده و مطالعه این مورد را به عهده خواننده

میگذاریم.

27روشهای مبتنی بر یادگیری و روشهای مبتنی بر ظاهر .2

ی مبتنی بر ظاهر چهره، تشخیص چهره به عنوان یک مسئله دسته بندی هر زیرصفحه اسکن شده به یکی از با استفاده از روش ها

دو کالس چهره و غیرچهره مطرح میشود. روش های مبتنی بر ظاهر با فرض ظواهر مختلف چهره در شرایط مختلف از سختی

/غیرچهره میتواند از طریق یک مجموعه آموزشی که شامل مدلسازی ساختار سه بعدی چهره ها دوری میکنند. یک دسته بند چهره

25 Face Detection 26 Appearance Based 27 Appearance And Learning Based Methods

چهره تشخیص 25

مثال هایی از چهره که تحت شرایط مختلفی گرفته شده است و مثال هایی از غیرچهره آموزش داده شود. شکل زیر به صورت تصادفی

ده زیرصحفه چهره و ده زیرصحفه غیرچهره نمایش داده شده است.

ده تصویر باالیی از چهره و ده تصویر پایینی از غیرچهره. 2 تصویر

ساخت و ایجاد اینگونه دسته بند ها به دلیل اینکه پیکسل های یک چهره به شدت به یکدیگر وابسته ایند و در غیرچهره چنین

، نور و حالت های مختلف حالتی وجود ندارد عملی و ممکن است. با این حال، وجود تغییرات و دگرگونی های زیادی در ظاهر چهره

چهره چندشاخه چهره یا مرزهای چهره/غیرچهره را به شدت پیچیده ساخته است. تغییراتی که در جهت سر نیز وجود دارد بیش از

پیش به پیچیدگی سیستم می افزاید. یک دسته بند غیرخطی برای رویارویی با این پیچیدگی نیاز است. سرعت نیز یک مسئله بسیار

ی کارایی بالدرنگ است.مهم برا

تا کنون پژوهش های زیادی در زمینه ایجاد چنین ساختار های پیچیده ای صورت گرفته است و پیشرفت های زیادی 1220از سال

نیز حاصل شده است. روش های زیادی برای تشخیص چهره پیشنهاد شده است. مثال یک سیستم تشخیص چهره بر اساس آنالیز

در PCAدر زیرفضای likelihoodیا بر اساس نمایش چهره ویژه پیشنهاد شده است. از آنجایی که فقط (PCAمحورهای اصلی )

را در زیرفضای متمم متعامد در نظر گرفته اند. با استفاده likelihoodنسخه پایه آن در نظر گرفته شده است، دیگر پژوهش هایی

مدل میشود که likelihoodدو زیرفضا( با استفاده از ضرب دو تخمین در فضای تصویر )اجتماع likelihoodاز چنین سیستمی،

دقیق تری را ارائه میکند. در روش دیگری، ابتدا فضای تصویر به چندین خوشه چهره و likelihoodبرای تشخیص چهره تحمین

مین بیزین برای به دست و زیرفضای خالی تجزیه میشود. سپس تخ PCAغیرچهره تقسیم میشود و سپس هر خوشه به زیرفضای

آوردن ویژگی های آماری مفید بر روی آن اعمال میشود. روش دیگری از شبکه های عصبی متصل استفاده کرده است. با استفاده از

یک پنجره لغزنده، تصویر ورودی بعد از گذر از یک مرحله پیش پردازش مورد بررسی قرار میگیرد. به عنوان یک راه حل دیگر، میتوان

ک ماشین بردار پشتیبان غیرخطی را آموزش داد تا الگوهای چهره از غیرچهره را از هم تفکیک و دسته بندی کند. یا میتوان از ی

را برای تشخیص چهره مورد استفاده قرار داد. در این سیستم ها یک الگوریتم خودراه 82از پنجره ها sparseساختار یادگیری شبکه

ت تکراری برای جمع کردن تصاویر با مفهوم از غیرچهره ها که هیچ گونه چهره ای در آنها وجود ندارد ( به وصورbootstrapانداز )

مورد نیاز است.

( بوده است که Cascade Detectorپیشرفت های اخیر در زمینه تشخیص چهره بیشتر به دلیل حضور شناساگر های آبشاری )

بخش اصلی است: یک مجموعه ره ارائه کرده اند. این سیستم دارای سه سیستمی دقیق، مقاوم و دقیقی را ابرای تشخیص چه

برای ساخت یک adaBoostاز ویژگی های محلی که میتوانند به سرعت مورد ارزیابی قرار بگیرند. یک روش مبتنی بر 82فراکامل

28 Sparse Network of Windows 29 Over-complete

چهره تشخیص 26

گ االیی در تشخیص باالدرندسته بند غیرخطی قدرتمند از ویژگی های محلی ضعیف و یک ساختار شناساگر آبشاری که سرعت ب

دارد.

( هستند، نشان Haar wavelet-likeیک مجموعه فراکامل از ویژگی های مستطیل، که اسکالرهای ساده ویژگی های موجک هار )

داده شده است که در تفکیک و تشخیص چهره از غیر چهره موثر هستند. یک ویژگی هار برای ساخت یک دسته بند غیرخطی

برای حل سه مشکلی که در ادامه به آن ها اشاره میشود مورد استفاده قرار adaBoostیف عمل میکند. الگوریتم قدرتمند کمی ضع

میگیرد: انتخاب موثرترین ویژگی ها از یک مجموعه ویژگی بزرگ. ساخت دسته بند های ضعیف، که هرکدام بر اساس یکی از ویژگی

ندهای ضعیف برای ساخت یک دسته بند قوی. عالوه بر اینها، یک مدل آبشاری از های انتخاب شده کار میکنند. ترقی دادن دسته ب

سبب شده است که میزان محاسبات نیز کاراتر شود. 80دسته بندها به صورت ساده به پیچیده

اره آموزش اشپیشرفت های زیادی برای شناساگر آبشاری معرفی شده است. از جمله این پیشرفت ها میتوان به کاهش زمان آزمون و

کرد و همچنین افزایش دقت تشخیص نیز در این میان مطرح شده است. شناساگر آبشاری اصلی که ابتدا معرفی شد دارای زمان

آموزشی در حدود چندین هفته است. ویژگی های محلی بیشتر باعث افزایش دقت میشود ولی در عین حال زمان و حافظه بیشتری

ش هایی برای کاهش این زمان زیاد تا کنون پشنهاد شده است که بر روی کاهش زمان آموزش را به خود اختصاص میدهد. رو

یادگیرنده های ضعیف تمرکز داشته اند. روش های جایگزینی نیز وجود دارند که از توزیع های گوسی یک بعدی برای مدل سازی

زمان آموزش را نسبت به روش اصلی ذخیره میکنند.چهره و غیرچهره برای یک تک ویژگی استفاده میکنند که بیش از نیمی از

روش های زیادی برای بهبود روش شناسایی آبشاری از نظر زمان، حافظه و دقت تا کنون معرفی شده است که این الگوریتم را که بر

ت کرده است. کار میکند را تبدیل به بهترین و کارامد ترین الگوریتم هم در زمان و هم در دق boostingاساس یادگیری

30 Simple-to-Complex Cascade Classifiers

چهره اجزای گذازی نشان 27

فصل هفتم

نشان گذازی اجزای چهره

مقدمه .1

هدف از تشخیص چهره یافتن چهره در تصویر و گزارش جایگاه آنها به وسیله یک چهارگوش میباشد. پژوهش های اخیر نشان داده

ین وجود، تشخیص میباشد. با ا state of the artاست که تشخیص چهره هم در سرعت و هم در دقت اکنون دیگر یک تکنولوژی

چهره برای نشان گذاری های چهره مانند چشم، دهان، بینی و ابرو وغیره کافی نیست. بنابراین اینها وظایف محلی سازی نشان گذاری

اجزای چهره میباشد که همانگونه که در شکل زیر نشان داده شده است هدف آن پیدا کردن دقیق جایگاه اجزای چهره میباشد.

. محلی سازی اجزای چهره2 تصویر

این یک کار اساسی و الزم در مباحث مرتبط با چهره است. در اولین پژوهش های مربوط به استخراج اجزای چهره، این اجزا را بدون

هان و وسط آن، استفاده زا مدل جهانی اسختراج میکردند. نشان گذازی های چهره همچون گوشه چشم و وسط آنها، گوشه های د

گوشه های بینی، چانه و غیره با استفاده از دانش هندسی مشخص میشوند. اولین مرحله شامل استقرار مکانهای جستجوی مستطیلی

شکل برای دهان و یک مکان جستجوی مستطیلی برای چشم ها میشود. حاشیه ها با اعمال الگوریتم های گوشه یابی استخراج

لگوریتم ها بسیار سریع عمل میکنند ولی در شرایطی که چهره دارای جهت و شکل و حالت خاصی باشد، میشوند. با اینکه این ا

ممکن است به درستی عمل نکنند.

روش های دیگری نیز برای استخراج اجزای چهره وجود دارد که چهره انسان را به صورت معنایی با استفاده از اجزای چهره چون

و مدل ASMیا 81های موفق در زمینه مدل شکل فعال ر صورت معرفی و نمایش میکند. با پژوهشچشم و بینی و مدل مو و دو

، شکل چهره به صورت خیلی خوبی به عنوان یک ترکیب خطی از حالت های اصلی )بزرگترین بردارهای ویژه( AAMیا 88ظاهر فعال

مدل میشود که از اشکال چهره آموزشی آموزش دیده شده است. با آموزش توزیع های آماری اشکال و بافت ها از روی پایگاه داده

31 Active Shape Model 32 Active Appearance Model

چهره اجزای گذازی نشان 28

شیء هایی با شکل مشابه با آنچه در مجموعه آموزشی آمده است ساخته میشود. مرز 88آموزشی، یک مدل شکلی دگردیس پذیر

و ASMمیتواند با فیت کردن این مدل دگردیس پذیر بر تصویر استخراج شود. بسته به این که چه کاری قرار است انجام شود،

AAM میتوانند با دو روش مختلف پیاده سازی شوند. در اولین روش، ممکن است بخواهیم یک سیستمASM یاAAM خاص

ممکن است برای برنامه های 84برای شخص خاصی در جهت، نور و حاالت مختلفی طراحی کنیم. یک چنین مدل شخص خاصی

کاربردی که کاربر با آن در تعامل مستقیم است مانند تخمین جهت سر و تخمین جهت نگاه مفید باشد. از سوی دیگر ممکن است

برای همه چهره ها، حتی چهره هایی که در فاز آموزش دیده نشده اند کار کند. تجربه نشان طراحی کنیم تا AAMیا ASMسیستم

داده است که عملکرد سیستم هایی که برای شخص خاص طراحی شده اند نسبت به مدلی که برای همه چهره ها طراحی شده اند

تشخیص اجزای صورت میپردازیم. بهتر عمل کرده اند. در ادامه این فصل به معرفی مختصر فریمورک یک سیستم

35فریمورک تشخیص اجزای چهره .2

همانطور که در شکل زیر نمایش داده شده است فریمورک محلی سازی و تشخیص اجزای چهره شامل آموزش و روند مکان یابی

میباشد.

. فریمورک تشخیص عناصر روی چهره10 تصویر

رویه آموزش یک مدل دگردیس پذیر از چهره را با استفاده از مدلسازی شکل و مدلسازی ظاهر محلی ایجاد میکند. این رویه به تعداد

زیادی داده که به صورت دستی برچسب خورده اند نیاز دارد. رویه مکان یابی ابتدا شامل تشخیص چهره، محلی سازی چشم ها و

82قسمت تشخیص چشم یا محلی سازی چشمر اساس مدل دگردیس پذیر چهره میشود. در سپس شامل تشخیص اجزای چهره ب

33 Reformable 34 Person-specific 35 Framework for Landmark Localization 36 Eye Localization

چهره اجزای گذازی نشان 29

یک سیستم مقاوم و دقیق محلی سازی و تشخیص چشم معرفی میشود و سپس این روش برای مشخص کردن محل دقیق چشم ها

شخیص چشم میپردازیم.سازگار میشود. سیستم محلی سازی چشم به صورت بالدرنگ عمل میکند. در ادامه به معرفی بخش ت

محلی سازی چشم .3

با توجه به این حقیقت که برنامه های کاربردی مرتبط با چهره نیاز به نرمال کردن چهره و پیدا کردن محل های مختلفی از اجزای

چهره همچون چشم را دارند، محلی سازی چشم ها یک مرحله بسیار مهم در سیستم خودکار بازشناسی چهره و سیستم تشخیص

اجزای چهره به حساب می آید. مانند هر مسئله دیگری در زمینه بازشناسی اشیاء تحت پس زمینه های پیچیده مانند تشخیص

چهره، تشخیص خودرو، الگوهای چشم نیز بوسیله پارامترهایی چون اندازه، جهت، زاویه و بسته یا باز بودن چشمها، شرایط نوری،

ها تفاوتهای زیادی در ظاهرشان دارند. پیدا کردن دقیق، مقاوم محل وسط چشم ها کاری بسیار بازتاب نور از عینک و دیگر پارامتر

سخت است. تا کنون الگوریتم های زیادی برای شناسایی و پیگیری چشم ها معرفی شده است ولی بیشتر آنها تنها تحت شرایط

و مقاوم برای محاسبه دقیق مکان چشم در سطح چهره خاص و با پارامترهای خاصی کار میکنند. در این گزارش یک سیستم نوین

معرفی میشود. آزمایشات نشان داده است که این سیستم تشخیص چشم تحت شرایط مختلف و با داده های تست مختلف به خوبی

و با دقت باالیی کار میکند.

. سیستم تشخیص چشم11 تصویر

نمودار بلوکی سیستم پیشنهادی در شکل باال نمایش داده شده است. زمانی که یک منطقه ناصاف از چهره در سیستم وارد میشود

تابع نگاشت میانه و تابع نگاشت واریانس برای محاسبه خط وسط بین چشم چپ و راست وارد عمل میشوند. سپس در این دو سطح،

نقاطی که کاندیدای چشم هستند به صورت جداگانه وارد عمل میشود. همه کاندیداهای شناساگر ظاهری چشم برای پیدا کردن

چشم با توجه به احتمالشان زیرنمونه برداری میشوند. بقیه کاندیداهای چشم های چپ و راست به صورت جفت جفت در می آیند.

چهره اجزای گذازی نشان 30

میشوند. محتمل ترین جفت چشم به عنوان همه جفت چشم های ممکن با استفاده از یک شناساگر ظاهری جفت چشم دسته بندی

چشم چپ و راست معرفی میشوند.

37خط میانه چشم ها .3.1

برای یک چهره مستقیم عمودی، خط میانه عمودی بین چشم چپ و راست نزدیگ بینی میباشد. با توجه به مشاهدات انجام شده

رد واضح تر از پل بینی است و مکانهایی که چشم که نشان داده است که شدت سطح خاکستری مکانهایی که چشم در آنجا وجود دا

در آنجا حضور دارند معموال تیره تر از بینی است، تابع نگاشت واریانس و میانه عمودی مورد استفاده قرار میگیرد.

38تشخیص چشم های کاندیدا .3.2

ا روش آبشاری تلفیق شده استاندارد که ب adaBoostبرای تشخیص چشم ها از طریق روش مبتنی بر ظاهر از یک روش آموزش

است استفاده شده است. ساختار آبشاری این قابلیت را به شناساگر میدهد که برای اکثر سطوح چهره مانند چشم ها با تعداد کمی

تست قانون هایی وضع کند و همچنین اجازه میدهد که منابع محاسباتی بر روی قسمت های چالش بر انگیزتر چهره تمرکز کنند.

سهیم هستند، بردارهای پایه هار هستند که به عنوان پایه ای ترین ویژگی ها adaBoostایی که در پروسه یادگیری ویژگی ه

ویژگی در مجموع وجود دارد. در این مجموعه در کل 40000تقریبا 18در 84انتخاب میشوند. برای یک نمونه چشم به اندازه

در شکل زیر آمده است. نمونه چشم وجود دارد که تعدادی از آنها 2200

. نمایشی از نمونه های چشم و جفت چشم18 تصویر

همه نمومه چشم ها از تصاویر چهره ها برش داده شده اند که نقطه میانی چشم، نقطه وسط نمونه است. همه نمونه ها به وسیله

پیکسل مورد پردازش قرار گرفته اند. در این مرحله، از 18در 84نرمالیزه کردن سطح خاکستری و نرمالیزه کردن اندازه به ابعاد

رد جایگاه چشم خود داری شده است. در اینجا فقط سعی شده است که بیشترین مقدار پس زمینه تصمیم گیری نابهنگام در مو

حذف شود و مکانهایی که کاندیدای چشم هستند به همراه احتماالتشان ارائه شوند. بیشترین سطح چهره ای که ممکن است با چشم

د. اشتباه گرفته شود، ابرو ها، فریم های ضخیم عینک ها و غیره هستن

37 Midline of Eyes 38 Eye Candidate Detection

چهره اجزای گذازی نشان 31

39زیرنمونه برداری از کاندیدای چشم .3.3

از آنجایی که ویژگی های ظاهری محلی چشم همانند صورت خیلی جداگانه و مشخص نیست، برخی از چیز هایی مانند ابروها که

جای چشم تشخیص داده میشوند پیدا میشنود و چشم ها با اندازه ها و مقیاس های مختلف در نزدیکی جایگاه واقعیشان تشخیص

40داده میشنود. اگر همه کاندیداها در مرحله بعدی در نظر گرفته شوند، زمان اجرا و پردازش بسیار طوالنی خواهد شد )مثال اگر

جفت چشم مورد بررسی قرار گیرند(. برای تلفیق کردن 1200چشم راست داشته باشیم، در مرحله بعدی باید 40چشم چپ و

ه به احتماالتی که وجود دارد، زیر نمونه برداری از کاندیداها به صورت افقی و عمودی و با کاندیداهای در یک همسایگی، با توج

یا 0.88با توجه به عرض چهره انتخاب میشود. بعد از مرحله زیرنمونه برداری، تعداد جفت چشم ها به Nصورت میپذیرد. Nفاکتور

کمتر از حالت قبلی کاهش می یابد.

40دسته بندی جفت چشم ها .3.4

برای مستثنی کردن اجزای چهره بدلی )یعنی اجزایی که به اشتباه جای جزء اصلی تشخیص داده میشنود( و کاندیداهای غیر دقیق

از کاندیداهای دقیق و درست، یک دسته بند جفت چشم شبیه شناساگر چشم که در باال توضیح داده شد ساخته شده است. هر

چشمان چپ و راست با یک فاصله کم در پایین و باالی چشمان میشود. نمونه جفت چشم شامل مستطیل مرز بر دور

نمونه های جفت جشم منفی )یعنی چیزهایی که جفت چشم نیستند( بوسیله الگوریتم های خودراه انداز انتخاب میشوند. همه نمونه

، تمام حاالت جفت کردن ممکن را که نرمال میشوند در مرحله آزمون، برای هر جفت کاندیدا در لیست 15در 85ها برای اندازه

اطالعات پیشین بر روی فواصل آنها صدق میکند امتحان میشود. سپس عمل نرمالیزه کردن برای اینکه جایگاه چشم چپ و راست با

توجه به مراکزشان در داده های آموزشی درست شود انجام میگیرد. احتمال جفت کردن درست کردن یک جفت چشم واقعی تخمین

ه میشود. میانگین سه تا از محتمل ترین جفت چشم ها به عنوان مکان دقیق وسط چشم در چهره انتخاب میشود.زد

39 Eye Candidate Subsampling 40 Eye-Pair Classification

چهره بازشناسی کاربردهای 32

فصل هشتم

کاربردهای بازشناسی چهره

مقدمه .1

سال اخیر توجهات زیادی را به خود جلب کرده است، کاربرد فراوان آن در سیستم 80یکی از دالیلی که بازشناسی چهره در این

لیست کوچکی از کاربرد های سیستم بازشناسی چهره مطرح شد و مزایا و 1225ولتی و کاربردهای تجاری آن است. در سال های د

معایب آن مورد بررسی قرار گرفت. کاربردهای عمده بازشناسی چهره را میتوان در ده گروه قرار داد که در جدول زیر مشخص شده

مشخص شده است شامل کاربرد هایی "دیگر"نیز لیست شده است. آخرین گروه که با نام اند. برای هر گروه، چند کاربرد نمونه

میشود که در مورد آنها بحثی نخواهد شد.

مثال کاربردی گروهگواهینمامه رانندگی، برنامه های استحقاقی، مهاجرت، شناسه ملی، (Face IDشناسایی چهره )

تشکلیات رفاه اجتماعیگذرنامه، ثبت نام رای دهنده، ثبت نام

، ATMدسترسی خودرو، کیوسک های هوشمند و سیستم های (Access Controlکنترل دسترسی )

دسترسی به برنامه های رایانه ای، درسترسی به برنامه های آنالین،

دسترسی به امتحانات آنالین

ادیوم، استهشدار تروریست، سیستم امنیتی پرواز، اسکن تماشاچیان (Securityامنیت )

امنیت کامپیوتر، امنیت پایگاه داده ها، رمزگذاری فایل ها، پایانه های

تجارت امن

نظارت ویدئویی پیشرفته، مراقبت منطقه، نظارت برنامه های هسته (Surveillanceسیستم های نظارتی )

ای، نظارت پارک، نظارت ورودی

شده، سندیت کاربرانامنیت ارزش ذخیره (Smart Cardsکارت های هوشمند )

هشدار مظنونین و جلوگیری از جرم و جنایت، پیگیری مظنونین، (Law Enforcementانجام قانون )

بررسی پیشینه مظنون، تشخیص تقلب در کازینوها، بازشناسی و

استخراج چهره مجرم

گذاری خودکار نشانه گذاری چهره ها و بازیابی تصاویر، برچسب (Face Databaseپایگاه داده چهره )

تصاویر، دسته بندی چهره ها

جستجو مبتنی بر چهره، جداسازی ویدئو مبتنی بر چهره، تشخیص (Multimedia Managementمدیریت چندرسانه ای )

رخداد

بازیهای تعاملی، محاسباتی تعاملی (Human Computer Interactionتعامل انسان و رایانه )

غیره دیگر

چهره بازشناسی کاربردهای 33

41شناسایی چهره .2

سیستم بازشناسی چهره مردم را از روی چهره شان شناسایی میکند. برخالف سیستم ها سنتی شناسایی، سیستم بازشناسی چهره

یک فرد قابل قبول را از چهره اش انتخاب میکند، و نه از روی بررسی یک شماره شناسایی معتبر یا یک کلید یا از روی شناسه و رمز

از چنین امکانات بیومتریکی برای چک کردن هویت و شناسایی فرد به شرح زیر است. این روش عدم عبور. مزایای امنیتی استفاده

کاربردی بودن گم شدن یا دزدیده شدن کارت های شناسایی را برطرف کرده است. احتمال خطای وارد کردن رمزهای عددی را

قی به صورت خودکار است، ناظر یا اوپراتور میتواند از کاهش داده است. در موقعیت هایی که کنترل دسترسی به ساختمان یا اتا

مزایای این روش استفاده کند. سیستم های بازشناسی چهره امروزه استفاده های فراوانی را به خود اختصاص داده است.

42کنترل دسترسی .3

بسیار ی که قرار است شناسایی شونددر بسیاری از سیستم های کنترل دسترسی، مانند دسترسی آفیس یا ورود به رایانه، تعداد افراد

اندک و محدود است. تصاویر چهره ها نیز تحت شرایط خاصی گرفته میشود. سیستم های مبتنی بر بازشناسی چهره در اینگونه

ن دکاربردها میتوانند بدون همکاری زیادی از طرف کاربرد دقت باالیی در عملکرد خود داشته باشند. برای مثال، نیازی به لمس کر

شیء با انگشت یا کف دست یا حظور چشم روبروی یک شناساگر برای شناسایی فرد نیست. زمانی که این روش با دیگر روش ها

تعیین هویت مانند تعیین اثر انگشت یا تشخیص چشم تلفیق میشود، سیستم بازشناسی چهره میتواند دقت باالتری را کسب کند.

ادی را به خود جلب کرده است.این گونه کاربردها امروزه توجهات زی

41 Face Identification 42 Access Control

چهره بازشناسی کاربردهای 34

. مثالی از کاربرد بازشناسی چهره در سیستم کنترل دسترسی18 تصویر

امنیت .4

امروزه بیش از هر زمان دیگری، امنیت یکی از مهمترین نگرانی ها در فرودگاه ها و برای خطوط هواپیمایی و کارمندان و مسافران

امنیت فرودگاه امروزه از سیستم و تکنولوژی بازشناسی چهره استفاده میکند. شکل زیر یک سیستم امنیتی ساده است. سیستم

فرودگاه را نشان میدهد که از سیستم شناسایی چهره کارمندان استفاده کرده است.

چهره بازشناسی کاربردهای 35

بازشناسی چهره. نمونه از یک سیستم امنیتی با استفاده از سیستم 14 تصویر

حتی این امکان نیز وجود دارد که نور کنترل شده و جهت مناسب را به سیستم امنیتی اضافه کرد. در مجموع کارایی بیشتر این

سیستم های بازشناسی هنوز با رد کردن هویت های زیادی مواجه نشده است. رضایتمندی کاربران در این نوع کاربردها نیز بعضا

.بسیار پایین است

43سیستم های نظارتی .5

همانند سیستم های امنیتی در مکان های عمومی، سیستم های نظارتی نیز از سیستم های بازشناسی چهره استفاده میکنند که

مجددا سطح رضایت کاربران پایین است )اگر پایین تر از سطح راضایت کاربران در سیستم های امنیتی نباشد!(. شرایط خارج از

چهره ها و دیگر فاکتور هایی از این قبیل سبب شده است که استفاده از سیستم های بازشناسی چهره در بحث کنترل نور، جهت

نظارت چالش برانگیزتر شود.

43 Surveillance

چهره بازشناسی کاربردهای 36

44کارتهای هوشمند .6

کارت هوشمند یک ریزپردازنده تعبیه شده یا یک حافظه در درون خود دارد که قدرت محاسبه و پرداش را برای انجام بسیاری از

ها فراهم میکند. کارت های حافظه در ساده ترین حالت تنها اطالعات را ذخیره میکنند. یک کارت ریزپردازنده از سوی دیگر کار

میتواند اطالعات را بر روی حافظه خودش ذخیره، حذف و یا تغییر دهد. همچنین یک کارت ریزپردازنده در درون خود یک سیستم

ت های هوشمند بدون تماس شامل آنتن کوچک هستند که سبب میشوند کارت خوان آنها را از با ویژگی های امنیتی نیز دارد. کار

یک فاصله مشخص شناسایی کند و بخواند. قابلیت قابل حمل بودن و قابل به روز رسانی شدن، کارت های هوشمند را در سراسر

جهان بسیار پر استفاده کرده است.

رتهای هوشمند، به صورت خالصه یک ترکیب دوتایی است. کارت های هوشمند میتوانند کاربرد تکنولوژی بازشناسی چهره در کا

ویژگی های ریاضی چهره ها را در طول مرحله ثبت نام ذخیره کنند. ویژگی های ذخیره شده در طول مرحله شناسایی و تعیین

د. اگر این مشخصات با مشخصات عکس تصویر هویت برای مقایسه با چهره تصویر برداری شده از عکس از روی کارت خوانده میشون

برداری شده مطابقت داشت، فرد میتواند ویژگی های جدید چهره اش را که از تصویر گرفته شده تولید شده است بر روی کارتش به

روز رسانی کند.

45قانون اجرای .7

به سرعت پیدا کنند. تکنولوژی بازشناسی چهرهبه وسیله یک برنامه بازیابی و بازشناسی چهره، کارآگاهان میتوانند یک مظنون را

یک قدرت مضاعف را به آژانس های اعمال قانون داده است تا بتوانند به سرعت و با استفاده از اطالعات ناکاملی که از یک مظنون یا

اسب از با کیفیت من مجرم دارند، مشخصات کامل آن و هویتش را بازیابی کنند. با در نظر گرفتن سختی به دست آوردن یک تصویر

چهره مجرمان، کارایی سیستم مورد نظر کمی پایین خواهد بود. با این وجود، بازشناسی خودکار چهره نقش بسیار مهمی را در کمک

به سازمان های پلیسی ایفا میکند.

یت سیستم های چندرسانه و از دیگر کابردهای بازشناسی چهره استفاده آن در سیستم های پایگاه داده چهره ها، سیستم های مدیر

تعامل انسان و کامپیوتر است که از توضیحات و پرداختن به آن در این گزارش صرف نظر کرده ایم.

44 Smart Cards 45 Law Enforcement

بندی جمع 37

جمع بندی

در این گزارش که چهار بخش تشکیل شده است، ابتدا مقدمه ای بر مفاهیم و تعاریف مربوط به بازشناسی چهره از دیدگاه الگوشناسی

است. سپس مبانی بازشناسی چهره با استفاده از زیرفضای چهره و تعاریف آن، یادگیری زیرفضای چهره و مسائل آماری ارائه شده

مربوط به آن آمده است. در ادامه آن، تکنیک هایی مربوط به پیاده سازی عملی سیستم بازشناسی چهره و با تاکید بر تشخیص چهره

د. نهایتا در بخش چهارم نیز کاربردهای مهمی از سیستم بازشناسی چهره در از غیر چهره و تشخیص عناصر روی چهره معرفی ش

کاربردها دولتی و تجازی با توضیحات مختصری در این گزارش گنجانده شده است. در این گزارش سعی شده است عالوه بر معرفی

-state-ofزمینه، بهترین روش ) روش های خوب در هر قسمت، توضیحات مختصری در مورد آن ها و سیر پیشرفت روشها در هر

the-art.در هر قسمت معرفی و نقاط ضعف و قدرت آن بررسی شود )

در فصل اول، پس از اینکه معرفی کلی از سیستم بازشناسی چهره شد، دو نوع دسته بندی برای اینگونه سیستم ها مطرح شد. دسته

دسته تصدیق چهره و شناسایی چهره تقسیم کرد. در دسته بندی دوم، بندی اول، سیستم بازشناسی چهره را از نظر بیومتریک به دو

سیستم بازشناسی چهره از نظر همکاری کابر با سیستم به دو دسته سیستم با سناریو همکارانه و سیستم با سناریو غیرهمکارانه

تقسیم کرد.

شناسی چهره را در چهار فاز جداگانه معرفی در فصل دوم که روند کار بازشناسی چهره به صورت ماژولی بررسی شد، سیستم باز

کریدم. در فاز اول به شناسایی زیرفضای چهره از زیرفضای غیر چهره پرداخته میشود. در فاز دوم این سیستم، نرمالسازی های سطح

از ل میشود تا در فخاکستری و اندازه و غیره صورت میگیرد. در فاز سوم بر روی تصاویر نرمال شده الگوریتم استخراج ویژگی اعما

چهارم با استفاده از این ویژگی ها عمل مقایسه و تطابق برای بدست آوردن چهره خروجی به درستی انجام پذیرد.

فصل سوم این گزارش به معرفی زیرفضای چهره، مفاهیم آن و پایه های بدست آوردن زیر فضای چهره از زیرفضای غیر چهره پرداخته

( زیرفضای چهره را استخراج کردیم.PCAفاده از الگوریتم آنالیز محورهای اصلی )است. در این فصل با است

در فصل چهارم مفصال در مورد نمایش چهره در زیرفضا و در مورد کاهش بعد و روشهای آن صحبت شد. در این فصل روشهای

ضای غیرخطی معرفی و شرح داده شد.متعددی برای کاهش بعد و نمایش چهره در فضای خطی و نمایش چهره و کاهش ابعاد در ف

فصل پنجم این گزارش یادگیری زیرفضای چهره و روش های آن را معرفی شد. در این قسمت از ابتدایی ترین روش تا به روز ترین

مطرح هروش یادگیری زیرفضا مورد بررسی قرار گرفتند و هر مزایا و معایب هر کدام به تفصیل بیان شد. با این روند که هر روشی ک

شد برای حل مشکالت روش قبلی بوده است، به به روزترین و کارآمدترین روش در انتهای فصل رسیدیم.

در فصل ششم مباحث مربوط به پیاده سازی عملی و بررسی عملکرد سیستم تشخیص چهره که یکی از ارکان اصلی سیستم بازشناسی

وشهای مبتنی بر یادگیری و روشهای مبتنی بر ظاهر معرفی و بررسی شدند چهره است مورد بررسی قرار گرفت. در این فصل ابتدا ر

برای یادگیری بهره میگرفت به adaBoostو در نهایت با معرفی سیستم بهبود یافته یادگیری آبشاری که از روش های مبتنی بر

عنوان سیستم قوی، مقاوم و دقیق در این زمینه بحث خود را به پایان رساند.

بندی جمع 38

به بررسی سیستمی میپردازد که در آن اجزا و عناصر چهره مانند چشم، بینی، دهان و غیره جدا و شناسایی میشود. در فصل هفتم

این فصل با معرفی یک فریمورک برای محلی سازی و شناسایی عناصر چهره و تمرکز بر شناسایی چهره و محل دقیق آن بر روی

د را به پایان میبرد.صورت به گونه ای دقیق، مقاوم و سریع کار خو

در نهایت فصل هشتم به معرفی کاربردهای گوناگون سیستم بازشناسی چهره در موارد دولتی و تجازی پرداخت که در آن به طور

خالصه به توضیح مهمترین کاربردها پرداخته شد.

مراجع 39

مراجع

Stan Z. Li, Jain: Handbook of Face Recognition, Second Edition (2011)

Ahonen, T., Hadid, A., Pietikainen, M.: Face recognition with local binary patterns. In: Proceedings of the European

Conference on Computer Vision, pp. 469–481. Prague, Czech Republic (2004)

Bartlett, M.S., Lades, H.M., Sejnowski, T.J.: Independent component representations for face recognition. In:

Proceedings of the SPIE, Conference on Human Vision and Electronic Imaging III, vol. 3299, pp. 528–539 (1998)

Belhumeur, P.N., Hespanha, J.P., Kriegman, D.J.: Eigenfaces vs. Fisherfaces: Recognition using class specific linear

projection. IEEE Trans. Pattern Anal. Mach. Intell. 19(7), 711–720 (1997)

Bernardin, K., v. d. Camp, F., Stiefelhagen, R.: Automatic person detection and tracking using fuzzy controlled

active cameras. In: Proc. IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp. 1–8

(2007)

Bichsel, M., Pentland, A.P.: Human face recognition and the face image set’s topology. CVGIP, Image Underst. 59,

254–261 (1994)

Brunelli, R., Poggio, T.: Face recognition: Features versus templates. IEEE Trans. Pattern Anal. Mach. Intell. 15(10),

1042–1052 (1993)

Cao, Z., Yin, Q., Tang, X., Sun, J.: Face recognition with learning-based descriptor. In: Proceedings of IEEE Computer

Society Conference on Computer Vision and Pattern Recognition (2010)

Chellappa, R., Wilson, C., Sirohey, S.: Human and machine recognition of faces: A survey. Proc. IEEE 83, 705–740

(1995)

Cox, I.J., Ghosn, J., Yianilos, P.: Feature-based face recognition using mixture-distance. In: Proceedings of IEEE

Computer Society Conference on Computer Vision and Pattern Recognition, pp. 209–216 (1996)

Dalal, N., Triggs, B.: Histograms of oriented gradients for human detection. In: Proceedings of IEEE Computer

Society Conference on Computer Vision and Pattern Recognition, pp. 886– 893 (2005)

Moghaddam, B.: Principal manifolds and Bayesian subspaces for visual recognition. IEEE Trans. Pattern Anal. Mach.

Intell. 24(6), 780–788 (2002)

Moghaddam, B., Pentland, A.: Probabilistic visual learning for object detection. In: Proceedings of IEEE

International Conference on Computer Vision, pp. 786–793, Cambridge, MA, June 1995

Moghaddam, B., Pentland, A.: Probabilistic visual learning for object representation. IEEE Trans. Pattern Anal.

Mach. Intell. 19(7), 696–710 (1997)

Moghaddam, B., Jebara, T., Pentland, A.: Efficient MAP/ML similarity matching for face recognition. In: Proceedings

of International Conference on Pattern Recognition, pp. 876– 881, Brisbane, Australia, August 1998

Moghaddam, B., Jebara, T., Pentland, A.: Bayesian face recognition. Pattern Recognit. 33(11), 1771–1782 (2000)

Murase, H., Nayar, S.K.: Visual learning and recognition of 3D objects from appearance. Int. J. Comput. Vis. 14(1),

5–24 (1995)

Penev, P., Sirovich, L.: The global dimensionality of face space. In: Proc. of IEEE International Conf. on Face and

Gesture Recognition, pp. 264–270. Grenoble, France (2000)

Pentland, A., Moghaddam, B., Starner, T.: View-based and modular eigenspaces for face recognition. In:

Proceedings of IEEE Computer Vision and Pattern Recognition, pp. 84–91, Seattle, WA, June 1994. IEEE Computer

Society Press, Los Alamitos (1994)

Belhumeur, P.N., Hespanha, J.P., Kriegman, D.J.: Eigenfaces vs. Fisherfaces: Recognition using class specific linear

projection. IEEE Trans. Pattern Anal. Mach. Intell. 19(7), 711–720 (1997)

مراجع 40

Belkin, M., Niyogi, P.: Laplacian eigenmaps for dimensionality reduction and data representation. Neural Comput.

15(6), 1373–1396 (2003)

Bian, W., Tao, D.: Harmonic mean for subspace selection. In: 19th International Conference on Pattern

Recognition, pp. 1–4 (2008)

Bian, W., Tao, D.: Manifold regularization for sir with rate root-n convergence (2010)

Bian,W., Tao, D.:Max-min distance analysis by using sequential sdp relaxation for dimension reduction. IEEE Trans.

Pattern Anal. Mach. Intell. 99(PrePrints) (2010)

Bishop, C.M., Svensén, M., Williams, C.K.I.: GTM: The generative topographic mapping. Technical Report

NCRG/96/015, Neural Computing Research Group, Dept of Computer Science & AppliedMathematics, Aston

University, Birmingham B4 7ET, United Kingdom, April 1997

Ahonen, T., Hadid, A., Pietikäinen, M.: Face recognition with local binary patterns. In: Proc. of the ECCV (2004)

Ahonen, T., Hadid, A., Pietikäinen, M.: Face description with local binary patterns: Application to face recognition.

IEEE Transactions on PAMI 28(12) (2006)

Ahonen, T., Pietikäinen, M.: Pixelwise local binary pattern models of faces using kernel density estimation. In: Proc.

of the International Conference on Biometrics (2009)

Ahonen, T., Pietikäinen, M., Hadid, A., Mäenpää, T.: Face recognition based on the appearance of local regions. In:

Proc. of the ICPR (2004)

Ahonen, T., Rahtu, E., Ojansivu, V., Heikkilä, J.: Recognition of blurred faces using local phase quantization. In: Proc.

of the ICPR (2008)

Arca, S., Campadelli, P., Lanzarotti, R.: A face recognition system based on automatically termined fiducial points.

Pattern Recognit. 39, 432–443 (2006)

Pentland, A.P., Moghaddam, B., Starner, T.: View-based and modular eigenspaces for face recognition. In:

Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp. 84–91 (1994)

Alvira, M., Rifkin, R.: An empirical comparison of SNoW and svms for face detection. Technical Report AI Memo

2001-004 & CBCL Memo 193, MIT (2001)

Amit, Y., Geman, D., Wilder, K.: Joint induction of shape features and tree classifiers. IEEE Trans. Pattern Anal.

Mach. Intell. 19, 1300–1305 (1997)

Baskan, S., Atalay, V.: Projection based method for segmentation of human face and its evaluation. Pattern

Recognit. Lett. 23, 1623–1629 (2002)

Brunet, N., Perez, F., de la Torre, F.: Learning good features for active shape models. In: Proceedings of the IEEE

International Conference on Computer VisionWorkshops, pp. 206–211. IEEE Computer Society Press, Los Alamitos

(2009)

Cootes, T.F., Taylor, C.J.: Active shape model search using local grey-level models: A quantitative evaluation. In: 4th

British Machine Vision Conference, pp. 639–648. BMVA Press, Guildford (1993)