Построение гендерного классификатора

Результаты экспериментов и пути дальнейшего улучшения алгоритма

Лев Шмаглит

Ярославский государственный университет им. П.Г. Демидова150000, г. Ярославль, ул. Советская, 14

Физический факультетКафедра динамики электронных систем

План доклада:

1. Задача понимания изображений. Вводные замечания.

2. Построение гендерного классификатора. Результаты экспериментов.

3. Обзор современных подходов, позволяющих увеличить вероятность распознавания.

Понимание изображений

Небо

Дорога

Знак

МашинаМашина

Машина

Здание

[Ivan Laptev. Human Action Recognition // MCVS 2011]

Понимание изображений

[Andrew Zisserman. Visual Search and Recognition // MCVS 2011]

Набор классов

Детектирование

Автобус

Машина

РаспознаваниеКлассификация

Детектирование• Сканирование

пирамиды масштабированных изображений окном

«не лицо»

«лицо»• Принятие решения

для каждого окна - классификация

Классификация

Входной фрагмент

XКлассификатор

),,,,( 21 mXf

Скалярное число

Сравнение с порогом

Решение

Обучающий набор

iXОПТИМИЗАЦИЯ

;,,,, 21 miXE

Вектор данных

Машинное обучение

Понимание изображений(компьютерное зрение)

Детектирование + Распознавание

Классификация(машинное обучение)

Оптимизация

Сколько пикселей относится к «людям»?

Постановка задачи

Исходное изображение

Изображение с выделенными лицами

Распознавание пола

мжж

Применение:• системы видеонаблюдения• Digital Signage

Пример работы алгоритма

Схема работы алгоритма

Выделение лиц Алгоритм на базе обучающей процедуры

Sparse Network of Winnows

Входное изображение

Решение

Масштабирование выделенных фрагментов

Линейный классификатор:Линейный дискриминантный анализ (LDA);

Метод опорных векторов (SVM)

Преобразование с помощью ядерной функции

Выравнивание гистограммы яркости

Алгоритм на базе SNoW

Вычисление SMQT признаков

001010010

Представление в виде вектора

Пересчет в виде

индекса

nonfacex xMhxMh

Классификатор

ifacex xMhЕсли ))(( ))(())(( xMhxMh i

facexi

))(())(( xMhxMh ifacexi

facex xMhЕсли ))((

Процедура обновления весов

Классификаторы KDDA и SVMЛинейные классификаторы с использованием ядра

для внесения нелинейности:

ядерная функция Гаусса

KDDA SVM

ASAASA

A maxarg

iiii bXXkyXf

),(sgn)(

2121 exp),(

Методика обучения и тестирования

Выделение лиц (98,2%)Nilsson M., Nordberg J., Claesson I. Face Detection Using Local SMQT Features and Split Up

SNoW Classifier // Proceedings of IEEE Int. Conf. ICASSP, V. 2, P. 589-592, 2007

База изображений (2770 шт.)

Анализ работы алгоритмов

Удаление ложно выделенных фрагментовФормирование обучающей и тестовой баз выделенных фрагментов

Классификатор KDDA(81,5%)

Оптимизация параметров ядра с использованием кросвалидации и поиска по сетке

Классификатор SVM(89%)

ПредобработкаМасштабирование до разрешения 40 × 40 пикселей

Обучающая база (300 шт.)

Тестовая база (100 шт.)

База обучающих изображений

• 2770 изображений• фронтальные лица• равномерное освещение • однородный фон

Мужчины Женщины Дети

Результаты экспериментов

Классификатор

Подходы связанные с модификацией схемы алгоритма

Решение

1. Уточнение области лица после его выделения

Выделенная область квадратная, она наложена на лицо не точно, как по положению, так и по масштабу

Реализация: а) оценка положения глаз б) выделение овальной маской, захватывающей определенный процент лицевых пикселей, классифицированных до этого по цвету; в) фильтрация краевых эффектов.

Потенциальный выигрыш: 3 - 5 %

Решение

2. Использование информации из областей рядом с лицом

Лица могут быть очень похожи, в то время как другие части тела и одежда могут сильно отличаться

Реализация: эмпирическое задание рамки, захватывающей нужные области, исходя из размера и положения детектированного лица

Потенциальный выигрыш: 5 - 10%

Решение

3. Переход в пространство признаков

Переход в пространство признаков позволяет достичь:

а) инвариантности к масштабу, освещенности, положению и т.п.;

б) выделения особенностей, характерных тому или иному классу.

Реализация: дескрипторы SIFT, PHOW, HOG, реализованные в библиотеках VL-Feet и OpenCV

SIFT дескрипторы

Вектор SIFT размерностью 128 Визуальное слово

Построение гистограммы визуальных слов

HOG дескрипторы

• Разбиение изображения на блоки• Вычисление гистограммы

градиентов

Решение

4. Использование всех трех цветовых компонент

Три – лучше, чем одна

Реализация: а) переход в пространство HSV б) вычисление признаков независимо для каждой из компонент

Решение

5. Усложнение ядра

Никогда заранее не известно, какое ядро будет лучше работать при конкретной задаче (полиномиальное, RBF, хи-квадрат и т.д.)

Кроме того, произведение (сложение) нескольких ядер, существенно увеличивает силу классификатора.

Реализация: SVM библиотеки: libSVM, SVMlight и т.д.

Подходы связанные с модификацией схемы обучения

1. Увеличение обучающей базы

Обучающих изображений всегда не хватает

Реализация: а) поиск новых изображений б) размножение изображений путем применения ротации, аффинного преобразования, изменения яркости / контраста

Потенциальный выигрыш: 100%

2. Усложнение алгоритма оптимизации параметров ядра

Оптимизация ядра необходима, чтобы избежать переобучения и достигнуть наилучшей обобщающей способности

Реализация: а) кроссвалидация б) алгоритмы оптимизации (GA)

3. Применение древовидной (каскадной) структуры

Объединение решений нескольких классификаторов всегда дает преимущество в итоговой вероятности распознавания

Следующий слой классификатора можно обучать на ошибках предыдущего

Реализация: а) каскадная структура б) дерево (решающий лес)

Построение гендерного классификатора

Результаты экспериментов и пути дальнейшего улучшения алгоритма

Лев Шмаглит

Ярославский государственный университет им. П.Г. Демидова150000, г. Ярославль, ул. Советская, 14

Физический факультетКафедра динамики электронных систем

Построение гендерного классификатора

Documents

Построение структуры мечты

Построение системы...

Построение множественных...

Построение smm стратегии

построение хранилищ

Презентация проекта...

построение виртуальных стендов

Построение репутации компании

Построение сечений ...

Построение коммьюнити

В поисках гендерного воспитания

Построение сечений

Построение долгосрочной...

Построение онлайн скоринга

построение персонального имиджа

Построение сечений...

Построение сечений...

элептический синус построение

Построение сечения

Построение сечений тетраэдра