reconocimiento de cara basado en “ espectrocara ”
DESCRIPTION
Reconocimiento de cara basado en “ espectrocara ”. Procesamiento de Imágenes Digitales Grupo 18 : Macarena Carmen Ramos Rivera Juan Manuel Nieto Moreno Álvaro Sánchez Del Águila Jiménez. Contenido. Introducción Planteamiento del problema Pipeline de transformaciones - PowerPoint PPT PresentationTRANSCRIPT
1
Reconocimiento de cara basado en “espectrocara”
Procesamiento de Imágenes DigitalesGrupo 18: • Macarena Carmen Ramos Rivera• Juan Manuel Nieto Moreno• Álvaro Sánchez Del Águila Jiménez
2
Contenido1. Introducción2. Planteamiento del problema3. Pipeline de transformaciones4. Almacenamiento y
comparación5. Experimentación6. Conclusiones
3
Contenido1. Introducción2. Planteamiento del problema3. Pipeline de transformaciones4. Almacenamiento y
comparación5. Experimentación6. Conclusiones
4
Introducción
¿Quién es?
5
Un sistema de reconocimiento facial es una
aplicación dirigida por ordenador que identifica a una persona en una imagen digital.
Consiste analizar las características faciales del sujeto extraídas de la imagen y compararlas con una base de datos.
Reconocimiento Facial
6
La representación de espectrocara es
invariante a la traslación, escala y rotación en el plano.
¿Puede reconocer la cara con 3 tipos diferentes de rotación?
Espectrocara
7
Contenido1. Introducción2. Planteamiento del problema3. Pipeline de transformaciones4. Almacenamiento y comparación5. Experimentación6. Conclusiones
8
Planteamiento del Problema
TransformaciónEntrada Espectrocara
ComparaciónCarlos
Fase de reconocimiento
9
Planteamiento del Problema
Entrada
Fase de entrenamiento
…Transformación
… Almacenamiento
10
Contenido1. Introducción2. Planteamiento del problema3. Pipeline de
transformaciones4. Almacenamiento y comparación5. Experimentación6. Conclusiones
11
Pipeline de Transformaciones1. Preprocesamiento2. Extensión3. Transformada Wavelet4. Transformada Fourier5. Coordenadas Polares6. Transformada Fourier λ = ln
ρ
12
Preprocesamiento1. Conversión Escala Grises
Traducción del valor de los pixeles en el rango de grises.
2. Ecualización de histogramaMaximiza el contraste de la imagen sin perder información
3. Normalización de la intensidadEvita los cambios bruscos de iluminación y mejora el contraste de la imagen
13
ExtensiónTransformará la imagen convirtiéndola en una
cuadrada y con resolución potencia de 2 mayor que 32. Esto se realiza como requisito de las siguientes transformaciones.
14
Transformada Wavelet
Descompone la imagen en cuatro bandas de frecuencias pero usamos la banda LL, porque es la mejor aproximación a la imagen original.
15
Transformada WaveletSe calcula el número de iteraciones necesarias
para obtener la imagen de banda LL con una resolución 32x32. Siendo: n = log( w / 32) / log 2
16
Transformada de FourierBásicamente se obtiene el espectro de
frecuencias de una función. Cada porción de la transformada corresponde a una frecuencia espacial diferente sobre el objeto.
17
Coordenadas Polares El sistema de coordenadas polares es un sistema de
coordenadas bidimensional donde cada punto del plano se determina por un ángulo θ y una distancia r. Después de realizar esta transformación tendremos una imagen de 22,627 x 360.
18
Transformada Fourier λ = ln ρ Esta transformada trata de conseguir la invariabilidad de
todas las propiedades de Fourier. Se realiza un mapeado sobre la representación polar del paso anterior de forma que la componente x se transforme en λ = ln ρ.
19
Contenido1. Introducción2. Planteamiento del problema3. Pipeline de transformaciones4. Almacenamiento y
comparación
5. Experimentación6. Conclusiones
20
AlmacenamientoSe han usado dos métodos:
Representación vectorial o de clase
Representación unitaria
Basada en el trabajo
Experimental
21
AlmacenamientoTanto para una como para otra obtenemos:
Mapa <String, String>
Nombre imagen/vector
Nombre de la persona
Aleatorio
22
ComparaciónSe han usado tres métodos:
Distancia euclídea clásica
Ventana de 10
Ventana de 20
Basada en el trabajo
Experimentales
23
Contenido1. Introducción2. Planteamiento del problema3. Pipeline de transformaciones4. Almacenamiento y comparación5. Experimentación6. Conclusiones
24
ExperimentaciónSe han realizado diferentes test de JUnit con
las siguientes variaciones y premisas:
Comparando métodos de almacenamiento.
Enfrentando métodos de comparación
Siempre la imagen de la persona comparada no estaba entrenada
Diferentes conjuntos de entrenamiento: 10, 15, 20 0 25 personas con 9 imágenes entrenadas cada uno.
25
ExperimentaciónAlmacenamiento vectorial Tiempo medio: 2,5 seg por
persona
26
ExperimentaciónAlmacenamiento masivo Tiempo medio: 19 seg por
persona
27
ExperimentaciónConclusiones sobre la experimentación:
No se llega a los valores esperados : En torno al 90%.Aceptable para pocos individuos.Se estabiliza el acierto a partir de un número.La mejora de los métodos experimentales no es
significativa debido a su elevado coste computacional y de memoria.
28
Contenido1. Introducción2. Planteamiento del problema3. Pipeline de transformaciones4. Almacenamiento y comparación5. Experimentación6. Conclusiones
29
ConclusionesProblemas encontrados:
Amplitud del campo de trabajo. Descripción breve o nula de algunos métodos del
procesadoExplicación detallada de la demostración del método
de invariabilidad frente a nula explicación sobre su aplicación.
Ausencia de mención sobre el propagación de dimensiones entre procesados.
Interpretación más libre de algunos métodos para su implementación.
Transformada invariante.Transformade Polar.
30
ConclusionesNo se ha conseguido un porcentaje de acierto como
el esperado, posiblemente debido a las complicaciones de la implementación.
Se ha podido realizar la completitud del método y la aplicación, así como una experimentación que ha ayudado a conocer el comportamiento real de nuestro programa.
Se ha conseguido una aplicación dónde se puede ver un tratamiento real de imágenes.
31
ConclusionesPosibles ampliaciones:
Cambiar el método de invariabilidad por otro de los descartados en el artículo como el Fourier-Mellin, para así poder mejorar el reconocimiento.
Mejoras en la interfaz como ajuste de ventana para la transformada polar o cambios en el menú principal.
Usar nuevas estrategias de clasificación y comparación.
32
Bibliografía