una aproximación a la visión la visión, david marr laboratorio de inteligencia artificial mit,...
TRANSCRIPT
![Page 1: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/1.jpg)
Una aproximación a la visión
La Visión, David Marr
Laboratorio de Inteligencia Artificial
MIT, años 70
![Page 2: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/2.jpg)
Neurofisiología
• Entender el conexionado, los sensores, los mecanismos.
• Encontrar la imagen neural y la imagen física.
• Existe la “Neurona Abuela”?
• Donde se producen los niveles de integración?
![Page 3: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/3.jpg)
Psicofísica
• Estudios comportamentales.
• Experimentos que intentas aislar los diferentes aspectos. Por ejemplo los estereogramas de Julezs.
• Permite encontrar reglas o leyes de cómo funciona la visión en términos más generales?
![Page 4: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/4.jpg)
Aproximación computacional.
• Hacer programas (algoritmos) que resuelven problemas visuales sencillos o simplificados.
• Por ejemplo: detección de bordes en un conjunto de estructuras poligonales de color mate (Horn). Con la esperanza de poder generalizar después.
![Page 5: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/5.jpg)
Marr y Poggio (‘77)
• Aproximación como un problema de análisis de información.
• Independencia de la realización particular de una solución concreta en el cerebro o en una máquina.
• Es una aproximación arriba-abajo con niveles diversos engarzados.
![Page 6: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/6.jpg)
Representación y Descripción.
• Representación: Sistema formal para hacer explícitas ciertas entidades o tipos de información y una descripción de cómo el sistema lo hace.
• Descripción: Resultado de emplear una representación para describir una entidad.– Ej: números arábigos o romanos. Son mejores o
peores para hacer ciertas cosas (*, +)...
![Page 7: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/7.jpg)
Proceso
• Significados restringido a los asociados a máquinas de procesamiento de información.
• Hay que escoger la representación adecuada para las entidades a manipular por ese proceso (entrada y salida)
• Un algoritmo para implementar el proceso.– Serie, paralelo, más robusto, más eficiente...
![Page 8: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/8.jpg)
Tres niveles
• La explicación de la visión debe ser coherente a diferentes niveles: desde la neurona a la representación global.
• Teoría del cálculo: Procesamiento de la información
• Algoritmo y representación: psicofísica
• Realización física: neuroanatomía y neurofisiología
![Page 9: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/9.jpg)
Teoría de cálculo
• Cual es el objetivo?
• Porqué es apropiado?
• Cuál es la lógica de la estrategia mediante la que se la puede llevar a cabo?
![Page 10: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/10.jpg)
Representación y algoritmo
• Cómo puede implementarse esta teoría de cálculo?
• Cuál es la representación de la entrada y la salida?
• Cuál es el algoritmo para la transformación?
![Page 11: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/11.jpg)
Implementación física
• Cómo puede realizarse físicamente esta representación y algoritmo?
• Solución biológica
• Solución informática
• Figura 6.1
![Page 12: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/12.jpg)
Visión
• “Proceso que a partir de imágenes del mundo externo produce una representación útil al observador y no está ensombrecida por información irrelevante”.
• Puede concebirse como una proyección de una representación en otra: – Entrada: distribución de intensidad de luz
detectada por los fotorreceptores en la retina
![Page 13: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/13.jpg)
Marco teórico
• Tabla 1.1
![Page 14: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/14.jpg)
Factores responsables de la intensidad en una imagen
• Geometría de la escena
• Punto de observación (geometría del observador)
• Reflectancia de las superficies
• Iluminación de la escena
![Page 15: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/15.jpg)
Procesamiento visual inicial
• Obtener representaciones adecuadas a los cambios y estructuras de la imagen:– detección de cambios de intensidad– representación y análisis de la estructura
geométrica local– detección de efectos de iluminación (por ej.
transparencia)
![Page 16: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/16.jpg)
Qué representación?
• Debe incluir “marcadores de lugar” que puedan derivarse de las imágenes de modo fiable.
• Atributos: orientación, brillo, tamaño, posición.
• Deben corresponder con cambios físicos reales.
![Page 17: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/17.jpg)
Supuestos físicos
• “El mundo está formado por superficies lisas con funciones de reflectancia (FR) cuya estructura espacial se puede elaborar”
• Organización jerárquica: “A menudo la organización espacial de la FR de una superficie ha sido generada por varios procesos diferentes, actuando a escalas distintas”
![Page 18: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/18.jpg)
Supuestos físicos
• Similitud:” Los elementos generados en una superficie dada por un proceso generador de reflectancia que actúa en una escala dada tienden a ser más similares entre sí en su tamaño, contraste local, color y organización espacial que otros elementos de esta superficie”
• Se puede medir dentro de una escala...
![Page 19: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/19.jpg)
Supuestos físicos
• Continuidad espacial: “A menudo las señales generadas en una superficie por un único proceso se organizan espacialmente”
• La continuidad en la superficie debe reflejarse de algún modo en la continuidad de los marcadores...
![Page 20: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/20.jpg)
Supuestos físicos
• Continuidad de las discontinuidades: Las localizaciones de las discontinuidades en profundidad u orientación de las superficies son suaves.
• La cohesión de la materia implica que los objetos existen y tienen límites...
![Page 21: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/21.jpg)
Supuestos físicos
• Continuidad de flujo: si la dirección del movimiento es discontinua en más de un punto (por ejemplo en una línea) entonces estamos frente al límite de un objeto.
![Page 22: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/22.jpg)
Los ceros
• Detección de los cambios de intensidad:– Ocurren a diferentes escalas– Un cambio brusco de I equivale a un cero de la
segunda derivada.
• Figura 2.12 (detección de ceros con el operador laplaciano .Negro es negativo y blanco positivo, cruces por cero).
• Figs 2.17 y 2.23
G2
![Page 23: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/23.jpg)
Qué relaciones espaciales hacer explícitas?
• Intensidad local media.• Tamaño medio• Densidad• Orientación local• Distancias locales de los elementos
agrupados.• Orientación local de los elementos agrupados.
![Page 24: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/24.jpg)
Procesos de agrupamiento
• Construir marcadores de lugar que capten la estructura a mayor escala de la función de reflectancia de la superficie.
• Detectar cambios en los parámetros medidos asociados con estos marcadores y que indiquen cambios de orientación o distancia al observador
• Elaborar marcadores y encontrar límites.
• Figs. 2.5, 2.6, 2.33 y 2.34
![Page 25: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70](https://reader033.vdocuments.mx/reader033/viewer/2022051019/5665b4921a28abb57c924696/html5/thumbnails/25.jpg)
• Tabla 3.2
• Tabla 3.3
• tabla 4.1