fundamentos de la vision artificial

46
Fundamentos de la Visión Artificial Prof. Dr. Francisco Gómez Rodríguez Prof. Manuel J. Domínguez Morales 1

Upload: alcm

Post on 18-Dec-2015

24 views

Category:

Documents


4 download

DESCRIPTION

Vision Artificial

TRANSCRIPT

  • Fundamentos de la Visin

    Artificial

    Prof. Dr. Francisco Gmez Rodrguez

    Prof. Manuel J. Domnguez Morales1

  • ndice

    1. Introduccin a laVisin Artificial

    2. Adquisicin y representacin de

    imgenes

    3. Filtrado y realzado de imgenes

    4. Segmentacin

    5. Fundamentos del Color

    6. Extraccin de caractersticas y

    clasificacin

    2

  • Introduccin a la Visin Artificial

    La visin es uno de los mecanismo sensorialesms importantes de los seres vivos superiores.

    3

  • Introduccin a la Visin Artificial

    La visin artificial tiene como finalidad extraccin deinformacin del mundo fsico a partir de imgenesdigitales, utilizando para ellos un computador.

    Tiene aplicaciones en multitud de campos.

    4

  • Introduccin a la Visin ArtificialEtapas de un sistema de Visin Artificial

    Captura: adquisicin de imgenes digitales mediante algn tipo desensor, tpicamente un CCD.

    Prepocesado: preparar la imagen eliminando las partes no tilesy/o realzando las partes interesantes.

    Segmantacin: aislar los elementos de inters para su posteriorinterpretacin

    Reconocimiento: distinguir los diferentes objetos segmentadosen funcin de sus caractersticas.

    En muchas ocasiones es necesario una realimentacinentre las fases.

    5

    Captura Preprocesado Segmantacin Reconocimiento

  • Adquisicin y representacin de

    imgenes

    Los procesos ms importantes son las captura yla digitalizacin de la imagen.

    La imagen digital es una matriz bidimensional,cada elemento de la matriz se llama pixel (pictureelement).

    En el pixel se almacena el brillo en imgenes enniveles de gris (256 niveles), o intensidad de cadacomponente de una base de color (RGB) enimgenes a color (cada uno de ellos codifocadoen 256 niveles)

    6

  • Adquisicin y representacin de

    imgenesCaptura de imgenes

    Los dispositivos ms usado son los

    CCD (charge-coupled device, en

    espaol dispositivo de carga acoplada)

    Inventado por Willard Boyle y George

    Smith el 17 de octubre de 1969 en los

    Laboratorios Bell, ambos premiados

    con el Premio Nobel de Fsica de

    2009 precisamente por este invento

    7

  • Adquisicin y representacin de

    imgenesCaptura de imgenes

    8

  • Adquisicin y representacin de

    imgenesResolucin espacial

    Dependiendo de la cantidad de pixeles del

    sensor, la imagen poseer ms o menos

    resolucin espacial.

    9

  • Adquisicin y representacin de

    imgenesResolucin en amplitud

    Dependiendo del nmero de niveles de

    gris, generalmente se usaran 256 niveles.

    10

  • Adquisicin y representacin de

    imgenesVecindad

    4-vecindad

    8-vecindad

    11

  • Adquisicin y representacin de

    imgenesComprensin de imgenes

    12

  • Filtrado y realzado de imgenes

    Las operaciones que se pueden realizar

    sobre imgenes pueden ser entendidas

    como filtros.

    13

    HE S

  • Filtrado y realzado de imgenesOperaciones Bsicas entre pxeles

    Operadores de umbral: cambia el valor

    del pxel en funcin de si cumple o no una

    condicin.

    Umbral binario:

    = 0 1

    255 > 1

    Siendo q el nuevo valor del pxel y p e valor actual

    14

  • Filtrado y realzado de imgenesOperaciones Bsicas entre pxeles

    Umbral intervalo binario:

    = 0 1 2255 1 < < 2

    15

  • Filtrado y realzado de imgenesOperaciones Bsicas entre pxeles

    Umbral intervalo escala de grises

    = 0 1 2 1 < < 2

    16

  • Filtrado y realzado de imgenesOperaciones Bsicas entre pxeles

    Operaciones aritmtico-lgicas: AND, OR,

    Neg., Suma, Resta, Multiplicacin y

    Divisin.

    17

  • Filtrado y realzado de imgenesOperaciones Bsicas entre pxeles

    Operaciones geomtricas: si expresamos la

    posicin de los pxeles dentro de la matriz

    en coordenadas homogneas todas las

    transformaciones geomtricas puede ser

    tratadas como multiplicaciones de matrices.

    Traslacin: mover lo pxeles de una imagen segnun vector de movimiento.

    18

  • Filtrado y realzado de imgenesOperaciones Bsicas entre pxeles

    Escalado: cambiar el tamao de una imagen

    Rotacin: Girar los pxeles entorno al origende coordenadas (por convencin el pixel 0, 0

    es el situado en la esquina superior izquierda)

    19

  • Filtrado y realzado de imgenesOperaciones sobre el Histograma

    Histograma: Es un diagrama de barras en el

    que la altura de cada barra es proporcional al

    nmero de pxeles que tiene un determinado

    nivel de gris (o componente de color).

    20

  • Filtrado y realzado de imgenesOperaciones sobre el Histograma: Cambio de contraste

    Contraste: diferencia relativa en la intensidad entre unpunto de una imagen y sus alrededores. Una imagen conalto contraste presentar un histograma con dos masasde separadas.

    Para cambiar el contraste de una imagen se usa las siguientesfunciones de transferencia:

    21

  • Filtrado y realzado de imgenesOperaciones sobre el Histograma: Cambio de contraste

    22

  • Filtrado y realzado de imgenesEcualizacin del histogramas

    Conseguir un histograma con una distribucin uniforme

    de los diferentes niveles de gris mejora la calidad dela imagen para su posterior procesamiento.

    23

  • Filtrado y realzado de imgenesFiltrado espacial

    Convolucin: Su formulacin para el caso bidimensional

    discreto es:

    Donde I es la imagen filtrada, I es la imagen original y h es lamascara de convolucin o filtro (generalmente es una matriz de

    3x3).

    24

  • Filtrado y realzado de imgenesFiltros de suavizado

    Filtro de media o paso de baja

    =1

    9

    1 1 11 1 11 1 1

    25

  • Filtrado y realzado de imgenesFiltros de suavizado

    Otros filtros de suavizado

    26

  • Filtrado y realzado de imgenesFiltros de obtencin de contornos

    27

    Contornos simples

    Sobel

    Prewitt

  • Filtrado y realzado de imgenesFiltros de obtencin de contornos

    28

  • Filtrado y realzado de imgenesFiltro de la Laplaciana

    29

    Este operador, que se basa en la segunda derivada, se hace cerocuando la primera derivada se hace mximo, es decir cuandoaparece un cambio de signo en la primera derivada. En forma defiltro de convolucin:

    =0 1 01 4 10 1 0

    =1 1 11 8 11 1 1

  • Segmentacin

    Consiste en dividir una imagen digital en regiones

    homogneas con respecto a una o ms caractersticas

    (como por ejemplo el brillo o el color) con el fin de

    facilitar un posterior anlisis o reconocimiento

    automtico: localizar una cara o los lmites de una

    palabra.

    Como resultado de la segmentacin se obtendr otra

    imagen en la que cada pixel contiene una etiqueta

    correspondiente un objeto.

    Se tiene en cuenta aspectos como los contornos y las

    texturas.

    30

  • SegmentacinTextura

    la textura de un objeto dentro de una imagen es el

    conjunto de formas que se aprecia sobre su superficie y

    que lo dota de cierto grado de regularidad.

    Una definicin clsica de textura es la siguiente: uno o

    ms patrones locales que se repiten de manera

    peridica.

    31

  • SegmentacinContorno

    El contorno de un objeto en una imagen digitalcorresponde al mnimo conjunto de pxeles que separaese objeto del fondo de la imagen. Normalmente estoscontornos se corresponden con los puntos donde seproducen discontinuidades en los valores de pxelesadyacentes o con los puntos donde cambia un patrnque se repite

    32

  • SegmentacinBasada en la umbralizacin

    Es un proceso que permite convertir una imagen de

    niveles de gris o de color en una imagen binaria, de tal

    forma que los objetos de inters se etiqueten con un

    valor distinto al de los pxeles del fondo.

    Se aplicarn alguno de los operadores de umbralizacindescritos en las transparencias 14 a la 16.

    33

  • SegmentacinBasada en la deteccin de contorno

    Basndose en las relaciones de vecindad, se puede

    segmentar una imagen agrupando los pxeles con una

    color uniforme y distinto del fondo.

    34

    Algoritmo de etiquetado Se recorre la imagen de izquierda a derecha y de arriba a abajo.

    Cuando encuentra un pxel a negro le asigna una etiqueta de uncontador que posee y entra en una funcin recursiva que recorrelos pxeles adyacentes, siguiendo un orden determinado,marcndolos como visitados y asignndoles el mismo valor delcontador.

    Una vez recorridos todos los pxeles de ese objeto incrementa elcontador y sigue recorriendo la imagen en busca del siguiente pxela negro.

  • SegmentacinBasadas en el crecimiento de regiones (i)

    Determinan zonas dentro de una imagen basndose en criterios desimilitud y proximidad entre los pxeles de la misma.

    En estas tcnicas la homogeneidad (o falta de homogeneidad) entreregiones adyacentes es el criterio utilizado para unir (o dividir)regiones de la imagen.

    La homogeneidad se puede definir a partir de criterios como: elnivel de gris medio, el color, la forma, etc.

    El resultado de la segmentacin es una particin de la imagen enregiones homogneas.

    Estas tcnicas trabajan mejor en imgenes con ruido, en donde loscontornos son difciles de localizar.

    La segmentacin resultante de una deteccin de contornos y labasada en crecimiento de regiones, aplicadas a una misma imagenno producen normalmente el mismo resultado. Combinar ambastcnicas.

    35

  • SegmentacinBasadas en el crecimiento de regiones (ii)

    Unin de regiones

    Este procedimiento agrupa pxeles de la imagen formando regionesde similares caractersticas.

    Inicialmente se elige una coleccin de pxeles de manera aleatoriaque actan como semillas para comenzar el crecimiento.

    A estos puntos de la imagen se les agrega los adyacentes cuandotienen valores que cumplen algn criterio de homogeneidad con lospuntos semilla.

    Si ocurre esto, pertenecen a la misma regin y pasan a tener losmismos valores que los puntos semilla.

    El criterio de homogeneidad ms usual suele consistir en que unpxel, adyacente a una regin, se agregue a sta si su intensidad essimilar a la media de las intensidades de los pxeles de la regin.

    El principal inconveniente del mtodo se deriva de que el resultadodepende de la eleccin inicial de los puntos semilla.

    36

  • SegmentacinBasadas en el crecimiento de regiones (iii)

    Unin de regiones

    Es un proceso opuesto al de unin de regiones.

    Se parte una nica regin que representa a toda la imagen, y sidicha regin no satisface el criterio de homogeneidad

    establecido, la regin inicial se divide, de manera secuencial, en

    subregiones de las que se estudia su homogeneidad.

    Si una subregin est formada por puntos homogneos, no sesubdivide; si no, se sigue dividiendo.

    Los criterios utilizados para dividir regiones son similares a losusados para agruparlas, y slo se diferencian en la direccin en

    que se aplican.

    37

  • SegmentacinBasadas en el crecimiento de regiones (iv)

    Divisin y unin de regiones (Split and merge) Horowitz y Pavlidis propusieron en 1976 un mtodo que solventa el problema

    de la eleccin arbitraria de semillas para agrupar regiones.

    El algoritmo recibe la imagen a segmentar y devuelve una imagen resultadoformada por regiones homogneas.

    El algoritmo propuesto sigue la tcnica de divide y vencers y tiene dos fases:dividir la imagen en subimgenes o regiones (split) y luego agrupar subimgenes

    similares (merge).

    38

  • 39

    SegmentacinBasadas en el crecimiento de regiones (v)

  • SegmentacinBasada en el movimiento

    til cuando los objetos que se quieres extraer estn en

    movimiento

    Umbralizar usando dos imgenes tomadas con muy poco tiempode separacin pero suficiente como para apreciar el cambio de

    posicin del objeto.

    Aplicar alguno de la mtodos anteriores.

    40

  • Fundamentos del Color (i)

    La importancia del color en visin artificial viene

    motivado por dos aspectos:

    Es un potente discriminador

    El ojo humano es capaz de distinguir una amplia gama de colorcomparado con los tonos de gris

    41

  • Fundamentos del Color (ii)

    Brillo: Intensidad del color

    Matiz o tono: longitud de onda dominando en la mezcla de

    colores, color percibido por el observador.

    Saturacin: relacin entre la onda dominante y el resto.

    42

    Componentes de la luz Pigmentos Primarios

  • Fundamentos del Color (iii)

    43

  • 44

    Fundamentos del ColorModelos de color (CMY y RGB)

    CMY RGB

  • 45

    Fundamentos del ColorModelos de color (HSI)

    Tiene en cuenta el matiz, la saturacin y la intensidad.

    Esta mejor adaptado a como lo humanos percibimosel color

  • Bibliografa Visin por computador Jos Francisco Vlez Serrano, Ana Beln

    Moreno Daz, ngel Snchez Calle, Jos L.Esteban Snchez-Marn

    http://www.visionporcomputador.es/libroVision/libro.html

    Digital Image Processing Rafael C. Gonzlez, Richard E.Woods

    Visin por computador : imgenesdigitales y aplicaciones Gonzalo Pajares Martinsanz, Jess M. de la

    Cruz Garca

    46