modelos visuales en el anÁlisis de la calidad de imagen

181
UNIVERSIDAD POLITÉCNICA DE MADRID ESCUELA TÉCNICA SUPERIOR DE INGENIEROS DE TELECOMUNICACIÓN PROYECTO FIN DE CARRERA MODELOS VISUALES EN EL ANÁLISIS DE LA CALIDAD DE IMAGEN Ana Rosa Gallego Aguilar Febrero 2006

Upload: dinhcong

Post on 12-Feb-2017

224 views

Category:

Documents


2 download

TRANSCRIPT

  • UNIVERSIDAD POLITCNICA DE MADRID ESCUELA TCNICA SUPERIOR DE INGENIEROS DE

    TELECOMUNICACIN

    PROYECTO FIN DE CARRERA

    MODELOS VISUALES EN EL ANLISIS DE

    LA CALIDAD DE IMAGEN

    Ana Rosa Gallego Aguilar

    Febrero 2006

  • UNIVERSIDAD POLITCNICA DE MADRID

    ESCUELA TCNICA SUPERIOR DE INGENIEROS DE TELECOMUNICACIN

    PROYECTO DE FIN DE CARRERA

    TTULO: MODELOS VISUALES EN EL ANLISIS DE

    LA CALIDAD DE IMAGEN. AUTOR: ANA ROSA GALLEGO AGUILAR. TUTOR: GABRIEL CRISTBAL PREZ. TRIBUNAL: PRESIDENTE: ANDRS DE SANTOS Y LLE. VOCAL: FERNANDO CALLE GMEZ. SECRETARIA: MARA JESS LEDESMA CARBAYO. SUPLENTE: ANTONIO GABRIEL LOMEA MORENO. FECHA DE LECTURA: CALIFICACIN:

    Departamento de Ingeniera Electrnica. Instituto de ptica Daza de Valds (C.S.I.C.)

  • Resumen:

    En este proyecto se van a estudiar los modelos visuales y su aplicacin concreta

    en sistemas de medida de calidad de imagen. Se va desarrollar una herramienta para la

    evaluacin automtica de la calidad perceptible de imgenes monocromticas que hayan

    sido procesadas mediante algoritmos de compresin o de marcado de agua. Para ello se

    investigan cules son los atributos visuales perceptivos de mayor relevancia en la

    determinacin de la calidad de imagen. Se analizan los distintos componentes del

    Sistema Visual Humano (adaptacin de luminancia, CSF, enmascaramiento, etc.) y para

    cada uno de ellos se realizarn diferentes implementaciones dentro de un esquema de

    medida de calidad perceptible. En base a los resultados que proporcionan los distintos

    modelos de estos atributos se indican las implementaciones que resultan ms fiables.

    Palabras clave:

    Calidad de imagen, modelos visuales, adaptacin de luminancia, CSF, contraste,

    enmascaramiento, ndices de calidad, visibilidad error.

  • Agradecimientos:

    A todos los compaeros del CSIC. En especial a mi tutor Gabriel, por su paciencia, sus

    indicaciones y sus consejos.

    A todos los que os pasasteis por el laboratorio del CSIC para la realizacin de los test,

    gracias.

    A mis amigos de la facultad: Isa, Mariajo, Elena, Fede, Noelia, Andrs, Vanessa,

    Raquel, Augusto y Pablo. Porque habis llenado de historias y recuerdos mis cinco

    aitos en la escuela y porque todava me segus aguantando.

    A Leo, Carlos y Ari por los veranos de estudio, de proyecto y de fiesta.

    A Elena, Ana e Inma por estar ah siempre apoyando moralmente. A Pepa adems por

    las consultas estadsticas y a Alex por los libros de medicina.

    A mi familia, con todo mi cario.

  • NDICE 1. Introduccin.

    1.1. Estado del Arte ............................................................................................. 4

    1.2. Objetivos del Proyecto ................................................................................. 6

    1.3. Estructura del Proyecto................................................................................. 7

    2. Sistema Visual Humano.

    2.1. Anatoma y fisiologa visual......................................................................... 10

    2.1.1. El ojo ................................................................................................ 10

    2.1.2. Campos receptores de la retina......................................................... 12

    2.1.3. Vas visuales. Integracin de la informacin en la corteza .............. 16

    2.2. Propiedades de la visin ............................................................................... 20

    2.2.1. Adaptacin visual. Sensibilidad a la intensidad luminosa................ 20

    2.2.2. Contraste........................................................................................... 22

    2.2.3. Sensibilidad en frecuencia ................................................................ 25

    2.2.4. Enmascaramiento ............................................................................. 30

    2.3. Movimientos oculares y atencin visual ...................................................... 32

    3. Evaluacin de la calidad en imgenes.

    3.1. Calidad de imagen. Clasificacin de mtodos de medida. ........................... 35

    3.2. Modelos de calidad de imagen subjetivos .................................................... 37

    3.3. Modelos de calidad de imagen objetivos...................................................... 40

    3.3.1. Modelos de medida de error ............................................................. 40

    3.3.2. Modelos de medida de calidad perceptible....................................... 43

    3.3.3. Modelos hbridos de medida de calidad ........................................... 51

    3.4. Distorsin de imagen.................................................................................... 56

    3.4.1. Tcnicas de compresin y artefactos. ............................................... 56

    3.4.2. Marcado de agua............................................................................... 60

  • 4. Implementacin de modelos visuales para la evaluacin de la calidad de

    imagen.

    4.1. Preprocesado. Caractersticas del monitor ................................................... 63

    4.2. Adaptacin de luminancia ............................................................................ 66

    4.3. Funcin de Sensibilidad al contraste (CSF) ................................................. 68

    4.3.1. Modelo 1 de CSF (B.W.Rust) .......................................................... 70

    4.4.2. Modelo 2 de CSF (Daly) .................................................................. 71

    4.3.3. Modelo 3 de CSF (Barten) ............................................................... 74

    4.4. Descomposicin en canales.......................................................................... 75

    4.4.1. Filtros de Gabor................................................................................ 76

    4.4.2. Transformada Cortex. Filtros anillo ................................................. 82

    4.5. Clculo de contrastes.................................................................................... 85

    4.6. Enmascaramiento espacial............................................................................ 89

    4.6.1. Enmascaramiento con CSF como filtro............................................ 90

    4.6.2. Enmascaramiento con CSF por pesos .............................................. 92

    4.7. Mapas e ndices de error............................................................................... 94

    5. Comportamiento y comparativa de los modelos de medida de calidad.

    5.1. Validacin de modelos de medida de calidad perceptible............................ 100

    5.2. Sistema de medida de calidad con CSF como filtro..................................... 109

    5.3. Sistema de medida de calidad con CSF por pesos. ...................................... 120

    5.4. Otros modelos............................................................................................... 127

    5.4.1. Medida de calidad basada en informacin estructural(SSIM) ......... 127

    5.4.2. Medida de calidad basada en distribuciones Wigner........................ 132

    6. Conclusiones.

    6.1. Conclusiones................................................................................................. 139

    6.2. Posibles ampliaciones. ................................................................................. 141

    7. Anexos.

    Anexo A. Imgenes del test DSCQS y resultados MOS. ...................................... 144

    Anexo B. Entorno grfico...................................................................................... 155

    Anexo C. Manual de programas bsicos. .............................................................. 164

    Bibliografa. ............................................................................................................... 171

  • GLOSARIO CSF Contrast Sensitivity Function. CRT Cathode Ray Tube. DCT Discrete Cosine Transform. DSIS Double Stimulus Impairment Scale. DSCQS Double Stimulus Continuous Quality Scale. DWT Discrete Wavelet Transformation. FFT Fast Fourier Transform. ITU International Telecommunication Union. JND Just Noticeable Difference. JPEG Joint Photographic Experts Group. LUT Look-Up Table. MOS Mean Opinion Score. MRI Magnetic Resonance Imaging. MSE Mean Square Error. NMSE Normalized Mean Square Error. PEM Perceptual Error Measure. PQS Picture Quality Scale. PSF Point Spread Function. PSNR Peak Signal to Noise Ratio. PWD Pseudo Wigner Distribution. SNR Signal to Noise Ratio. SSCQE Single Stimulus Continuous Quality Evaluation. SSIM Structural SIMilarity. SVH Sistema Visual Humano. VDM Visual Discrimination Model. VDP Visible Differences Predictor. WVD Wigner- Ville Distribution.

  • 1

    Introduccin.

    Las imgenes digitales se ven afectadas por una amplia gama de distorsiones

    durante su adquisicin, procesado, almacenado, transmisin y reproduccin. Todos

    estos procesos, lgicamente, pueden dar como resultado una degradacin de la calidad

    visual. Para aplicaciones en las que finalmente la imagen va a ser observada por

    personas, el nico mtodo realmente correcto de evaluar la calidad de esa imagen sera

    mediante la valoracin subjetiva que dara el observador. En la prctica la evaluacin

    subjetiva mediante test resulta bastante complicada y en algunos casos, segn la

    aplicacin, puede llegar a ser inabordable. La meta en la investigacin y el desarrollo de

    mtricas de calidad objetivas consiste precisamente en conseguir medidas cuantitativas

    que puedan valorar de forma automtica la calidad de imagen percibida.

    Una mtrica de calidad de imagen objetiva puede cumplir diferentes funciones

    segn su aplicacin. Por ejemplo, se puede utilizar para monitorizar y ajustar

    dinmicamente la calidad de la imagen en un servidor de video digital de forma que se

    adecue a los recursos disponibles. Tambin puede servir para optimizar algoritmos y

    parmetros en sistemas de procesado de imgenes como en el caso de sistemas de

    comunicacin en los que es posible utilizarla para optimizar el diseo de filtros y

    algoritmos de codificacin y decodificacin. En todas estas aplicaciones lo que interesa

    es que a pesar de la degradacin introducida el observador final perciba sta lo menos

    posible. Por ello, las mtricas de calidad objetivas que resultan efectivas son las que

    evalan esta calidad percibida. Para ello es necesario saber qu es lo que este

  • 1. Introduccin.

    2

    observador percibe, siendo imprescindible conocer el funcionamiento del SVH y

    modelarlo en la medida de lo posible.

    Los modelos del sistema visual humano, por tanto, van a ser el fundamento para

    la definicin de mtricas objetivas de calidad perceptible, pero adems, no slo van a

    estar presentes como sistema de valoracin sino que lo ideal sera que las principales

    caractersticas del SVH sean integradas directamente en el corazn de la herramienta

    diseada. Este planteamiento adquiere una gran importancia en el desarrollo de mtodos

    y sistemas de compresin ya que las capacidades limitadas de procesamiento del SVH

    permiten que una imagen pueda ser modificada sin que las distorsiones introducidas

    sean detectadas con lo que se podrn conseguir tasas de compresin mayores sin que se

    modifique la calidad percibida de forma significativa. Por tanto, el objetivo es hacer que

    las distorsiones introducidas por el compresor sean invisibles al ojo, es decir, un

    compresor perceptual sin prdidas. De hecho, ya desde sus inicios en la primera reunin

    del grupo de expertos JPEG 2000 en Sydney en 1997, se comenzaron los primeros

    trabajos para incorporar las caractersticas del SVH como una herramienta de

    optimizacin dentro del estndar. El mtodo ms habitual para mejorar la compresin

    mediante tcnicas de optimizacin visual est basado en transformar las amplitudes de

    la imagen a un dominio perceptivo uniforme. Puesto que la respuesta global del sistema

    visual a la escala de grises puede aproximarse por una no-linealidad de tipo de raz

    cbica, el proceso a realizar consistira en convertir la imagen a un dominio inverso para

    cuantificar posteriormente. Esta tcnica es la base de la denominada correccin gamma

    que est presente en la mayora de los monitores de video. Los otros dos elementos

    claves a optimizar son el contenido de las frecuencias espaciales y el enmascaramiento.

    El primero de ellos involucra el clculo de la funcin de sensibilidad al contraste (CSF)

    para encontrar los pasos de cuantificacin, mientras que el segundo est relacionado con

    la importancia del contexto en donde se encuentren los objetos a codificar. El fenmeno

    del enmascaramiento (masking) es un efecto perceptivo bien conocido tanto para el

    caso de imgenes como para el caso de seales acsticas, etc. Se debe bsicamente al

    hecho de que estmulos de gran intensidad van a enmascarar a estmulos ms pequeos.

    Este efecto puede ser aprovechado en compresin para concentrar los errores en

    aquellas regiones en donde van a ser visualmente imperceptibles. Sin embargo, el efecto

    de enmascaramiento admite mltiples interpretaciones y su comportamiento no es bien

  • 1. Introduccin.

    3

    conocido en algunas situaciones, por lo que constituye un rea activa en la investigacin

    actual del sistema visual.

    En definitiva, la necesidad de compresin cada vez mayor y con una calidad

    aceptable, motivada por la gran demanda actual en la transmisin y almacenamiento de

    la informacin visual ha impulsado, como se ha comentado, la incorporacin de los

    modelos visuales a la mayora de algoritmos de compresin [10, 12, 22, 25, 26, 35]. En

    general, la compresin es del todo necesaria ya que las imgenes digitales son de

    tamao considerable. Esto se agrava en el caso de aplicaciones con imgenes mdicas.

    Por ejemplo, en el contexto de la radiologa, la medida final de la calidad de una imagen

    reside en lo til que es la imagen para conseguir un diagnstico certero y preciso. El

    verdadero test para un radilogo es la deteccin precisa de incluso pequeas

    anormalidades. Es por ello que el mantenimiento de la mayor fidelidad posible en la

    representacin de las imgenes es crucial en la prctica radiolgica y no se pueden

    tolerar artefactos ni prdida de calidad. Se necesitan, por tanto, esquemas de compresin

    sin prdidas lo que hace que el problema del tamao de la imagen mdica sea crtico en

    cuanto a su almacenamiento, consulta, etc. Por tanto, si en general los modelos de SVH

    son tiles para alcanzar tasas de compresin elevadas con las menores prdidas de

    calidad posible en el caso de las imgenes mdicas resultan tanto ms tiles puesto que

    lo que se busca es un sistema de compresin sin prdidas perceptibles.

    Finalmente, no se puede olvidar que las aplicaciones de los modelos del SVH en

    entornos de compresin o en cualquier otro no tendra sentido si no se pudiese evaluar a

    posteriori el valor de calidad percibida de la imagen. En conclusin, se van a necesitar

    las mtricas de calidad objetiva perceptible para evaluar si se han conseguido los

    objetivos deseados despus del procesado de la imagen.

  • 1.1. Estado del arte.

    4

    1.1. Estado del arte.

    A lo largo de muchos aos de investigacin en el procesado visual, uno de los

    problemas fundamentales ha sido la ausencia de una mtrica universalmente aceptada

    que proporcione una medida de la calidad de una imagen con unas prestaciones

    aceptables en un amplio rango de situaciones. Los test subjetivos son usados

    normalmente para obtener la estimacin ms precisa de la calidad de imagen. Sin

    embargo, llevar a cabo estos test en la prctica resulta muy pesado en cuanto a la carga

    temporal que conlleva, aparte de resultar caros y difciles de repetir puesto que

    requieren unas condiciones de visualizacin especiales. Debido a estos inconvenientes

    se hace necesario el uso de mtricas de calidad objetivas. De estas, las ms conocidas, y

    que se siguen empleando en casi todos los casos, son medidas simples matemticas

    basadas en la relacin seal/ruido de pico (PSNR) o el error cuadrtico medio (MSE). A

    pesar de ser las ms utilizadas est comprobado que dichas medidas no guardan ninguna

    relacin directa con la calidad de la imagen percibida. La bsqueda y desarrollo de

    mtricas ms robustas que proporcionen medidas de calidad acordes con la percibida es

    actualmente un rea activa de investigacin. De hecho, se han definido un gran nmero

    de posibles mtricas que incorporan de una u otra manera factores perceptivos. El

    desarrollo de estas mtricas objetivas basadas en modelos del SVH ha sido posible

    gracias a los avances en el conocimiento del SVH y su funcionamiento. En general lo

    que se suele modelar es el procesado a bajo nivel desde el ojo hasta la corteza visual

    primaria. Las propiedades del SVH o caractersticas visuales que incorporan

    normalmente estas mtricas son la adaptacin de luminancia, la funcin de sensibilidad

    al contraste (CSF) y el enmascaramiento. La forma en la que se lleva a cabo esta

    incorporacin es mediante modelos de las caractersticas visuales mencionadas que se

    obtienen gracias a los datos experimentales conseguidos mediante la realizacin de test

    psicofsicos de deteccin de umbral con estmulos simples.

    Los distintos modelos de medida de calidad perceptible existentes, puesto que se

    han definido teniendo en cuenta las caractersticas del SVH, van a compartir una

    estructura bsica similar y luego, dependiendo de la aplicacin para la que fueron

    propuestos tendrn diversas particularidades. En general en todos ellos se pueden

    encontrar una etapa de calibrado, un filtrado de la imagen a diferentes frecuencias

    espaciales y orientaciones, ajustes segn la sensibilidad al contraste, mecanismos para

  • 1.1. Estado del arte.

    5

    modelar el enmascaramiento y una etapa final que obtiene el error o bien como un

    nmero que describe la calidad de la imagen o bien como un mapa de detectabilidad de

    la distorsin o ambos.

    La implementacin de estas mtricas es en muchos casos compleja, son bastante

    elaboradas y con un coste computacional elevado. El grado de complejidad depende de

    las caractersticas visuales que se contemplen dentro de la mtrica y el modelo escogido

    para las mismas. Dos de los modelos de referencia para la mayor parte de mtricas que

    se han desarrollado ya que resultan bastante generales y robustos son el Visible

    Difference Predictor (VDP) de Daly [7] y el Visual Discrimination Model (VDM) de

    Lubin [19]. Sin embargo, estos modelos presentan algunas limitaciones como son el no

    tener en cuenta caractersticas del SVH de alto nivel (extraccin de caractersticas,

    procesos cognitivos, reconocimiento de patrones, atencin visual), que se disean

    para condiciones de visibilidad del estmulo cercanas al umbral (los experimentos

    psicofsicos en los que se basan son en condiciones de deteccin umbral) y otras que se

    vern con ms detalle a lo largo del proyecto. Es por ello, que algunos modelos han

    intentado incorporar caractersticas del procesado del SVH de alto nivel [26] o

    directamente buscar nuevas mtricas que de alguna forma simulen ciertas caractersticas

    de la percepcin sin llegar a incorporar los modelos visuales [30, 31].

    En definitiva este es un rea con distintos frentes de investigacin abiertos

    puesto que an no hay una mtrica aceptada estndar para la evaluacin de la calidad

    percibida de imagen. Adems, el estudio del comportamiento de las mtricas ya

    existentes es complicado ya que la validacin de las mismas ha de hacerse mediante test

    subjetivos sobre un conjunto de imgenes dadas con lo que, en cualquier caso, su

    evaluacin es parcial.

  • 1.2. Objetivos.

    6

    1.2. Objetivos.

    El objetivo fundamental es investigar cuales son los atributos visuales

    perceptivos ms importantes que juegan un papel decisivo en la determinacin de la

    calidad de una imagen, como interactan y se correlacionan entre si. En definitiva, se

    trata de analizar los modelos visuales en la evaluacin de la calidad de imagen.

    En concreto, la realizacin de este anlisis se va a llevar a cabo con dos

    propsitos determinados que en realidad van a surgir como resultado directo de la

    investigacin realizada en el mbito de los modelos y mtricas de calidad de imagen. En

    primer lugar se trata de desarrollar una herramienta de trabajo en forma de entorno

    grfico que sea global, amplia y abierta. Global en el sentido de que incluya todo tipo de

    mtricas para la evaluacin de la imagen y no slo las que se basan modelos de SVH.

    De esta forma se van a poder comparar y contrastar los resultados obtenidos mediante

    los distintos sistemas de medida de calidad sacando las pertinentes conclusiones en

    cuanto a tiempos de ejecucin, precisin de los resultados, adecuacin de los mtodos a

    los distintos tipos de imgenes, etc. Amplia en el sentido de abarcar el mayor nmero de

    modelos posibles para los distintos componentes del SVH de manera que una vez

    centrados en los modelos visuales sea posible tambin obtener distintas conclusiones en

    cuanto a qu modelos en concreto o combinacin de ellos obtienen mejores resultados.

    Por ltimo, se trata de que sea una herramienta abierta que facilite la incorporacin

    futura de nuevos mtodos o modelos de forma sencilla, que se pueda implementar en

    cualquier sistema sin ms que realizar algunos ajustes y que sirva para una gama amplia

    de imgenes. En segundo lugar, se pretende desarrollar un modelo que permita explicar

    como un observador humano combina los atributos visuales para lograr una valoracin

    de la calidad de imagen percibida. El desarrollo de una mtrica perceptible permitir

    tener una herramienta de tipo observador ideal que proporcione una medida de la

    calidad ms prxima a la que se obtendra a travs de un observador humano. Este

    modelo de medida de calidad de imagen se implementar de forma dinmica dentro del

    entorno grfico antes mencionado.

    En el presente proyecto se desarrollan por tanto herramientas para la evaluacin

    automtica de la calidad subjetiva de imgenes monocromticas. En concreto, las

    imgenes que se pretenden analizar y que resultan de mayor inters sern aquellas que

  • 1.3. Estructura del proyecto.

    7

    hayan sido procesadas mediante algoritmos de compresin o de marcado de agua. En

    particular sern objeto de estudio por una parte las imgenes mdicas de video-

    microscopa y radiolgicas (MRI, PET, etc.) y por otra y para que el estudio resulte lo

    ms completo posible se utilizarn imgenes conocidas y de uso comn en entornos de

    compresin.

    1.3. Estructura del proyecto.

    La organizacin de este proyecto para conseguir los objetivos que se han

    planteado va a estar claramente dividida en tres bloques: investigacin, implementacin

    y evaluacin.

    En primer lugar, se necesitar una investigacin y anlisis del SVH y de sus

    componentes. Este estudio previo se desarrolla en el captulo 2, donde se examinan las

    caractersticas de comportamiento del SVH. Para comprender su funcionamiento se

    realizar una descripcin de la anatoma y fisiologa visual y posteriormente se

    determinarn las distintas propiedades de la visin y su respuesta. Esta es la base sobre

    la que despus se podrn realizar modelos de medida de calidad perceptible. Adems,

    ser necesario aportar un marco general en cuanto a modelos ya existentes. La

    descripcin de algunos de los modelos de medida de calidad de imagen, su estructura

    bsica y los distintos problemas y ventajas que llevan asociados se hace en el captulo 3.

    Tambin se definen y clasifican aqu los distintos tipos de mtricas de calidad de

    imagen y lo que es ms importante, se define el concepto de calidad que se tendr en

    cuenta en este proyecto. Finalmente, se da una visin general en cuanto al tipo de

    distorsiones con las que van a tratar estos mtodos.

    En segundo lugar, para la construccin de un modelo de medida de calidad

    perceptible se van a llevar a cabo distintas implementaciones de los componentes del

    SVH (adaptacin, CSF, enmascaramiento, etc.). El captulo 4 rene para cada uno de

    ellos las propuestas que se han desarrollado mediante la herramienta MATLAB,

    explicando cmo se relacionan y unen entre s los distintos bloques que componen el

    modelo.

  • 1.3. Estructura del proyecto.

    8

    En tercer lugar se van mostrar y analizar los resultados obtenidos para las

    diferentes imgenes y distorsiones que son evaluadas con los sistemas de medida de

    calidad implementados. En el captulo 5 se describe primero el mtodo DSCQS que

    sirve para la validacin de los modelos y despus se examinan los resultados para los

    modelos de medida de calidad perceptible y los de otras mtricas hbridas ya descritas

    dentro de la clasificacin del captulo 3. En el captulo 6 se resumen las conclusiones

    obtenidas y se sealan posibles ampliaciones y mejoras.

    Finalmente, en el anexo A se van a mostrar los valores subjetivos que se han

    obtenido mediante la realizacin del test DSCQS y las imgenes utilizadas. El anexo B

    describe el entorno grfico que se ha construido y su utilizacin. En el anexo C se

    enumeran y explican brevemente los programas y funciones ms importantes generadas

    mediante MATLAB para el desarrollo de este proyecto as como su relacin.

  • .

    9

    Sistema Visual Humano.

    La calidad de una imagen puede verse influenciada por diversos factores entre

    los que pueden destacarse las tcnicas de adquisicin, de procesamiento y de

    visualizacin a las que se somete a esa imagen. En la mayora de los casos el resultado

    obtenido va a ser contemplado por un observador que formar parte activa en la

    evaluacin de la imagen final. Por ello, para poder dar una medida de calidad acorde

    con la percibida por ese observador es necesario estudiar el SVH y los mecanismos de

    percepcin, entendindose como tal los procesos de extraccin de la informacin y la

    formacin de representaciones sobre las que pueda operar el sistema cognitivo.

    En el estudio de la visin se pueden diferenciar claramente dos etapas. Por un

    lado, se realiza un procesado a bajo nivel que no utiliza informacin de experiencias

    pasadas, ni razonamiento. Este es el procesado que incluyen la mayor parte de las

    mtricas de calidad de imagen basadas en las caractersticas del SVH y es en el que se

    centra este captulo. Por otra parte, el procesado de alto nivel utiliza recursos como la

    atencin y la memoria, siendo estos de un mayor nivel de complejidad y por tanto

    mucho ms difciles de modelar.

    En este captulo, en resumen, se pretende analizar las caractersticas de

    comportamiento del SVH, comprendiendo su funcionamiento y determinando, en la

    medida de lo posible, su respuesta. Esta ser la base sobre la que despus se podrn

    modelar mtricas de calidad perceptible. Se inserta salto continuo a seccin siguiente.

  • 2.1. Anatoma y fisiologa visual.

    10

    2.1. Anatoma y fisiologa visual.

    2.1.1. El ojo. Es el rgano del SVH en el que comienza el procesamiento visual y cuyo

    funcionamiento bsico consiste en recoger la luz y enfocarla en su superficie posterior,

    transformando energa luminosa en elctrica. Es sensible a las radiaciones

    electromagnticas con longitudes de onda comprendidas entre los 400 y los 780 nm

    aproximadamente.

    La figura 2.1 muestra una seccin del globo ocular, con una forma prcticamente

    esfrica y de unos 20 mm de dimetro. En la figura, se pueden apreciar los componentes

    principales de los que se compone el ojo, que van a ser enumerados a continuacin,

    explicando su funcionamiento y caractersticas ms relevantes.

    Figura 2.1: Seccin vertical del ojo.

    La esclertica es el tejido duro, blanco y fibroso que conforma la parte exterior

    del globo ocular. Es opaca y se conoce comnmente como el blanco del ojo. La parte

    delantera y central del ojo es la crnea. Se trata de una membrana transparente y dura

    cuya funcin principal consiste en refractar la luz. Adems, la crnea tiene una cierta

    curvatura que contribuye a dirigir la luz y concentrarla en una pequea apertura redonda

    (de 2 a 8 mm de dimetro) situada en el centro del ojo y que permite que la luz pase al

    interior del mismo, la pupila. Esta a su vez est rodeada por el iris, un msculo circular

    que permite regular la cantidad de luz que entra en el ojo, de forma que si la intensidad

    luminosa es elevada se contraer haciendo menor el dimetro de la pupila y viceversa.

  • 2.1. Anatoma y fisiologa visual.

    11

    La parte anterior del iris es la que contiene el pigmento visible que caracteriza el color

    de ojos.

    Tras el iris se encuentra el cristalino que est formado por una serie de capas

    concntricas con distintos ndices de refraccin que actan como una lente flexible

    enfocando la luz en el fondo del ojo. El cristalino absorbe cerca del 8% de la luz visible

    del espectro, incrementndose esta absorcin en las zonas del infrarrojo y del

    ultravioleta, pudiendo llegar a daarse el ojo por un exceso de radiacin en estas

    frecuencias. Entre la crnea y el cristalino se encuentra una sustancia lquida, clara y

    transparente denominada humor acuoso.

    La retina recubre la parte interior del ojo y es en ella donde se enfoca la luz

    incidente. La luz se convierte aqu en seales nerviosas mediante clulas sensibles a la

    luz. Entre el cristalino y la retina se encuentra el humor vtreo que es una sustancia

    gelatinosa transparente e incolora. El humor vtreo llena todo el espacio entre el

    cristalino y la retina y ocupa alrededor de 2/3 del volumen ocular. Para poder enfocar

    objetos cercanos y lejanos es necesario que el ojo humano cambie la forma del

    cristalino. Este proceso, que se denomina acomodacin, es controlado mediante un

    grupo de msculos situados alrededor del iris y sucede prcticamente en tiempo real.

    Una vez realizada esta acomodacin, la luz se proyecta en la retina y es transformada en

    impulsos elctricos mediante dos tipos de fotorreceptores que reciben el nombre de

    conos y bastones.

    Los conos se distribuyen fundamentalmente por la zona central de la retina

    denominada fvea, son sensibles al color y responsables de la visin fotpica.

    Proporcionan una visin en detalle y pueden ser de tres tipos segn la respuesta que

    presentan al contenido de la radiacin. Es un sistema que funciona con tres receptores

    de color distintos, dando lugar a la teora tricromtica para la percepcin del color. Cada

    ojo posee entre 6 y 7 millones de conos y su umbral de visibilidad se sita alrededor de

    1L (micro-lumen).

    Los bastones proporcionan informacin general del campo visual. Son sensibles

    a valores muy bajos de iluminacin con umbrales de 1nL, de tal forma que hacen

    posible la visin nocturna o con poca iluminacin pero sin informacin de color. Son

  • 2.1. Anatoma y fisiologa visual.

    12

    responsables, por tanto, de la visin escotpica. El nmero de bastones es de 75 a 150

    millones.

    Figura 2.2: Distribucin de conos y bastones en la retina.

    Como puede apreciarse en la figura 2.2 la distribucin de estos fotorreceptores

    en la retina es poco uniforme y ms o menos simtrica respecto a la fvea. Esta

    distribucin hace que tengamos un amplio ngulo de visin y una resolucin espacial

    elevada a nivel local que se resuelve con el continuo movimiento del ojo enfocando los

    objetos de inters en la fvea.

    El disco ptico se caracteriza por ser la nica zona de la retina en la que no hay

    fotorreceptores, constituyendo, por tanto, un punto ciego. De aqu parten los vasos

    sanguneos que riegan la retina y adems en esta zona convergen los axones formando

    el nervio ptico que parte con la informacin que ser enviada al cerebro.

    2.1.2. Campos receptores de la retina. Un campo receptor es un rea de la retina formada por fotorreceptores (conos y

    bastones) cuyas respuestas influyen en clulas ms avanzadas del procesamiento visual:

    las clulas ganglionares. La figura 2.3 muestra una seccin de la retina con las clulas

    que la forman y su conexionado. Como puede observarse, entre las clulas ganglionares

    y los fotorreceptores existen otros tres tipos de clulas: horizontales, amacrinas y

    bipolares.

  • 2.1. Anatoma y fisiologa visual.

    13

    Las clulas horizontales unen los fotorreceptores y las clulas bipolares

    mediante conexiones relativamente largas y paralelas a las capas de la retina. Las

    clulas amacrinas funcionan de forma similar pero como puente de unin entre clulas

    bipolares y ganglionares.

    Las clulas bipolares pueden recibir la informacin directamente de los conos y

    bastones o a travs de las clulas horizontales y posteriormente se manda a las clulas

    ganglionares o bien de forma directa o a travs de las clulas amacrinas. La

    informacin, por tanto, puede seguir diversos caminos dentro del conexionado de las

    distintas clulas retinianas.

    Este esquema general es vlido para toda la retina con algunas puntualizaciones.

    En la fvea cada cono se conecta con una clula bipolar y esta a su vez con una

    ganglionar siguiendo el camino ms directo. A medida que nos alejamos de la fvea

    ms receptores convergern en clulas bipolares y mayor nmero de estas en

    ganglionares.

    Figura 2.3: Seccin simplificada de la retina (longitud aproximada de de mm).

    Las clulas bipolares se dividen en dos clases: de centro off y on. Se debe

    aclarar que las nicas clulas que disparan impulsos en la retina son las ganglionares, y

    al hablar aqu de centro on u off nos referimos a si responden a la luz o a la

    oscuridad. As, el proceso da comienzo en los receptores, que se encuentran activos en

    FOTORRECEPTOR

    HORIZONTALES

    BIPOLARES

    AMACRINAS

    GANGLIONALES

    AL NERVIO OPTICO

    LUZ

  • 2.1. Anatoma y fisiologa visual.

    14

    la oscuridad (la luz los hiperpolariza apagndolos). Entre el receptor y la clula bipolar

    de centro on aparece una sinapsis inhibidora que mantiene la clula inactiva en la

    oscuridad, y la luz, apagando el receptor, elimina esta inhibicin de la clula haciendo

    que se liberen neurotransmisores en los terminales de la misma. Si la clula bipolar es

    de centro off, la sinapsis es excitadora, la clula est activada en la oscuridad y

    disminuye la liberacin de neurotransmisores cuando se somete a la luz. La periferia de

    este tipo de clulas se origina a travs de la informacin que suministran las clulas

    horizontales que tienen sinapsis excitadoras con las bipolares on e inhibidoras con las

    off (efecto de la luz en la periferia excitador).

    De las clulas amacrinas se conocen ms de 20 tipos diferentes en cuanto a su

    anatoma y pueden desarrollar diversas funciones entre las que se encuentran respuestas

    especficas a objetos en movimiento.

    Las clulas ganglionares tienen un comportamiento similar a las bipolares y se

    han identificado tambin dos clases: clulas ganglionares de centro encendido

    (excitadoras u on) y clulas de centro apagado (inhibidoras u off). Las clulas

    ganglionares de centro encendido se activan cuando el centro de su campo receptor se

    encuentra excitado y la periferia del mismo no. En las clulas de centro apagado

    suceder a la inversa. De esta manera, si las dos partes del campo receptor reciben el

    tipo de estimulacin que necesitan, sus efectos se suman y se alcanza un nivel de

    activacin mximo en la ganglionar, pero si el estmulo produce efectos opuestos en el

    centro y en la periferia, las dos regiones compiten entre s y la clula ganglionar

    correspondiente se mantiene casi inactiva. Esta interaccin es conocida como inhibicin

    lateral. La inhibicin lateral es uno de los procesos ms importantes en la explicacin

    de muchos fenmenos perceptivos, y en concreto, este particular funcionamiento hace

    que ya en las primeras etapas de la visin se pierda prcticamente la informacin de

    intensidad luminosa en niveles absolutos, a favor de una percepcin del contraste.

    De la descripcin que se ha hecho hasta ahora se podra pensar que los campos

    receptores forman un mosaico de pequeos crculos retinianos, pero no es as, los

    campos receptores de clulas ganglionares vecinas se solapan como puede apreciarse en

    la figura 2.4 b. Un fotorreceptor puede influir sobre varias clulas ganglionares estando

    situado en el centro del campo receptor de algunas y en la periferia de otras. Por tanto,

  • 2.1. Anatoma y fisiologa visual.

    15

    excitar a varias clulas a travs de sus centros si son clulas de centro encendido y a

    travs de sus periferias si son clulas de centro apagado.

    Figura 2.4: Campos receptores. a. Campos receptores de clula ganglionar de centro

    encendido y centro apagado respectivamente. b. Campos receptores de dos clulas ganglionares vecinas.

    Adems, los campos receptores difieren en tamao de una clula ganglionar a

    otra. En concreto, los centros de los campos receptores son ms pequeos en la fvea y

    se hacen mayores a medida que nos alejamos de ella. Esto, nuevamente, explica el

    hecho de que nuestra agudeza visual, la capacidad de distinguir objetos pequeos, sea

    mayor en la fvea. El tamao del campo receptor est pues relacionado con la

    frecuencia espacial de forma que clulas con campos receptores grandes respondern a

    bajas frecuencias espaciales y viceversa. De acuerdo con esto se puede hacer una nueva

    clasificacin de las clulas ganglionares en magno (10% clulas) que son las que poseen

    campos receptores grandes y parvo (90% clulas) con un campo receptor pequeo. Las

    clulas magno responden al movimiento y a objetos grandes, son rpidas y de alta

    sensibilidad al contraste. Las parvo son lentas y estn implicadas en la deteccin del

    color y del detalle.

    En conclusin, los mensajes que el ojo enva hacia el cerebro a travs del nervio

    ptico tienen poco que ver con intensidad absoluta ya que las clulas ganglionares no

    responden bien a cambios de luz difusa. Lo que la clula seala es el resultado de una

    comparacin entre la cantidad de luz que impacta en un cierto punto de la retina con la

    cantidad media de luz que ilumina su periferia inmediata. Esto permite ver el mismo

    objeto en condiciones de iluminacin completamente distintas. Por ejemplo, si leemos

    un peridico a plena luz del sol o en una habitacin poco iluminada lo que vemos son

    letras negras sobre un fondo blanco. Sin embargo, si tuvisemos en cuenta la luz que

    a b

  • 2.1. Anatoma y fisiologa visual.

    16

    reflejan, las letras negras a plena luz reflejaran ms que el papel blanco en la

    habitacin.

    2.1.3. Vas visuales. Integracin de la informacin en la corteza.

    La va visual de un cerebro humano es el camino que sigue la informacin visual

    desde el ojo hasta que llega a la corteza visual primaria.

    Figura 2.5: Vas pticas hacia la corteza visual. Las fibras que salen del ojo formando el nervio ptico llegan sin interrupcin al

    quiasma ptico y a partir de ah se dirigen a distintas zonas del cerebro. La mayora de

    ellas (80% aproximadamente) enva la informacin a travs del tracto ptico al ncleo

    geniculado lateral, el resto es informacin para el control de funciones de movimiento

    ocular y reflejo pupilar a la luz (cerebro medio, colculo superior) y tambin para

    procesos de sincronizacin de ritmos biolgicos (hipotlamo).

    En el quiasma ptico se cruzan los nervios pticos de forma que a cada ncleo

    geniculado lateral le llega informacin procedente de ambos ojos pero que se

    corresponde con la mitad del campo visual opuesta. Es decir, al ncleo geniculado

    lateral derecho le llega toda la informacin visual correspondiente con el campo visual

    izquierdo. El campo visual es la zona del espacio que puede ser percibida para una

    posicin fija del ojo. El campo visual izquierdo se refiere a la zona del espacio a la

    izquierda del punto al que estemos mirando. De esta forma, cada hemisferio cerebral se

    encarga de la mitad opuesta del entorno.

  • 2.1. Anatoma y fisiologa visual.

    17

    Cada cuerpo geniculado lateral se encuentra dividido en 6 capas y una clula de

    una capa cualquiera recibe informacin de un solo ojo. As, por ejemplo, en el caso del

    cuerpo geniculado lateral izquierdo la secuencia al ir de arriba hacia abajo sera:

    proyeccin de la hemirretina izquierda del ojo derecho, izquierdo, derecho, izquierdo,

    izquierdo y derecho.

    Figura 2.6: Seccin de cuerpo geniculado lateral. Adems, como puede apreciarse en la figura 2.6, las capas se pueden dividir en

    parvocelulares (dorsales) y magnocelulares (ventrales) segn el tamao de las clulas

    que las forman y su respuesta al estmulo visual. Las capas se encuentran alineadas

    segn la zona del campo visual o ms concretamente de la zona de la retina de la que

    reciben la informacin, es decir, las conexiones estn organizadas topogrficamente.

    Esta representacin topogrfica tambin se mantendr en la corteza visual primaria. As

    si se produjera alguna lesin en una porcin pequea de la corteza visual se

    correspondera con una ceguera en algn punto del campo visual.

    La informacin visual sale de los cuerpos geniculados laterales mediante unas

    bandas anchas denominadas radiaciones pticas que la encaminan hasta la corteza

    visual primaria (V1). La corteza visual primaria es una capa de clulas de unos 2mm

    de grosor en la parte occipital del cerebro. Contiene aproximadamente 200 millones de

    clulas frente a los 1,5 del cuerpo geniculado lateral. Estas clulas fueron clasificadas

    por Hubel [16] en clulas simples y complejas.

    Parvocelulares

    Magnocelulares

  • 2.1. Anatoma y fisiologa visual.

    18

    Las clulas simples tienen campos receptores de tipo on y off pero con

    patrones de excitacin e inhibicin como los mostrados en la figura 2.7 a. Estmulos que

    cubran una mayor rea excitadora darn lugar a mayores respuestas y los que cubran

    regiones excitadoras e inhibidoras a la vez producirn respuestas menores puesto que

    hay una cancelacin mutua. Estas clulas poseen, adems, tres o cuatro geometras

    diferentes con todas las orientaciones y posiciones dentro del campo visual posibles.

    Son, por tanto, las primeras clulas que presentan sensibilidad a la orientacin.

    Las clulas complejas son mucho ms numerosas que las simples, constituyendo

    el 75% [16] de las clulas de la corteza visual primaria. Responden a estmulos lineales

    orientados estacionarios y en movimiento (donde presentan una mayor respuesta). Una

    clula compleja recibe informacin de varias simples de la misma orientacin y cuyos

    campos receptores se solapan sobre el campo recetor de la clula compleja como

    muestra la figura 2.7 b. Si una lnea excita una clula simple se producir una respuesta

    en la compleja, si la lnea est en movimiento, la activacin sucesiva de clulas simples

    hace que la respuesta en la clula compleja sea sostenida. Adems, entre un 10% y un

    20% de las clulas complejas de la corteza visual primaria muestran una fuerte

    selectividad direccional. En algunas clulas de la corteza aparece un efecto de

    inhibicin final. Este fenmeno consiste en que la clula responde mximamente a una

    lnea con una determinada longitud y hacerla mayor no aumentar la respuesta. Una

    explicacin para las clulas con inhibicin final sera la aferencia de clulas complejas

    excitadoras e inhibidoras sobre otras clulas complejas [16].

    Figura 2.7: Campos receptores. a. Mapas tpicos de campos receptores de clulas simples. b. Posible campo receptor y diagrama de conexin de clula compleja.

    Clulas simples

    Clulas complejas

    a b

  • 2.1. Anatoma y fisiologa visual.

    19

    Finalmente, y por primera vez en todo el proceso de percepcin, aparecen

    clulas en la corteza visual primaria que reciben aferencias de ambos ojos, es decir, hay

    una convergencia binocular que permitir construir una nica imagen de la escena. En

    general todas las gradaciones de dominancia ocular relativa estn presentes (desde

    clulas monopolizadas por el ojo izquierdo pasando por clulas con igual influencia de

    ambos ojos hasta clulas con respuesta al ojo derecho).

    La corteza visual primaria se estratifica en 6 capas. Las ms densas son la 4C y

    la 6 mientras que la 1 apenas contiene clulas nerviosas y est formada en su mayor

    parte por axones. En la figura 2.8 se pueden observar las principales conexiones

    efectuadas entre el cuerpo geniculado lateral y las distintas capas de la corteza visual

    primaria, as como las conexiones entre capas y con otras regiones del cerebro.

    Figura 2.8: Estructura e interconexiones en la corteza visual primaria.

    Las clulas que forman la corteza visual primaria se encuentran dispuestas en

    columnas verticales relacionadas con la orientacin del estmulo. Adems, se produce

    tambin una agrupacin de clulas sensibles a una determinada frecuencia espacial. Se

    configuran as detectores de frecuencia espacialmente orientada con las clulas del V1.

    Se debe tener en cuenta que hay tambin otras capas de la corteza (desde V2 a V5) que

    participan en el proceso visual realizando diversas tareas. As, por ejemplo, la zona V4

    estara relacionada con el procesamiento del color.

    1

    2, 3

    4A

    4B

    5

    4C

    6

    Capas Magnocelulares

    Capas Parvocelulares

    Otras reas de la corteza

    Estructuras profundas del cerebro

  • 2.2. Propiedades de la visin.

    20

    En conclusin, el sistema visual humano que se ha descrito es modular y

    paralelo. Se podran diferenciar bsicamente tres etapas. La primera de ellas sera la

    ptica (equivalente a un enfoque), la segunda la retiniana (transduccin de la seal

    luminosa en determinados impulsos elctricos) y finalmente el procesado cerebral.

    2.2. Propiedades de la visin.

    A continuacin se van a analizar algunos de los mecanismos ms relevantes de

    la visin. Se pretende realizar una caracterizacin del SVH en cuanto a su sensibilidad y

    respuesta al estmulo.

    2.2.1. Adaptacin visual. Sensibilidad a la intensidad luminosa.

    La magnitud del estmulo percibido por el cerebro ser mayor cuanto mayor sea

    la magnitud del estmulo luminoso que se proyecta en la retina. En este apartado se

    examinar cmo es esta relacin y qu rango abarca.

    El rango de niveles de intensidad luminosa que se presentan en la naturaleza y a

    los que el SVH se tiene que adaptar es muy amplio, alrededor de 1010. Sin embargo,

    simultneamente, el SVH es capaz de discriminar slo unos pocos niveles. La

    adaptacin se realiza para un nivel de intensidad luminosa Io dentro de todos los

    posibles del rango. Para este Io, se pueden discriminar unos 50 valores distintos de

    intensidad luminosa. Por tanto, habr un nivel por debajo del cual no se distingan otros

    niveles, que se veran como negro y de igual forma suceder con la percepcin del

    blanco. A medida que el ojo recorre otros niveles Io del rango total, va definiendo

    niveles de negro y blanco de forma anloga.

    La adaptacin proporciona la capacidad de ver en condiciones de muy distinta

    iluminacin. A pesar de ello, hay que tener en cuenta que la percepcin visual va a

    variar mucho dependiendo de la iluminacin con la que nos encontremos. As, como ya

    se ha comentado, en condiciones de baja iluminacin se detectan muy bien las

    diferencias de luminosidad, pero la distincin del color y del detalle es pobre y suceder

  • 2.2. Propiedades de la visin.

    21

    justo al contrario en condiciones de elevada luminosidad. Adems, el proceso de

    adaptacin que realiza el SVH no es instantneo y es ms costosa temporalmente la

    adaptacin de luz a oscuridad.

    En cuanto a la relacin entre el estmulo percibido y el valor real del mismo se

    obtiene una respuesta no lineal. Para calcularla se considera una zona iluminada con una

    intensidad I y otra con I+I, como muestra la figura 2.9 a. Se va a medir el valor

    necesario de I para que el observador vea dos zonas diferenciadas partiendo de un I

    inicial igual a cero. El valor as obtenido de I es la mnima diferencia notable (JND).

    Este experimento se realiza sobre un amplio margen de intensidades (en visin fotpica,

    con valores sobre 10 cd/m2) dando como resultado la curva de la figura 2.9 b. Se

    observa una relacin II constante y de valor 0.02 que no depende del nivel de

    intensidad en el que se trabaja.

    Figura 2.9: Medida de la respuesta del SVH a cambios de intensidad.

    Si nos planteamos la misma medida pero para las condiciones indicadas por la

    figura 2.9 c. obtenemos curvas de respuesta que son constantes en un margen mucho

    menor pero que para un valor fijado Ioi es comparable al margen dinmico de muchos

    sistemas de procesado electrnico de imgenes.

    a b

    c d

  • 2.2. Propiedades de la visin.

    22

    A la relacin cteII=

    se le conoce como ley de Weber y se verifica tambin

    para otros sentidos como el odo, el olfato, el gusto y el tacto. Este resultado es de

    especial inters en el estudio de la percepcin de ruido en imgenes. Basndonos en l

    podemos explicar porqu un nivel uniforme de ruido aleatorio es menos visible en las

    regiones ms luminosas de la imagen. As, para que el ruido sea perceptible con un

    fondo de imagen de nivel de intensidad luminosa I1 ser preciso un valor I1 y para un

    I2 < I1 entonces el valor I2

  • 2.2. Propiedades de la visin.

    23

    Figura 2.10: Fenmenos relativos al procesamiento de contraste. a. Bandas de Mach. b. Contraste simultneo.

    El problema se ha resuelto en primer lugar con imgenes simples (patrones)

    como por ejemplo funciones sinusoidales o discos de luminancia. Para este tipo de

    imgenes se utilizan dos definiciones de contraste diferentes. Por una parte, Michelson

    defini el contraste de este tipo de imgenes como:

    minmax

    minmax

    LLLL

    CMichelson +

    =

    donde Lmax y Lmin son los valores mximos y mnimos de luminancia. Weber propone

    otra definicin para medir el contraste local de un objeto simple (blanco) sobre un fondo

    uniforme:

    LLCWeber

    =

    donde L es el incremento o decremento de la luminancia del blanco comparada con la

    luminancia del fondo L.

    La diferencia entre ambas definiciones es clara y se hace ms obvia si

    expresamos el contraste de Michelson en la siguiente forma:

    LLLCMichelson +

    =

    donde L = (Lmax - Lmin)/2 y L = Lmin. Estas dos medidas de contraste no coinciden a

    pesar de que pueden proporcionar valores parecidos para estmulos simples de bajo

    contraste y ambas definen el contraste como un radio adimensional de la variacin de

    luminancia respecto a la luminancia media de fondo. Sin embargo para contrastes ms

    elevados obtenemos dos medidas de contraste diferentes y lo que es ms, estas dos

  • 2.2. Propiedades de la visin.

    24

    definiciones ni siquiera comparten el mismo rango. Mientras que el CMichelson tiene un

    margen de valores entre 0 y 1 el CWeber vara entre -1 e .

    Adems, se plantean otros problemas derivados del hecho de que tanto el

    CMichelson como el CWeber se definen para imgenes simples y de forma global. En

    imgenes ms complejas sera ms apropiada una definicin local del contraste puesto

    que la luminancia (y con ella tambin el contraste) vara en toda la imagen. Por tanto,

    las frmulas anteriores no sern validas para el clculo de contraste en imgenes

    complejas como las que se tratan en cualquier modelo de visin. Estas medidas tampoco

    tienen en cuenta que la sensibilidad al contraste del SVH es dependiente de la

    frecuencia, sobre todo si nos encontramos en condiciones umbrales de visibilidad.

    Para solucionar estos problemas Peli [23] propone un clculo del contraste por

    bandas de frecuencia. Es un contraste local y limitado en banda que tiene en cuenta el

    nivel medio de luminancia local para la obtencin de un valor en cada punto. Puesto que

    el clculo del contraste se efecta por bandas es necesario disponer primero de una

    versin filtrada de la imagen. Ms adelante se tendrn en cuenta las distintas

    implementaciones que se pueden hacer al realizar este banco de filtros y la importancia

    que pueda tener esta eleccin. El contraste en una banda frecuencial k determinada se

    representa por:

    ( )),(),(

    ,jiljib

    jiC kk

    Peli =

    donde bk(i,j) es la imagen filtrada para una determinada banda k y l(i,j) es una versin

    paso bajo de la imagen que contiene toda la energa por debajo de la banda k en la que

    se est realizando el clculo del contraste. Obtenemos de esta forma un valor de

    contraste que no slo depende de la energa en esa banda sino tambin de la luminancia

    de fondo local. La frmula as planteada no tendra en cuenta la distinta sensibilidad al

    contraste del SVH dependiendo de la orientacin, por lo que se podra ampliar sin ms

    que hacer un filtrado de la imagen para distintas frecuencias y orientaciones.

    Otras posibles mtricas de contraste para imgenes complejas realizan una

    modificacin del contraste de Michelson adaptndolo al filtrado previo de la imagen

    como se muestra en la siguiente ecuacin:

  • 2.2. Propiedades de la visin.

    25

    ( )k

    kkk b

    bjibjiC

    =

    ),(,

    donde bk(i,j) es la imagen filtrada para una banda k y bk es la media de esa banda. El

    problema que plantea esta redefinicin del contraste es que esta media es cero para

    todas las bandas de frecuencia excepto para la banda base. Por ello, se deben hacer

    algunas modificaciones a esta frmula. Daly [7] propone un clculo global y otro local

    del contraste:

    ( )K

    kkGlobal b

    jibjiC

    ),(, = ( )

    ),(),(

    ,jibjib

    jiCK

    kkLocal

    =

    donde bK(i,j) es la banda base y Kb es la media de la misma.

    El contraste en un pxel de una imagen determinada tambin puede calcularse en

    funcin de la luminancia de los pxeles que hay en su vecindario. Esta tcnica [29]

    considera los valores mximos y mnimos de luminancia en los pxeles vecinos a la

    izquierda y derecha del pxel para el que se calcula el contraste. Tanto en este caso,

    como en todos los anteriores, se debe tener en cuenta que la definicin que se hace del

    contraste debe ser consecuente con la implementacin del modelo visual que se est

    llevando a cabo as como con el objetivo que va a tener este modelado.

    Finalmente, una vez expuesta la variedad de medidas de contraste de las que se

    dispone, quedara por preguntarse cul de ellas tiene una mayor correspondencia con la

    percepcin del contraste del SVH. Para ello se hace necesario el uso de test psicofsicos

    que evalen esta relacin. Este tipo de comparativa se estudi en [24] entre las mtricas

    propuestas por Michelson, King-Smith y Kulikowski ( fondofondoKK lllC /)( max = ) y una

    modificacin del contraste de Peli sugerida por Lubin. Los patrones que se utilizaron

    son Gabores y el resultado de los tests realizados mantiene que la frmula de Peli para

    el clculo del contraste es la que mejor se adapta a los resultados subjetivos.

    2.2.3. Sensibilidad en frecuencia.

    El estudio de la anatoma y fisiologa del SVH ha permitido que se conozca que

    la percepcin del estmulo depende de la frecuencia del mismo. Tradicionalmente una

    de las caracterizaciones ms importantes que se hacen del SVH consiste en la mxima

  • 2.2. Propiedades de la visin.

    26

    frecuencia que es capaz de detectar o diferenciar y que se denomina agudeza visual.

    Este dato proporciona nicamente un lmite y es insuficiente si se quiere conocer la

    variacin en la detectabilidad de un estmulo en funcin de su frecuencia espacial. Con

    este objetivo se empez a medir la funcin de sensibilidad al contraste (CSF) que refleja

    la sensibilidad o capacidad de deteccin del SVH a estmulos de distinta frecuencia. La

    CSF fue determinada por primera vez en 1956 por Schade pero su uso no se generaliz

    hasta que las tcnicas de Fourier empiezan a utilizarse en visin en los aos 70.

    Puesto que lo que se pretende medir es la respuesta del SVH a distintas

    frecuencias, el procedimiento de medida consistira en mantener un estmulo de

    contraste constante y variarlo en frecuencia para ver como el SVH atena cada

    frecuencia. Sin embargo, esto resulta imposible puesto que no podemos medir el

    contraste de la imagen percibida por lo que es necesario realizar el procedimiento justo

    al contrario. La medida se realiza para cada frecuencia variando el contraste del

    estmulo de entrada y lo que mantenemos constante es la salida, es decir, la imagen

    percibida.

    Un procedimiento experimental para calcular la CSF consistira, por ejemplo, en

    ir reduciendo el contraste de un estmulo sinusoidal en el que la luminancia media se

    mantiene constante hasta que se alcanza el umbral (el estmulo deja de ser visible). El

    inverso de este valor umbral es el valor de la sensibilidad para esa frecuencia. Al

    realizar este proceso para las diferentes frecuencias obtenemos la CSF. Se pueden hacer

    varias consideraciones sobre este mtodo de medida. En primer lugar, la CSF as

    calculada sera vlida para estmulos simples, no para imgenes complejas. Aunque

    cualquier estmulo complejo pueda ser analizado como una serie de estmulos

    sinusoidales, el problema reside en que el SVH es no lineal y por ello, la respuesta

    obtenida vara y no se puede calcular como una combinacin lineal. En segundo lugar,

    este mtodo es de clculo de umbrales de deteccin y es vlido slo en condiciones

    umbral, la forma de la CSF para condiciones por encima del umbral no se corresponde

    con esta medida. Para condiciones por encima del umbral habra que llevar a cabo otro

    tipo de tests, con el inconveniente de que son experimentos menos estables y de mayor

    dificultad de medida, por lo que no suelen utilizarse.

    Existen muchas medidas experimentales de la CSF, la mayora de ellas para

    estmulos monocromticos. En [22] se dispone de un resumen de algunas de las CSFs

  • 2.2. Propiedades de la visin.

    27

    existentes y los parmetros que se han tenido en cuenta en la medida. La forma tpica de

    la CSF puede observarse en la figura 2.11 y es la de un filtro paso banda con un pico

    que se sita entre los 4 y 8 ciclos/grado para niveles de iluminacin fotpicos. Se

    produce una fuerte atenuacin en altas frecuencias debida a factores pticos como

    imperfecciones en la crnea y cristalina, difracciones en la pupila Adems, el

    muestreo espacial que realizan los fotorreceptores de la retina impone un lmite a partir

    del cual no se detectan frecuencias espaciales mayores (agudeza visual). La atenuacin

    que aparece en bajas frecuencias se debe a las interacciones inhibitorias de centro-

    periferia que se producen en los campos receptores. La medida del valor de la CSF en

    frecuencia cero es imposible para el mtodo de medida que se ha explicado con

    anterioridad y segn los parmetros que se hayan escogido al realizar los experimentos

    para la obtencin de la CSF se dar una frecuencia mnima a partir de la cual se empieza

    a medir.

    Figura 2.11: CSF del sistema visual (Campbell & Green, 1965). La forma que la CSF adopta depende de muy diversos parmetros. Por una parte

    habra que considerar los parmetros del estmulo que se presenta para la medida y las

    condiciones en las que esta se realiza y por otra los que son inherentes al sistema visual.

    La descripcin e importancia de los mismos ha sido analizada de diversa manera en

    muchos estudios [1, 22, 26] y a continuacin se enumeran brevemente comentando

    cmo afectan a la CSF.

    Nmero de ciclos presentes en el test: este parmetro afecta a la zona de bajas

    frecuencias. Se ha comprobado que existe un nmero de ciclos crticos por debajo del

    cual la visibilidad del estmulo aumenta si aumentamos el nmero de ciclos que se le

  • 2.2. Propiedades de la visin.

    28

    presentan al observador y este efecto no depender de la frecuencia espacial. Por tanto,

    puesto que el tamao del test suele ser fijo para todas las frecuencias que se miden en el

    experimento el problema se plantear precisamente en bajas frecuencias donde no se

    representa el suficiente nmero de ciclos para que la medida sea independiente de este

    efecto. Para corregirlo se debe variar el tamao del test en bajas frecuencias para que el

    nmero de periodos de la seal representada est por encima de este valor crtico, al

    hacerlo se obtienen curvas de CSF con caracterstica paso bajo en lugar de paso banda.

    Luminancia: influye notablemente en el aspecto de la curva. La sensibilidad

    aumenta al aumentar la luminancia media, el pico de la CSF se desplaza hacia

    frecuencias mayores y la agudeza visual es mayor. As, con niveles de iluminacin

    bajos (menores de 10 cd/m2), la curva se acerca ms a un paso bajo con un pico de

    sensibilidad en torno a 1 2 ciclos/grado y para niveles mayores de luminosidad

    presenta una caracterstica paso banda con el pico alrededor de 6 ciclos/grado.

    Tamao del test: si se incrementa el tamao la sensibilidad aumentar. Esto

    sucede hasta que se alcanza un valor crtico a partir del cual aunque aumentemos ms el

    tamao del test no se obtiene una mayor sensibilidad (considerando que hay un nmero

    de ciclos suficientes para que la medida sea correcta). El tamao crtico depender de la

    frecuencia [22] y se ha demostrado que no tiene efecto sobre la medida para valores de

    contraste por encima de 01. Adems, la extensin espacial del estmulo dentro del rea

    de medida (ocupacin total o parcial de la misma) modifica tambin la forma de la

    curva [26].

    Orientacin: la CSF es una funcin anistropa. La sensibilidad es mayor para

    estmulos orientados horizontalmente o verticalmente que para orientaciones oblicuas

    (45). Este efecto oblicuo no repercute en bajas frecuencias y se hace patente para

    valores de frecuencia espacial mayores de 10 ciclos/grado tpicamente.

    Excentricidad: como norma general la CSF suele determinarse para visin en la

    fvea, donde la sensibilidad es mayor. A medida que aumenta la excentricidad la

    sensibilidad al contraste decrece y este decrecimiento es ms rpido cuanto mayor es la

    frecuencia espacial del estmulo.

    Color: si calculamos la CSF para el rojo, verde y azul obtenemos tres curvas

    diferenciadas y que son distintas de la CSF acromtica.

  • 2.2. Propiedades de la visin.

    29

    Tiempo de exposicin: cuanto mayor sea el tiempo del que dispone el observador

    para determinar el umbral, la sensibilidad obtenida ser mayor. Esto sucede hasta que se

    alcanza un valor (unos cientos de msg) a partir del cual ya no surge este efecto.

    Presentacin temporal del estmulo: para presentaciones graduales del estmulo la

    CSF presenta una caracterstica ms paso banda y con un valor de pico algo mayor que

    en presentaciones del estmulo abruptas

    Frecuencia temporal: lleva a un concepto de CSF espacio-temporal. La CSF

    espacial es mayor para frecuencias temporales medias (3 a 10 ciclos/sg) y decrece a

    ambos lados.

    Parmetros inherentes al observador: son la posicin de mejor enfoque del ojo, el

    tamao de la pupila y la edad. Al variarlos estamos analizando sistemas diferentes y por

    tanto obtendremos curvas de sensibilidad distintas.

    Otro parmetro de importancia en el clculo de la CSF es la distancia de

    observacin para la que se realizan las medidas, ya que esto va a fijar la frecuencia

    espacial del estmulo, expresada en unidades de ciclos por grado. Si el observador se

    aleja de la imagen, un periodo del estmulo va a corresponder a un ngulo visual menor

    y por tanto la frecuencia espacial representada ser mayor sin que se haya modificado

    en nada el estmulo presentado. Por tanto, las medidas que se toman de la CSF se hacen

    para una distancia de observacin determinada.

    Es necesario destacar que aunque se ha expuesto nicamente y de forma muy

    sencilla un mtodo de medida de la CSF umbral, ste, por supuesto, no es el nico

    mtodo de medida. Existe una gran variedad de mtodos entre los que se encuentran los

    tests impresos [1], que aunque no son muy precisos tienen como ventaja su gran

    sencillez. Adems, dentro de la medida de CSF umbral se pueden seguir distintos

    mtodos psicofsicos. En definitiva, la eleccin de uno u otro mtodo depender de la

    aplicacin en la que se vaya a utilizar la CSF y de la precisin o las caractersticas

    especiales que se requieran para la misma. As, un posible uso de la CSF sera, por

    ejemplo, la deteccin y seguimiento de algunas afecciones visuales que tienen un efecto

    determinado en la forma de la curva, y que presenta como ventaja que es un mtodo no

    invasivo y de deteccin temprana. En este caso bastara con medir la CSF para el

    paciente bajo observacin. Otra posible utilizacin de la CSF, sera dentro de un

  • 2.2. Propiedades de la visin.

    30

    modelado del SVH genrico, lo que reviste una mayor complejidad puesto que no existe

    una CSF universal. Ms adelante, en la aplicacin de la CSF dentro de modelos

    visuales para el anlisis de la calidad se vern algunos de los problemas que se plantean

    derivados de este hecho.

    2.2.4. Enmascaramiento.

    El enmascaramiento es el fenmeno por el cual disminuye la visibilidad de una

    seal en presencia de otra que esconde o enmascara a la primera. No se debe olvidar que

    el mtodo utilizado para la obtencin de los umbrales de visibilidad trabaja con

    estmulos muy simples de una sola frecuencia y sobre campos de intensidad constante.

    Desde este punto de partida, el enmascaramiento es un paso ms de complejidad en el

    modelado del SVH que ha sido observado y estudiado ampliamente por fisilogos y

    psicofsicos.

    El objetivo principal ser conocer cmo varan los umbrales de visibilidad del

    estmulo cuando se encuentran en el entorno cambios espaciales y tambin temporales

    de luminancia. Se dan entonces dos fenmenos de enmascaramiento claramente

    diferenciados:

    Enmascaramiento temporal: asociado a la reduccin visual que se produce sobre

    el estmulo cuando est rodeado de cambios temporales de luminancia. El estudio de

    este tipo de enmascaramiento es complicado debido a que habra que tener en cuenta las

    caractersticas de movimiento del ojo, es decir, hay una dependencia con la velocidad de

    movimiento retiniana. Adems, habra que considerar si el estmulo en movimiento es

    seguido o no por el ojo, lo que depende del inters particular del observador, siendo esto

    muy difcil de analizar.

    Por otra parte, est demostrado que cuando hay un cambio de escena, la

    resolucin espacial puede ser reducida drsticamente sin que se llegue a percibir

    siempre que se restablezca la resolucin original en un periodo breve de tiempo (en

    torno a 100 msg).

  • 2.2. Propiedades de la visin.

    31

    Enmascaramiento espacial: est asociado a los cambios espaciales de luminancia

    que se producen alrededor del estmulo. Recibe tambin el nombre de enmascaramiento

    de contraste ya que el efecto del enmascaramiento ser menor en regiones uniformes

    que en zonas de gran contraste. As, si se considera cualquier imagen natural a la que se

    le aade un ruido aleatorio uniforme, la visibilidad del ruido en los bordes y texturas

    que presenta la imagen ser menor que en zonas uniformes.

    El fenmeno del enmascaramiento espacial se estudia mediante test psicofsicos

    en los que se evala la influencia del contraste, de la frecuencia y de la orientacin tanto

    del estmulo (enmascarado) como de la seal de fondo (mscara). Las seales utilizadas

    suelen ser sinusoides y Gabores. Estos experimentos han demostrado que el umbral de

    deteccin que proporcionaba la CSF va incrementando a medida que el efecto del

    enmascaramiento se hace mayor, lo que ocurre cuando el contraste de la seal que

    enmascara se aumenta.

    El comportamiento tpico se muestra en la figura 2.12. CT representa el valor de

    contraste para que el estmulo sea visible y CM el contraste de la seal que enmascara.

    Para un valor pequeo de CM, el umbral de visibilidad del estmulo CT viene dado por la

    CSF y se representa como C0. Este valor se mantiene hasta que se alcanza un punto en

    el que CM = C0. A partir de ah un incremento en CM hace que se eleve el umbral de

    deteccin, es decir, se necesitara aumentar el contraste del estmulo para que fuera

    visible. La lnea discontinua de la figura ha sido observada en algunos de los

    experimentos psicofsicos y proporciona una medida por debajo del valor dado por la

    CSF, sin embargo, este efecto slo se observa cuando la seal y el ruido estn en fase.

    Figura 2.12: Curva de umbrales de elevacin causados por enmascaramiento espacial.

    C0

    C0 log CM

    log CT

  • 2.3. Movimientos oculares y atencin visual.

    32

    El valor de la pendiente depende tanto de la complejidad y conocimiento del

    estmulo que se tengan, como del tipo de seal utilizada para el enmascaramiento. Si se

    conocen datos de la orientacin, tamao, frecuencia y localizacin del estmulo ser ms

    fcil reconocerlo y por tanto la pendiente de la curva ser menor. El valor de vara

    entre 06 y 1 dependiendo de que el tipo de seal utilizada para el enmascaramiento sea

    una sinusoide o un ruido limitado en banda. Adems, aparece un efecto de aprendizaje.

    Si a un observador se le muestra el mismo patrn de ruido repetidas veces, el valor de

    decae puesto que ser capaz de reconocerlo con un valor menor de contraste.

    La frecuencia espacial y la orientacin tambin influyen en el grado de

    enmascaramiento, que ser mximo cuando se produzca una coincidencia entre la

    frecuencia de la seal que enmascara y el estmulo enmascarado

    2.3. Movimientos oculares y atencin visual.

    La cantidad de informacin con la que debe tratar el SVH y que se encuentra en

    el entorno visual hace que sean necesarios mecanismos selectores de informacin. As,

    la atencin puede ser considerada como un conjunto de redes de reas neuronales que

    llevan a cabo operaciones especficas de procesamiento de informacin. Dentro de estas

    operaciones especficas se encontrara la deteccin o seleccin de objetivos dentro de la

    escena, que se corresponder con determinados movimientos oculares.

    Si se analiza la forma que tienen los ojos de explorar el entorno visual se van a

    encontrar tres tipos de movimientos oculares, atendiendo a la funcionalidad de los

    mismos:

    1) Movimientos para el mantenimiento de la mirada: son aquellos que compensan

    el movimiento de la cabeza o de los objetos para que permanezca la mirada fija sobre el

    objeto.

    2) Movimientos para el desplazamiento de la mirada: permiten pasar la atencin de

    un objeto a otro. Fundamentalmente, se dan tres tipos: sacdicos, persecuciones o de

    seguimiento y vergencias.

    3) Movimientos de fijacin o micromovimientos: trmores, microsacdicos y

    fluctuaciones.

  • 2.3. Movimientos oculares y atencin visual.

    33

    Si se considera el proceso seguido al visualizar una imagen esttica se observa un

    primer paso en el que se fija la posicin de un objeto o detalle por un breve periodo de

    tiempo (100-500 msg) para, posteriormente, realizar un salto a una nueva posicin, este

    salto es el que se ha denominado movimiento sacdico. Por tanto, la exploracin visual

    que se hace de una escena esttica no es un movimiento continuo como cabra esperar,

    sino una sucesin de saltos de un punto de inters a otro. Adems, cuando se tiene fijada

    una posicin los ojos no permanecen quietos, se realizan movimientos muy pequeos y

    constantes, microsacdicos. Estos micromovimientos son continuados y de direccin

    aleatoria y su importancia radica en que permiten que se vean los objetos estacionarios.

    De hecho si se mantuviese una imagen estable en la retina, en vez de obtener una mayor

    agudeza visual (se evitara el emborronamiento asociado al movimiento de la imagen

    que producen los movimientos oculares), lo que sucede es que los receptores de la retina

    se saturan y la imagen desaparece.

    La particular forma de ver imgenes estticas dando saltos de un punto de la

    imagen a otra hace que se ponga de manifiesto la importancia que tiene el estudio de la

    atencin visual. De hecho, aunque es posible prestar atencin a una parte de la escena

    sin que se produzca un movimiento ocular, el caso contrario es imposible: cualquier

    movimiento sacdico viene precedido por un cambio de atencin a esa posicin

    concreta. As, parece poco probable que en la visualizacin de una imagen, se haga un

    salto al vaco, es decir, en una sacada se fije un punto que corresponde con fondo o con

    un punto que carece de cambios abruptos de luminancia.

    El estudio de la atencin visual controlando los puntos de parada de la visin

    resulta de gran inters y proporciona gran cantidad de informacin acerca de los objetos

    y detalles que son relevantes para el observador. Los factores que influyen en la

    atencin visual [26] son muchos y variados, entre ellos se pueden destacar el tamao,

    color, contraste, forma, bordes, texturas y por supuesto el movimiento.

    Se han descrito brevemente los movimientos oculares y su relacin con el

    proceso de atencin y los factores que influyen en el mismo ya que su incorporacin a

    los modelos del SVH puede resultar de gran inters en su aplicacin a mtricas de

    calidad perceptible.

  • 34

    Evaluacin de la calidad en imgenes.

    En este captulo se har un breve repaso de algunos de los modelos existentes de

    medida de calidad de imagen, comentando su estructura bsica y los distintos problemas

    y ventajas que llevan asociados. Es necesario, para ello, definir previamente algunos

    conceptos elementales que sentarn las bases sobre las que se han construido estos

    modelos de medida. Se llevar a cabo, por tanto, una primera serie de definiciones y

    clasificaciones de los modelos, que despus ser desarrollada en posteriores apartados

    con ms detalle. En cualquier caso, no es un anlisis en profundidad de los diferentes

    modelos, sino una explicacin breve con los detalles de mayor relevancia dentro de cada

    mtodo particular. Se proporciona as un marco general en el que se circunscribe este

    proyecto y para una compresin ms completa de los diferentes modelos que existen en

    la literatura se debe consultar la bibliografa.

    Por otra parte, se pretende dar una visin general en cuanto al tipo de

    distorsiones con las que van a tratar estos mtodos, haciendo especial hincapi en la

    compresin de imgenes y las tcnicas de marcado de agua. Se va a explicar en qu

    consisten estas tcnicas y cmo afectan a la imagen en cuanto a los artefactos que se

    generan. Esto es necesario no slo porque en este proyecto se van a tratar precisamente

    este tipo de imgenes, sino tambin por la relevancia que tienen estndares como JPEG

    o JPEG2000 y la importancia que estn adquiriendo en mbitos diversos las marcas de

    agua.

  • 3.1. Calidad de imagen. Clasificacin de mtodos de medida.

    35

    3.1. Calidad de imagen. Clasificacin de mtodos de medida.

    En primer lugar, se debe establecer una definicin de calidad de imagen. Es

    imprescindible comprender lo que significa este trmino para el observador ya que la

    forma de disear los modelos de medida se debe corresponder previamente con lo que

    se entiende por calidad. Se define calidad como propiedad o conjunto de propiedades

    inherentes a una cosa. Este concepto, llevado a imgenes, se entendera como la

    capacidad que una imagen tiene de representar el objeto original, es decir, la exactitud o

    parecido entre ambos. Dentro de los modelos de medida de calidad, en lugar de tener

    una imagen y un objeto, la definicin se extiende a dos imgenes de las cuales una es

    considerada la de referencia u original (hace las veces de objeto) y otra sobre la que se

    ha efectuado alguna operacin de compresin, marcado de agua, etc. En este caso, la

    medida de calidad de imagen es una medida de semejanza entre la imagen original y la

    distorsionada. Por tanto, para poder evaluar la calidad de una imagen en todos los

    modelos que aparecen en este captulo ser necesario disponer de la imagen original. El

    desarrollo de modelos de medida de calidad en los que no exista imagen de referencia, o

    slo exista parcialmente, es realmente dificultoso y est fuera del contexto de este

    proyecto, aunque el sistema visual sea capaz de ello.

    La definicin de calidad de imagen que se ha dado corresponde con lo que se

    conoce comnmente como fidelidad de imagen y presenta tambin algunos

    inconvenientes. En realidad, no est claro que la visibilidad del error est relacionada

    con prdida de calidad y de hecho, algunas distorsiones que pueden ser claramente

    visibles no son, a pesar de ello, molestas al observador. Por ejemplo, si se considera la

    medida de calidad entre dos imgenes, una de las cuales es la multiplicacin de los

    valores de luminancia de la otra imagen por un factor global, la diferencia visual entre

    ambas ser obvia aunque el observador no aprecie tal diferencia como prdida de

    calidad.

    En segundo lugar, en cuanto a la clasificacin de los modelos de medida, se van

    a diferenciar dos grupos principales: mtricas de calidad de imagen subjetivas

    (utilizando observadores) y objetivas (medidas matemticas). Dentro de las objetivas se

    har una nueva clasificacin atendiendo nicamente a si se incorpora o no el SVH

  • 3.1. Calidad de imagen. Clasificacin de mtodos de medida.

    36

    descrito previamente en el captulo 2. As, la clasificacin resultante quedar como

    muestra el siguiente esquema:

    Los modelos de medida de error obtienen una medida de calidad sin tener en

    cuenta las caractersticas especiales del SVH. Esta sera una medida objetiva, relativa a

    la diferencia entre las imgenes en s y no a nuestro modo de percibir. En un segundo

    grupo se incluyen aquellos que incorporan en mayor o menor medida las caractersticas

    propias del SVH y denominamos a este segundo grupo modelos de medida de calidad

    perceptible. Finalmente, se hace un tercer grupo de modelos hbridos de medida de

    calidad, en el que se describen algunos mtodos de medida que a pesar de no incluir un

    modelo de SVH tratan de obtener valores que se adecuen a la calidad que el observador

    percibe explotando otras cualidades relativas a la percepcin.

    Por ltimo, se van a enumerar algunas de las caractersticas o propiedades de los

    modelos de calidad sobre las que se puede evaluar la bondad del mtodo seleccionado.

    Entre ellas se pueden destacar las siguientes:

    Velocidad: es deseable que el valor de calidad que resulta de la

    utilizacin del mtodo se obtenga de forma rpida. Esto adquiere un especial inters

    cuando se va a hacer uso de la medida de calidad para mejorar los procesos o

    algoritmos de compresin, cuantificacin...

    Coste: el computacional depende de la velocidad y de la complejidad de

    los algoritmos para la obtencin de un resultado. Adems, se deben considerar otros

    costes adicionales ya que para la validacin o evaluacin del mtodo es necesario llevar

    a cabo test psicofsicos que tienen una serie de requisitos temporales y tambin en

    cuanto a nmero y caractersticas de los observadores.

    - Modelos de medida de calidad de imagen

    Subjetivos

    Objetivos

    De error

    De calidad perceptible

    Hbridos

  • 3.2. Modelos de calidad de imagen subjetivos.

    37

    Complejidad: est estrechamente ligada con la velocidad y el coste. Lo

    ideal sera encontrar un mtodo lo ms sencillo posible que diese una medida de calidad

    igual a la percibida. En general, resultados ms prximos a los obtenidos por un

    observador se consiguen al incorporar caractersticas propias del SVH, lo que

    forzosamente implica que el mtodo sea complejo.

    Portabilidad: los resultados que proporciona el mtodo no deben alterarse

    si se repiten las medidas en diferentes entornos o tiempos.

    Precisin: referida a como representa el resultado del mtodo de medida

    la percepcin de calidad que tendra el observador.

    Robustez: se pretende obtener resultados vlidos sobre un amplio margen

    de variacin de los parmetros asociados a la medida (tipo de imagen, tipo de

    distorsin, condiciones de visibilidad, etc.), es decir, se buscan mtodos robustos.

    Forma del resultado: pueden ser valores numricos (ndices de calidad) o

    mapas de visibilidad del error. Segn la aplicacin a la que est destinado un mtodo de

    medida ser conveniente una forma u otra y en general, lo ideal es que el mtodo pueda

    proporcionar ambas salidas.

    3.2. Modelos de calidad de imagen subjetivos.

    Los modelos de medida subjetivos son aquellos en los que el valor de calidad es

    evaluado directamente por un observador al que se le muestran las imgenes. En la

    recomendacin ITU-R BT.500-10 (Methodology for the subjective assessment of the

    quality of televisin pictures) [17] se regulan algunos de los test para la evaluacin

    subjetiva de imgenes estticas y de video. La norma incluye criterios para la seleccin

    del material de test y de los observadores, las condiciones de visibilidad, los

    procedimientos de evaluacin y el anlisis de los datos. Los tres procedimientos de

    evaluacin ms comunes son:

    Escala de artefactos por doble estmulo (DSIS). Se muestra a los

    observadores la imagen o secuencia original seguida de la distorsionada una sola vez. Se

    pide a los observadores que califiquen la imagen o secuencia que presenta los artefactos

    con respecto a la original dentro de una escala discreta compuesta por cinco valores:

  • 3.2. Modelos de calidad de imagen subjetivos.

    38

    imperceptible, perceptible pero no molesto, ligeramente molesto, molesto y muy

    molesto.

    Doble estmulo y escala continua de calidad (DSCQS). Se muestra a los

    observadores dos imgenes o secuencias, una de ellas de referencia y la otra test. El

    orden en el que aparecen es aleatorio, no sabiendo el observador cual de ellas es la

    referencia. Adems, el par de imgenes o secuencias se presenta varias veces antes de

    que el observador emita su valoracin. sta consiste en puntuar ambas imgenes dentro

    de una escala continua dividida en secciones a las que se les adjudica los calificativos:

    excelente, buena, justa, pobre y mala. La escala numrica equivalente es de 0 a 100 y se

    computan las diferencias dentro de cada par de imgenes evaluadas. Esta diferencia

    hace que se elimine parte de la subjetividad referida a la experiencia y al contenido de la

    imagen.

    Estmulo simple y evaluacin de calidad continua (SSCQE). Se muestra

    a los observadores un programa de entre 20 y 30 minutos de duracin que ha sido

    procesado por el sistema bajo test. La referencia no se muestra y se evala la calidad

    instantnea percibida de forma continua en una escala DSCQS. Esta tcnica se

    introduce para evaluar imgenes en las que la calidad vara con el tiempo y depende de

    la escena (compresin digital de video).

    La utilizacin de uno u otro mtodo depende del problema que se pretende

    evaluar. La norma muestra una tabla con algunos de los problemas ms usuales y los

    test que llevaran asociados. As, el mtodo DSIS es usado para medir la robustez de un

    sistema, es decir, para evaluar distorsiones visibles como pueden ser los artefactos

    causados por errores de transmisin. El mtodo de DSCQS evala un sistema con

    respecto a otro de referencia y funciona bien para calidades similares ya que es bastante

    sensitivo a las pequeas diferencias. El SSCQE sirve, por ejemplo, para medir la

    fidelidad entre dos secuencias de video distorsionadas.

    Una de las principales caractersticas de estos mtodos es que son los que dan un

    valor de calidad ms preciso en la actualidad puesto que ste se saca directamente de la

    opinin del observador. Sin embargo, la realizacin de este tipo de test lleva asociado

    diversos inconvenientes y se debe tener en cuenta que en los datos obtenidos siempre

    habr un cierto grado de error. A continuacin se enumeran varios de los problemas que

    plantea su utilizacin:

  • 3.2. Modelos de calidad de imagen subjetivos.

    39

    - Suponen un coste elevado en tiempo y personas. Conseguir un conjunto de resultados aceptable puede llevar varias