manual digitalizacion

Click here to load reader

Post on 18-Dec-2014

472 views

Category:

Documents

0 download

Embed Size (px)

DESCRIPTION

 

TRANSCRIPT

  • 1. Manual de Digitalizacin dedocumentosPalabras clave:SGED Digitalizacin de imagenSistema de Gestin Electrnica de Documentos CCDImagen PMTImagen digital CMOSResolucin de imagen Resolucin ptica e interpoladaDimensin de imagen Velocidad de exploracinProfundidad de imagen Discriminacin texto - imagenRango dinmico de imagen Umbral dinmicoTamao de imagen Extracto de contornoCompresin de imagen Imagen inversaCdigos Huffman Imagen espejoCCITT nfasis de bordesCompresin sin prdida Relleno de huecosCompresin con prdida Supresin de ruidoFormato de imagen Igualacin de zonas irregularesBMP EscnerTIFF Escner planoGIF Escner de rodilloJPEG Escner areoJFIF Escner de filmPHOTO CD Escner de tamborPNG Escner de gran formatoPDF Escner radiolgicoMPEG Externalizacin de digitalizacin Copyright 2004 by Information & Image Management Systems, S.A.
  • 2. Pgina 2 de 25Digitalizacin de documentos TABLA DE CONTENIDOS1. Introduccin2. Parmetros de la imagen digital 2.1. Resolucin 2.2. Dimensiones de la imagen 2.3. Profundidad de bits 2.4. Rango dinmico 2.5. Tamao de archivo 2.6. Compresin 2.7. Formatos del archivo3. Sistemas de Gestin Electrnica de Documentos4. Digitalizacin de documentos 4.1. Proceso de digitalizacin 4.2. Cmo funciona el escner? 4.3. Tipos de escner 4.4. Interfaz escner computador 4.5. Parmetros de escner 4.6. Funcionalidades adicionales del escner en SGED5. Externalizacin de la digitalizacin de documentos 5.1. Externalizacin 5.2. Produccin propia6. Bibliografa
  • 3. Pgina 3 de 25Digitalizacin de documentos1. IntroduccinUn computador solo es capaz de manejar formatos digitales de informacin. Lainformacin puede estar codificada originalmente (cdigos ASCII, EBCDIC, etc), o serde tipo analgica (documento original), que deberemos convertir en una representacindigital que permita ser procesada por un Sistema de Gestin Electrnica deDocumentos (SGED).Las imgenes digitales son fotos electrnicas tomadas de una escena o escaneadas dedocumentos - manuscritos, textos impresos, ilustraciones, fotografas, etc. -. Se realizauna muestra de la imagen y se confecciona un mapa en forma de cuadrcula de puntoselementales (pxeles). A cada pxel se le asigna un valor tonal (negro, blanco, gris,color) el cual est representado por un cdigo binario (ceros y unos). Estos dgitosbinarios (bits) para cada pxel, son almacenados en una secuencia y con frecuenciareducidos a una representacin matemtica (compresin). Luego el computadorinterpreta esta secuencia de bits para reproducir una versin analgica para suvisualizacin o impresin.Este pequeo manual trata de describir los parmetros a considerar de una imagendigital, de las compresiones y los formatos de archivo ms utilizados, y de losperifricos de captura (con detalle de tipos, interfaz, parmetros y funcionalidades) quepermiten conseguir la digitalizacin de imgenes en los SGED.2. Parmetros de la imagen digitalUna imagen digital puede ser representada mediante una matriz bidimensional denmeros. En la Figura 1 se muestra una imagen original y su representacin en unamatriz de puntos bitonales (pxeles), en los que el negro se representa como 0 y elblanco se representa como 1. Figura 1.- Imagen original y su representacin binaria
  • 4. Pgina 4 de 25Digitalizacin de documentos2.1. ResolucinLa resolucin es la frecuencia espacial a la cual se realiza la muestra de una imagendigital. La medida de la resolucin se determina por el nmero de pxeles ledos en unadistancia lineal de una pulgada (2,54 cm) en el documento digitalizado.Las unidades mas utilizadas son puntos por pulgada - ppp - (dots per inch - dpi -), opxeles por pulgada - ppp - (pixels per inch - ppi -). Las resoluciones de digitalizacinde documentos estn normalmente en el rango de 50 a 600 ppp.Las resoluciones de escaneado ms frecuentemente utilizadas en documentos blanco ynegro en SGED son 200, 300 y 400 ppp. En la digitalizacin de imgenes color de altacalidad, son tpicas resoluciones de 1.200 a 2.400 ppp.En la Figura 2 se muestra una ilustracin a resoluciones de 100, 200 y 300 ppp. Lasmejoras en las imgenes de mayor resolucin son apreciables. Figura 2.- Ilustracin a resolucin de 100, 200 y 300 ppp.2.2. Dimensiones de la imagenLas dimensiones de la imagen son las medidas horizontales y verticales de la misma,expresadas en pxeles. Pueden determinarse multiplicando tanto el ancho como laaltura de la imagen (medido en pulgadas) por la resolucin en ppp.Por ejemplo, una pgina A4 en blanco y negro, digitalizada a resolucin de 300 ppp,tendr una dimensin total de:
  • 5. Pgina 5 de 25Digitalizacin de documentosA4 = 21,0 cm x 29,7 cm Ancho: 21,0 cm = 8,27 => 8,27 x 300 ppp = 2.500 pxeles Alto: 29,7 cm = 11,69 => 11,69 x 300 ppp = 3.500 pxelesDimensin total A4: 2.500 x 3.500 = 8.750.000 pixeles2.3. Profundidad de bitsLa profundidad de bits de una imagen digitalizada se determina por la cantidad de bitsutilizados para definir cada pxel. As pues, la profundidad se mide en bits/pxel.Cuanto mayor sea la profundidad de bits, tanto mayor ser la cantidad de tonos quepuedan ser representados. Las imgenes digitales se pueden digitalizar en blanco ynegro (en forma bitonal), a escala de grises o a color.Una imagen bitonal est representada por pxeles que constan de 1 bit cada uno, quepueden representar dos tonos, utilizando los valores 0 para el negro y 1 para elblanco.Una imagen a escala de grises est compuesta por pxeles representados por mltiplesbits de informacin, que tpicamente varan entre 2 a 8 bits. En el caso de imagenmdica radiolgica de alta calidad, es normal utilizar profundidad de 12 bits/pxel; lacantidad de tonos representables es entonces de 212 = 4.096 niveles de grises.Una imagen a color est tpicamente representada por una profundidad de bits entre 8y 24. En una imagen de 24 bits, los bits por lo general estn divididos en tres grupos(RGB): 8 para el rojo (Red), 8 para el verde (Green), y 8 para el azul (Blue). Pararepresentar otros colores se utilizan combinaciones de esos bits. Una imagen de 24 bitsofrece 16,7 millones (224) de valores de color.Para impresin en color de alta calidad se utiliza una profundidad de bits suficiente paraconseguir la reproduccin cuatricromtica. Los cuatro colores de proceso (CMYK) de 8bits cada uno, totalizan 32 bits de profundidad: cian (Cian), magenta (Magenta)En Figura 3, distinguimos tres imgenes digitales: bitonal (1 bit), escala de grises (8bits) y color (24 bits).
  • 6. Pgina 6 de 25Digitalizacin de documentos Figura 3.- Imgenes bitonal, escala de grises y colorClculos binarios para la cantidad de tonos representados por profundidades de bitscomunes: 1 bit (21) = 2 tonos 2 2 bits (2 ) = 4 tonos 3 3 bits (2 ) = 8 tonos 4 4 bits (2 ) = 16 tonos 8 8 bits (2 ) = 256 tonos 10 bits (210) = 1.024 tonos 12 bits (212) = 4.096 tonos 14 bits (214) = 16.384 tonos 16 bits (216) = 65.536 tonos 24 24 bits (2 ) = 16,7 millones de tonos 32 32 bits (2 ) = 4.295 millones de tonos
  • 7. Pgina 7 de 25Digitalizacin de documentos2.4. Rango dinmicoRango dinmico es el rango de diferencia tonal entre la parte ms clara y la ms oscurade una imagen. Cuanto ms alto sea el rango dinmico, se pueden potencialmenterepresentar ms matices, a pesar de que el rango dinmico no se correlaciona en formaautomtica con la cantidad