digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de javier...
DESCRIPTION
Digibis, Digital Libraries, Digitalization, Design, TechnologyTRANSCRIPT
DIGITALIZACIÓN AVANZADA Y
CREACIÓN DE BIBLIOTECAS DIGITALES
Javier Mas García
DIGITALIZACIÓN: CONCEPTOS, CRITERIOS PARA LA DETERMINACIÓN
DE FORMATOS DE DIGITALIZACIÓN, USO DE FICHEROS DE IMAGEN,
EQUIPOS DE CAPTURA Y SOPORTES
• IMAGEN DIGITAL– MAPA DE BITS
– FORMATOS
– RESOLUCIONES
– PROFUNDIDAD DE COLOR
– CONSIDERACIONES Y RECOMENDACIONES PARA LA DIGITALIZACIÓN
• EQUIPOS
– Digitalización de libros y documentos encuadernados
– Digitalización de láminas y fotografías
– Digitalización de planos
– Digitalización de microformas
• ALMACENAMIENTO
• COSTES DE UN PROYECTO DE DIGITALIZACIÓN
Sumario
• Las imágenes digitales se guardan normalmente en forma de mapa de bits o mosaico de píxeles. Cada píxel guarda la información de color de la parte de imagen que ocupa
• Principal inconveniente: la ampliación. Cuando un archivo se amplia mucho, se distorsiona la imagen mostrándose el mosaico con "los píxeles" y una degradación en los colores llegando al efecto pixelación.
DetalleVisualización correcta, imagen al 100% Imagen pixelada
Mapa de bits
Mapa de bits
ELEMENTOS BÁSICOS QUE DEFINEN LA IMAGEN DIGITAL
• Formatos de ficheros de imagen y niveles de compresión• Resolución• Profundidad de color
Consideración sobre los formatos de mapa de bit y la resolución
• Calidad máxima: Mayor resolución / menor compresión / mayor profundidad de bits = mayor peso de fichero
VENTAJAS
Mayor calidad de imagen
Posibilidad de mayor ampliación
DESVENTAJAS
Mayor peso de ficheros y ocupación en los soportes de grabación
Mayor tiempo de apertura de la imagen
Necesidad de una mayor capacidad de los equipos y software de lectura
Mayores costes de producción
• Objetivo: buscar un equilibrio entre la calidad y el peso de la imagen
Formatos de Imagen
FORMATOS Y COMPRESIÓN DE FICHEROS.
Formatos de imagen más comunes
FORMATOS SIN COMPRIMIR. - Ficheros mas estables,- Sin pérdida de calidad- Peso de imagen alto
TIFF, Tagged Image File FormatRAW Imagen “en crudo” PSD Photoshop (Ps)BMP BitMaP o Bit Mapped PicturePDF Portable Document Format
FORMATOS COMPRIMIDOS. - Ficheros mas inestables y más facilmente corrompibles. - Con pérdida mayor o menor de calidad. Algunos formatos permiten la compresión sin pérdida. - Peso de imagen bajo, aptos para publicación o intercambio.
JPEG The Joint Photographers Experts GroupGIF Graphics Interchange FormatPNG Portable Network Graphics
PDF Portable Document FormatTIFF LZWJPEG 2000 Djvu.
Formatos de Imagen
Peso de ficheros
sin comprimir: 39,1 Mb
JPEG, comprimido 5%,calidad máxima,13,4 MbJPEG, comprimido 10%, calidad alta, 5 MbJPEG, JPEG, comprimido 50%, calidad media comprimido 50%, calidad media 1,4 Mb1,4 Mb
GIFF, 8 bits, 256 colores, 7,6 Mb
PNG, sin pérdida, no entrelazado: 22,5PNG, sin pérdida, entrelazado: 27,5
PDF, generado desde TIFF, compresión ZIP, sin perdida. 23,1 MbPDF, generado desde JPEG, calidad max., 13,4 MbPDF, generado desde JPEG, calidad media, 1,4 Mb
Imagen: 20 x 27,5 cms, color RGB, 24 bits
FORMATOS Y COMPRESIÓN DE FICHEROS.
FORMATOS SIN COMPRIMIR. - Ficheros mas estables,- Sin pérdida de calidad- Peso de imagen alto
TIFF, Tagged Image File FormatRAW Imagen “en crudo” PSD Photoshop (Ps)BMP BitMaP o Bit Mapped PicturePDF Portable Document Format
FORMATOS COMPRIMIDOS. - Ficheros mas inestables y más facilmente corrompibles. - Con pérdida mayor o menor de calidad. Algunos formatos permiten la compresión sin pérdida. - Peso de imagen bajo, aptos para publicación o intercambio.
JPEG The Joint Photographers Experts GroupGIF Graphics Interchange FormatPNG Portable Network Graphics
PDF Portable Document FormatTIFF LZWJPEG 2000 Djvu.
Resolución de Imagen
CONCEPTOS
- Resolución, es la cantidad de píxeles o puntos que componen la imagen. La resolución se utiliza también para clasificar casi todos los dispositivos relacionados con las imágenes digitales ya sean escáneres, pantallas de ordenador, cámaras digitales , etc.
- La calidad de resolución de una imagen expresará el número de píxeles que forman la imagen de mapa de bits
- Expresión de la resolución total de una imagen: la resolución o tamaño de una imagen digital se expresa multiplicando su anchura por la altura en pantalla. Por ejemplo la imagen de 1200 x 1200 píxeles = 1.440.000 píxeles, (expresado en Mp megapixel es igual a 1,4 Mp). Conviene tener en cuenta que 1 Megapíxels = 1.000.000 de píxeles.
- La resolución de impresión: define la cantidad de píxeles que contiene una imagen y la dimensión de estos píxeles expresando de qué forma se reparten en el espacio. La resolución expresada en (ppp) o (dpi), son los píxeles por unidad de longitud, es decir, los píxeles por pulgada. (La pulgada mide 2,54 cm).
Así pues, la resolución de impresión es la relación entre las dimensiones digitales (los píxeles) y las físicas; las que tendría una vez impresa sobre papel.
Resolución de Imagen
EJEMPLO DE CALCULO TAMAÑO DE IMPRESIÓN
4285 pixels27,21 cms
5996 pixels38,07 cms
Resolución de imagen: 400 pppTamaño de imágenes: 5996 x 4285(en pixels)
Resolución de impresión
5996/400 = 14,99 pulgadas x 2.54 cms = 38,07 4285/400 = 10,71 pulgadas x 2.54 cms = 27,21
Tamaño de impresión: 38,07 x 27,21 cms
Tamaño de impresión= Número de píxeles/ Resolución (ppp -píxeles por pulgada)
Ejemplo:
Resolución de Imagen
PIXELACIÓN
La ampliación excesiva de la imagen para su visualización, producía en la fotografía tradicional un efecto granulado debido a la falta de nitidez. En la fotografía digital el efecto análogo es de una imagen pixelada .
Si reproducimos una imagen con baja resolución quiere decir que el píxel ocupa más espacio y deforma la imagen con el efecto de pixelación; se crean píxeles de gran tamaño aportando poca definición a la imagen. En cambio si la resolución en ppp, es más alta, existe más detalle y más definición,
Imagen correcta Imagen pixelada
Resolución de Imagen
CONSEJOS SOBRE RESOLUCIONES DE IMAGEN ADECUADAS
* 72 ppp para visualizar documentos en tamaño fijo de pantalla
* Entre 150 y 200 ppp para consulta en pantalla. Permite cierta ampliación y la impresión en impresora; pero a veces se llega hasta los 300 ppp, para dar óptimos resultados imprimiendo con calidad fotográfica a tamaño real (a escala 1:1). Indicado para copias de uso y publicación
* La resolución fotográfica para obtener un fotolito para imprenta se obtiene igualmente una resolución de imagen de 300 dpi y será este el con una resolución de 300 dpi, tamaño suficiente para generar el proceso de fotomecánica e imprenta.
* 400 ppp en imágenes para ficheros de preservación. Permiten una cierta ampliación con calidad fotográfica sobre el tamaño original (p.e para ampliar un detalle de una imagen o para facilitar procesos de restauración digital)
Profundidad de color
COMO GUARDA EL COLOR EL PÍXEL: EL BIT Y EL COLOR
- La profundidad del BIT, profundidad del píxel o profundidad del color, estima los valores que puede llegar a tener cada píxel que forma la imagen. A más cantidad de bits por píxel, más colores, mayor resolución de imagen y mayor tamaño del archivo
- La profundidad del BIT se puede medir en:
1 bit/pixel BIT, blanco o negro8 bits de color y 256 matices de color, monocromo, escala de grises24 bits de color o colores RGB, imágenes en color. 32 bits CMYK, para impresión de las imágenes
Profundidad de color
Imagen color RGB, 400 ppp 24 bits ; 73,6 Mb
Imagen en Binario
1 bit; 3.0 MbImagen en escala de grises
8bits; 24,6 MbImagen en color CMYK,
32 bits; 98,1 Mb
Imágenes sin compresión
Ficheros comprimidos
TIFF LZW : 700 KbTIFF CCIT-G4: 320 Kb
1 bit
JPEG calidad máxima:13,4 MbJPEG calidad media : 4,5 Mb
8bits
JPEG calidad máxima: 31 MbJPEG calidad media: 6,96 Mb
8bits
COMO GUARDA EL COLOR EL PÍXEL: PESO DE LOS FICHEROS
Recomendaciones generales para la digitalización en la creación de colecciones digitales
1. Establecer los fines y objetivos que motivan el proyecto
- preservación del original- impresión (artes gráficas/imprenta o impresora)- edición en soporte óptico (CD, DVD)- integración en un repositorio accesible desde Internet- OCR - copias accesibles desde el disco duro de nuestro ordenador o servidor dentro de un
sistema de gestión de archivo.
2. La copia master deberá permitir obtener el resto de copias derivadas. Realizar la captura de imágenes con calidad suficiente para obterner copias que cubras las distintas necesidades posibles.
3. Analizar el entorno tecnológico de consulta o edición; y la capacidad de almacenamiento y transferencia de datos de los soportes físicos. Los soportes de grabación de las imágenes de preservación (muy pesadas), el entorno de consulta (internet, intranet, DVD, CD), la capacidad de proceso de las imagenes del software de consulta, la velocidad de descarga y de apertura de las imágenes en el entorno de consulta condicionarán los formatos y la resolución que se deba exigir en el proceso de digitalización, teniendo en cuenta la relación: calidad de imagen/peso de ficheros
Recomendaciones generales para la digitalización en la creación de colecciones digitales
4. Escoger formatos normalizados
5. Seguir las Indicaciones y recomendaciones de los grupos de trabajo institucionales nacionales e internacionales afines a nuestro entorno
6. Seguir los estándares dominantes en el mercado
7. Equilibrio entre las prescripciones técnicas, y el entorno tecnológico y presupuesto económico disponible.
Recomendaciones generales para la digitalización en la creación de colecciones digitales
Formatos y resoluciones
Cuadro - resumen
Atendiendo al tipo de material a digitalizar existen diferentes tipos de escáner con prestaciones específicas adecuadas para cada uno.
• I. Escáneres de libros y documentación histórica
– Luz fría.– Captura cenital o aérea.– Posibilidad de trabajar con o sin cristal superpuesto al documento– Base basculante (Bookcradle). Apto para diferentes grosores de libros o
documentos.– Aptos para escanear libros de distintos tamaños. (A4 x2, A3x2, A2x2, A1x2).– Captura lineal o matricial.– Operan de forma manual consiguiendo una productividad alta (variable según
marcas y modelos).– Costes generalmente bastante elevados (entre 20.000 y 90.000 €) y variables
en función del tamaño de los escáneres y de las marcas.
Equipos de captura
Equipos
Proserv ScannTECH A2_A0
Digibook SupraScan I2S A1_A0
Zeutschel OS 10000 A0
• I. Escáneres de libros y documentación histórica, A1 y A0Tamaños A1 y A0Captura linealMuy sofisticados y costosos.
• I. Escáneres de libros y documentación históricaEscáneres tamaño (A3, A2) Captura lineal o matricial, dependiendo marcas y modelosSofisticados pero menos y menos costosos.
Equipos
MIINOLTA PS5000 C
OS 14000 TTOS 12000 C OS 10000 TT
Zeutschel
Book2net - MicroboxCopybook HD I2S
• I. Escáneres de libros y documentación histórica
Para (A4, A3). Existen soluciones menos sofisticadas y más baratas,
Equipos
... y totalmente caseras
ATIZ BookDrive DIY PS5000 C
Equipos
Bookscan APT1200DL 3000 i2S
SupraScan 10000 RGB i2SProserv ScannTECH A0
• II. Escáneres de grandes formatos.
• III. Escáneres automáticos de libros. Muy productivos. NO RECOMENDABLES para patrimonio documental y bibliográfico
Equipos
• IV. Escáneres de microformas. Microfilm / microfichas / tarjetas de apertura
• Manuales.
• Binario/efecto grises por interpolación de puntos
• Automáticos
Binario/escala de grises
ScanPro 2000
MEKEL
SUNRISE
ZEUTSCHEL WICKS & WILSON
OCÉ 3000
NETScan-Eclipse
Equipos
• II. Digitalización de microformas. Microfilm / microfichas / tarjetas de apertura
La digitalización desde microfilm/microficha supone las siguientes
Ventajas:
– Economía de costes, siempre y cuando se pueda trabajar en modo automático. Si implica procesos manuales (por ejemplo recorte manual de imágenes), los costes se equiparan a la digitalización directa
– No se manipula nuevamente el original para su digitalización.
– Permite obtener un copia digital, cuando no se dispone del material original.
Desventajas
- Reproducción de todos los defectos recogidos en el fotograma, manchas, roturas, pliegues, tintas traspasadas, sin posibilidad de corregirlos o atenuarlos.
- La microfilmación no dispone de la imediatez de visualización y control de calidad por lo que, la digitalización desde este soporte añadirá los posibles defectos derivados de este proceso intermedio, tales como:
- Reflejos- Diferencias de iluminación y contraste dentro de la misma imágen - Defectos de la copia utilizada, mancha, rayas, etc. - La ausencia o repetición de imágenes se mantendrá en la copia digital.- Letras empastadas o de trazo debil y difuso (que pueden provocar la ilegibildad del documentos).
Equipos
• II. Digitalización de microformas. Ejemplo de errores arrastrados por falta de calidad de la microfilmación
Problemas
- Manchas producidas por sobreexposición de luz de focos
- Diferencias excesivas de contraste entre claro y oscuro que
impiden hallar una exposición media adecuada para la digitalización
- Exceso de luz y falta de definición en zonas claras
- Exceso de oscuridad con zonas borrosas y empastadas
- En documentos muy grandes, ampliación desenfocada o pixelada
- Hojas delanteras rotas mezclándose imagen de varias páginas
Almacenamiento. Soportes
1. UNIDADES DE CINTA. Para ficheros de preservación y de protección de datos
SDLT
LTO 1
LTO 3
2. DISCO DUROS Externos, conexión USB. Para ficheros de preservación y copias de uso.
3. DVD. Solo recomendable para determinadas publicaciones, para ficheros de datos oalmacenamiento de copias de imagen para uso, de poco peso, en general. En desuso paraalmacenamiento masivo, por su limitada capacidad de almacenamiento, inestabilidad y fragilidad. NO RECOMENDADO, en ningún caso, para copias de preservación
Costes de un proyecto de digitalización
A. LOS COSTES SON EXTREMADAMENTE VARIABLES
B. FACTORES A TENER EN CUENTA :
1. CARACTERÍSTICAS FÍSICAS DEL MATERIAL A TRATAR Soporte físico (papel, pergamino, fotografía), tamaño del documento, encuadernación, estado de conservación
2. RESOLUCIÓN DE ESCANEADO Y EMPLEO DE GRISES o COLOR
3. NIVEL DE INDEXACIÓN DE LA DOCUMENTACIÓN Número de imágenes por unidad documental
4. SEGUIMIENTOS DE PROTOCOLOS DE CALIDAD Y PROCESOS DE EXTRACCIÓN DE METADATOS TÉCNICOS DE LA DIGITALIZACIÓN
5. ESPECIFICACIONES ADICIONALES DE POSTPRODUCCIÓN. - Formatos de imagen requeridos a entregar. Imágenes originales y copias derivadas, para preservación, uso y publicación. - Necesidad o no de aplicar OCR, y formatos de salida de texto - Retoque fotográfico - Preparación imágenes para artes gráficas - Soportes de grabación
7. FORMACIÓN Y ESPECIALIZACIÓN DEL PERSONAL TÉCNICO
Digitalización y creación de Bibliotecas Digitales
FINGRACIAS POR LA ATENCIÓN
Javier Mas GarcíaCoordinador Técnico