gestion de almacenamiento

53
CAPITULO 12 Datos y Gestión de Almacenamiento

Upload: edgarutn2011

Post on 29-Jun-2015

4.590 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Gestion de almacenamiento

CAPITULO 12

Datos y Gestión de Almacenamiento

Page 2: Gestion de almacenamiento

Datos y Gestión de Almacenamiento

Los DBMS se basan en archivos para almacenar datos, y estos archivos, o conjuntos de datos, residen en medios de almacenamiento, o dispositivos. Una buena parte del trabajo del DBA implicará la planificación para el almacenamiento real de la base de datos.

Page 3: Gestion de almacenamiento

Conceptos básicos de administración de almacenamiento

Algunas tecnologías de almacenamiento son más adecuadas que otras.Sin embargo, la naturaleza mecánica de la unidad de disco los hace más vulnerables al fracaso de los componentes de otro equipo. Además, las formas en que las unidades de disco son utilizados por las bases de datos pueden hacer que la gestión del almacenamiento impredecibles, como la barra lateral "Modern DBMS de uso de disco“

Puede usarse RAID para mejorar la seguridad de los datos.

Page 4: Gestion de almacenamiento

Conceptos básicos de administración de almacenamiento

Para aplicaciones de misión crítica la integridad de los datos puede ser más importante que la disponibilidad de datos. Si el soporte es poco fiable y un fallo de las causas de corrupción de datos, los datos perdidos pueden ser más de un problema que el tiempo de inactividad. Es imperativo, por tanto, que las soluciones de almacenamiento de base de datos para protegerlos a toda costa. La recuperación de datos desde medios de almacenamiento lleva mucho más tiempo en completarse que la recuperación de datos desde la memoria caché o la memoria.

Page 5: Gestion de almacenamiento

Conceptos básicos de administración de almacenamiento

El rendimiento de la base de datos depende de la entrada y salida a disco.La cantidad de datos almacenados es mayor que nunca antes, y los datos se almacenados por más tiempo.

Page 6: Gestion de almacenamiento

Uso del disco con un moderno DBMS

DBA debe estar preparado para los picos de uso del disco.Algunos DBMS permiten al tamaño de los archivos temporales de expandirse y contraerse de forma automática. Dependiendo del tipo y la naturaleza de las operaciones de base de datos en proceso, esta fluctuación puede provocar picos de uso del disco.

Page 7: Gestion de almacenamiento

Uso del disco con un moderno DBMS

El crecimiento de la capacidad de almacenamiento aumenta aún más la complejidad de la gestión de datos y bases de datos. Muchas organizaciones están implementando nuevas tecnologías de almacenamiento, tales como almacenamiento en red (NAS) y redes de área de almacenamiento (SAN), para ayudar a controlar la cantidad cada vez mayor de almacenamiento necesario para los usos modernos. La gestión del almacenamiento en el entorno dinámico de hoy es una tarea difícil DBA.

Page 8: Gestion de almacenamiento

Uso del disco con un moderno DBMS

Almacenamiento de datos y termología de sus tamaños.

Page 9: Gestion de almacenamiento

Metas del Plan de Almacenamiento

Prevenir la pérdida de datos. Asegurar adecuada capacidad,

escalable. Rápido acceso sin interrupciones. Soluciones tolerantes a fallos y de

rápida reparación. Adición de reemplazo de disco sin

offline. Costo beneficio adecuado a la empresa.

Page 10: Gestion de almacenamiento

Los archivos y conjuntos de datos

Hay muchos problemas de almacenamiento que deben ser resueltos antes de que un DBA puede crear una base de datos. Uno de los temas más importantes es la cantidad de espacio para permitir la base de datos.El cálculo espacial debe tener en cuenta no sólo tablas, índices, sino también, y dependiendo del DBMS, el registro de transacciones. Cada una de estas entidades probablemente requerirá un archivo separado o conjunto de datos, para el almacenamiento persistente.

Page 11: Gestion de almacenamiento

Los archivos y conjuntos de datos

Base de datos de almacenamiento y archivos de datos 

Page 12: Gestion de almacenamiento

Los archivos y conjuntos de datos

El DBA debe separar en diferentes discos a los archivos para: Mejorar el rendimiento. Separar índices de datos. Aislar los logos en otro disco. Colocar los datos en varios

dispositivos para facilitar el acceso en paralelo.

Page 13: Gestion de almacenamiento

Archivo de ubicación en el disco

El DBA debe determinar la ubicación óptima de los archivos en dispositivos de disco. A veces, el DBA puede conseguir mejoras de rendimiento con sólo mover archivos de un dispositivo de disco físico a otro. Eje: Colocar archivos de datos e índices en discos separados.

Colocar los datos que se accede por las mismas operaciones por separado en los dispositivos de disco físico es otra técnica de colocación de archivos comunes y proporciona el mismo tipo de ventaja en el rendimiento como la separación de los índices de datos.

Page 14: Gestion de almacenamiento

Archivo de ubicación en el discoSi el DBMS está utilizando un dispositivo de almacenamiento moderno que crea un disco virtual mediante la difusión de los datos a través de múltiples discos físicos (RAID) la colocación de archivos de forma explícita una pérdida de tiempo.Se puede implementar logs en discos independientes.Comprender los mecanismos que la DBMS utiliza para interactuar con el SO y discos.

Page 15: Gestion de almacenamiento

Sybase Segmentos

Algunas bases de datos ofrecen opciones para controlar el tamaño de las tablas.Para controlar el crecimiento de una tabla, el DBA puede crear en un segmento específico de un tamaño específico. Existen aplicaciones SMS que gestionan la localización de archivos en forma automática.

Page 16: Gestion de almacenamiento

Particiones vs Raw sistemas de archivos

En UNIX se puede asignar particiones RAW porque la escritura es manejada por el DBMS.

Dado que los archivos no fueron asignados con el sistema operativo o el sistema de archivos, no es posible seguir utilizando el sistema operativo y los comandos del sistema de archivos.En UNIX, asegúrese de utilizar particiones RAW para los logs.

Page 17: Gestion de almacenamiento

Archivos temporales de base de datos

Un moderno DBMS proporcionan capacidades para crear objetos de base de datos temporal que sólo existen en el ámbito de una transacción específica. Los objetos temporales de base de datos requieren alguna forma de almacenamiento persistente a corto plazo.Dependiendo del DBMS, el DBA deberá asignar dispositivos de disco y una cantidad de almacenamiento para uso de los objetos de base de datos temporal.

Page 18: Gestion de almacenamiento

Gestión de espacio

Como las modificaciones se aplican a las tablas de base de datos, se debe realizar un monitoreo del almacenamiento. Como DBA, usted debería ser capaz de rastrear el texto siguiente:

Número de extensiones secundarias. Fragmentación. Espacio libre disponible. Segmento o tamaño de la partición. Tablas y los índices asignados por segmento Espacio no utilizado. Objetos fuera de espacio. Borrar objetos en desuso.

Page 19: Gestion de almacenamiento

Gestión de espacio

Si no hay objetos de base de datos no utilizados existen, el DBA debe ampliar el almacenamiento disponible para la base de datos.Se debe aumentar el almacenamiento en la base de datos según las necesidades. Normalmente se utiliza ALTER para aumentar espacio.

Page 20: Gestion de almacenamiento

Datos diseños de página

Cada DBMS utiliza un formato diferente para el tendido de las páginas de los objetos de base de datos.Datos de muestra de Diseño de Páginas.

Page 21: Gestion de almacenamiento

Datos diseños de página

El diseño de página para un objeto de base de datos consta de tres componentes básicos: Encabezado de página.- El encabezado de la página

puede incluir una página de identificación, un identificador que indica la tabla a la que pertenece la página, punteros de espacio libre, y la longitud del registro mínimo de la tabla.

Las líneas de datos.- Las filas no crucen la frontera de la página, excepto para ciertos tipos de datos grandes, como texto, imágenes y otros objetos binarios grandes.

Desplazamiento de la mesa.- Una tabla de desplazamiento puede existir con punteros a cada fila de datos en la página de datos.

Page 22: Gestion de almacenamiento

Asignación de Páginas

El DBMS utiliza una página de asignación para administrar las otras páginas en el objeto de base de datos.Cada página física se asigna a una sola base de datos. Páginas física no necesita ser contiguos en el disco y, de hecho, con frecuencia no lo será. El DBA debe tener en cuenta la existencia de páginas de asignación a los cálculos que realiza el espacio para administrar el almacenamiento utilizado por la base de datos. El DBA necesita saber el número de páginas en cada unidad de asignación que es controlado por cada página de asignación.

Page 23: Gestion de almacenamiento

Diseños de registro de datos

Una tabla se compone de filas y columnas. Cada fila se asigna en un solo bloque (página).Cada registro de la tabla consta de los siguientes elementos: Encabezado de fila. Los datos de fila. Desplazamiento de los cuadro.

Un registro contiene el contenido de una fila de datos, así como los datos de limpieza.

Page 24: Gestion de almacenamiento

Diseños de registro de datos

Para calcular la longitud de la porción de los datos de la fila, el DBA deberá asegurar la documentación que describe la forma de determinar la longitud real, físico para cada tipo de datos soportados por el DBMS. Las siguientes fórmulas se pueden utilizar como directrices generales para el cálculo del tamaño físico de una fila:

Page 25: Gestion de almacenamiento

Diseños de registro de datosDe longitud fija filas:

De longitud variable

Page 26: Gestion de almacenamiento

Diseños de registro de datos

La longitud de una columna depende del tipo de datos de esa columna, cada uno de los documentos DBMS la longitud de los tipos de datos que soporta. Para calcular la longitud de todo el expediente tendrá que encontrar la cantidad de gastos necesarios para el tipo de filas.

Page 27: Gestion de almacenamiento

Cálculo del tamaño de la tabla

Una vez que los diseños de página son conocidos y el DBA puede calcular con precisión longitudes de registro, el cálculo del tamaño de una mesa es fácil. Después de calcular la longitud de registro, el siguiente paso es determinar el número de filas que caben en una página física. Por ejemplo: 32 bytes cada cabecera de página.

Page 28: Gestion de almacenamiento

Cálculo del tamaño de la tabla

Utilice la siguiente fórmula para llegar al número de filas que caben en una sola página de datos:

Utilice la siguiente fórmula para llegar a la cantidad total de espacio requerido para la tabla:

Page 29: Gestion de almacenamiento

Cálculo del tamaño de la tabla

Por supuesto, el DBA deberá tener en cuenta el espacio libre en el que se especifica para la mesa, recuerde al factor de los datos que se almacena externamente del resto de los datos, tales como las columnas de texto en SQL Server o columnas LOB de DB2.

Page 30: Gestion de almacenamiento

Índice de Diseños de Páginas

Las páginas de datos de una tabla no indexada están unidos entre sí con el delantero y atrás los punteros. Una fila de índice único debe ser completamente almacenado en una página de índice único. El registro de índice típico incluye los siguientes elementos: Información de encabezado. Fila longitud. Índice de valores fundamentales. Página puntero. Desplazamiento y modifica las tablas.

Page 31: Gestion de almacenamiento

Cálculo del tamaño Índice

El primer paso para calcular el espacio necesario para almacenar un índice es calcular el tamaño de fila para el índice de uso de una de las siguientes fórmulas:Claves de índice fijo:

Claves de índice variable:

Page 32: Gestion de almacenamiento

Cálculo del tamaño Índice

Para calcular el tamaño de un registro de índice no sólo es necesario el tamaño de la fila. Empiece utilizando la siguiente fórmula para llegar al número de registros que pueden caber en una página de índice único:

Page 33: Gestion de almacenamiento

Cálculo del tamaño Índice

A continuación, puede utilizar las siguientes fórmulas para llegar a la cantidad total de espacio necesario para el índice:

Page 34: Gestion de almacenamiento

Cálculo del tamaño Índice

Y así sucesivamente. Continuar la iteración hasta que el número de páginas es una o menos. En ese momento, se ha alcanzado el nivel raíz del índice. Si se suman los tamaños para cada nivel tendrá como resultado la cantidad total de espacio necesario para almacenar el índice.

Page 35: Gestion de almacenamiento

Los registros de transacciones

El tamaño de los logs depende de la actividad de la base de datos. Si los logs se llenan puede pararse la base de datos.Los DBMS soportan varios logs redundantes. Se debe tener mínimo 2 logs redundantes en diferentes discos. Se puede mantener los logs en disco por al menos 24 horas, luego descargarlos en una cinta. Asegurando el espacio tomando en cuenta el día más activo en la base de datos.

Page 36: Gestion de almacenamiento

Opciones de almacenamiento

Hay varias opciones de almacenamiento disponible de la que el DBA puede elegir, sobre la base de la: Tolerancia a fallos. Los requisitos de rendimiento. Presupuesto.

Page 37: Gestion de almacenamiento

MMDBMS

Los MMDBMS son una tecnología que almacena completamente los datos en memoria. La cinta es también una opción de almacenamiento, como discos ópticos, pero estos son tecnología WORM.

La cinta es utilizada principalmente para fines de copia de seguridad, mientras que el disco óptico es una tecnología de nicho utiliza principalmente para copias de seguridad y almacenamiento de datos en línea.Los dispositivos de disco son los vehículos de almacenamiento predominantes utilizados para el almacenamiento de datos persistente. 

Page 38: Gestion de almacenamiento

RAID

Interrupciones debido a fallas en los medios de comunicación simples a menudo pueden evitarse mediante la aplicación de tecnologías modernas tales como disco RAIDRAID combina varios dispositivos de disco en una matriz.Otro aspecto deseable de arreglos RAID es su capacidad para utilizar las unidades intercambiables en caliente, la matriz no tiene que ser apagado para reemplazar una unidad que ha fallado.

Page 39: Gestion de almacenamiento

Niveles RAID

Los vendedores ofrecen diferentes niveles de apoyo a los niveles de RAID que se han definido. Estos diferentes niveles de disponibilidad de soporte RAID continua a través de combinaciones de funciones de llamada de reflejo, la creación de bandas, y la paridad.Raid 0 también se conoce comúnmente como la creación de bandas en disco. Con RAID-0, los datos se divide en varias unidades, que ofrece un mayor rendimiento de datos. Sin embargo, no hay redundancia. Porque no hay datos redundantes que almacenen, el rendimiento suele ser muy bueno, pero un fallo de cualquier disco de la matriz se traducirá en la pérdida de datos. 

Page 40: Gestion de almacenamiento

Niveles RAID

Figura cortesía de CA y Carolina del Norte

Page 41: Gestion de almacenamiento

Niveles RAID

RAID 1 refiere a veces como reflejo de datos, proporciona una redundancia porque todos los datos se escriben en dos o más unidades.

Cifra correspondiente a 1999 AC cortesía y Carolina del Norte

Page 42: Gestion de almacenamiento

Niveles RAID

RAID 2 proporciona la corrección de errores de codificación. Cifra correspondiente a 1999 AC cortesía y Carolina del Norte

Page 43: Gestion de almacenamiento

Niveles RAID

RAID-3 distribuye los datos a nivel de byte a través de varias unidades, con paridad almacenados en un disco.Cifra correspondiente a 1999 AC cortesía y Carolina del Norte

Page 44: Gestion de almacenamiento

Niveles RAID

Datos RAID-4 rayas en un nivel de bloque a través de varias unidades, con paridad almacenados en una sola unidad.Cifra correspondiente a 1999 AC cortesía y Carolina del Norte

Page 45: Gestion de almacenamiento

Niveles RAID

RAID-5 es similar al RAID-4, pero distribuye la información de paridad entre las unidades.Cifra correspondiente a 1999 AC cortesía y Carolina del Norte

Page 46: Gestion de almacenamiento

Niveles RAID

RAID-6 es básicamente una extensión de RAID-5, sino que proporciona tolerancia a fallos adicionales a través de la utilización de un segundo esquema de paridad distribuido independientes. Cifra correspondiente a 1999 AC cortesía y Carolina del Norte

Page 47: Gestion de almacenamiento

Niveles RAID

RAID-10 es una serie de rayas en la que cada segmento es un array RAID-1. Cifra correspondiente a 1999 AC cortesía y Carolina del Norte

Page 48: Gestion de almacenamiento

Niveles RAID

RAID-53 es un conjunto de rayas en la que cada segmento es un conjunto RAID-3. Por lo tanto, RAID-53 tiene la misma tolerancia a fallos y los gastos generales como RAID-3.Cifra correspondiente a 1999 AC cortesía y Carolina del Norte

Page 49: Gestion de almacenamiento

Niveles RAID

RAID-0 +1 combina la creación de reflejo de RAID-1 con la creación de bandas de RAID-0. Esta pareja el alto rendimiento de RAID-0 con la fiabilidad de RAID-1.

  Cifra correspondiente a 1999 AC cortesía y Carolina del Norte

Page 50: Gestion de almacenamiento

Niveles RAID

Variantes de propiedad y los niveles de RAID han sido definidos por los proveedores de almacenamiento.Elegir el tipo adecuado de almacenamiento RAID para los archivos de base de datos es un aspecto importante del trabajo del DBA. Tenga en cuenta que cada DBMS utiliza archivos de datos, índices y registros de transacciones, cada uno de los cuales sirven para diferentes propósitos y mantener los diferentes niveles de lectura y escritura.

Page 51: Gestion de almacenamiento

Niveles RAID

La configuración óptima de disco para los archivos de la base de datos puede requerir múltiples arreglos RAID en los diferentes niveles. Para fines de evaluación, sin embargo, tenga en cuenta los siguientes consejos: Favorecer los niveles de tolerancia a fallos RAID. Elija el sistema de disco adecuado para el tipo de

actividad de cada objeto de base de datos. Si usted tiene el presupuesto a su disposición,

elija RAID-0 +1, ya que tiene tiempos de lectura, escritura rápida, y tolerancia a fallos.

Page 52: Gestion de almacenamiento

Niveles RAIDNiveles de RAID y rendimiento

Page 53: Gestion de almacenamiento

JBOD

JBOD, que significa sólo un montón de discos, es un término usado para diferenciar las tecnologías tradicionales de la tecnología de almacenamiento en disco más recienteA medida que el entorno de base de datos se vuelve más compleja, sin embargo, las necesidades de almacenamiento se vuelven más complejas.