data warehouse

Download Data warehouse

Post on 30-Oct-2014

458 views

Category:

Documents

1 download

Embed Size (px)

DESCRIPTION

 

TRANSCRIPT

  • 1. Una introduccin a la nuevas caractersticas de Almacn de datos escalabilidad de SQL Server 2008 R2
    (Abstraccin)

2. Mapa de las nuevas caractersticas de almacenamiento de datos
3. Latabla anterior muestra las caractersticas de escalabilidad de nuevo en SQL Server 2008 R2, y donde se ayudan con las actividades que rodean a su almacn de datos.
Este whitepaper describe brevemente las mejoras en el almacenamiento de datos en cada uno de los diferentes componentes de SQL Server 2008 R2, y cmo pueden ayudarle a sacar el mximo partido de su almacn de datos.
4. SQL Server Relational DBMS Data Warehouse Improvements
El SQL Server 2008 R2 relacional DBMS contiene avances importantes respecto a versiones anteriores, por lo que funciona mejor cuando usted crea, gestiona y consulta los almacenes de datos de gran tamao.En esta seccin se detalla en el DBMS relacional mejoras de almacenamiento de datos en la Tabla 1.
5. Star Join
Con modelados dimensionales de almacenes de datos, una gran parte de su carga de trabajo suele consistir en lo que se conoce como la estrella de consultas de unin.Estas consultas siguen un patrn comn que se une a la tabla de hechos con una o varias tablas de dimensiones.Adems, la combinacin en estrella consultas suelen expresar las condiciones de filtro contra las columnas sin clave de las tablas de dimensiones y realizar una agregacin (por lo general SUM) en una columna de la tabla de hechos (denominada columna demedida).Con SQL Server 2008 R2, que experimentar importantes mejoras de rendimiento para la estrella de muchas consultas de unin de ese proceso una fraccin significativa de las filas tabla de hechos.
6. 7. Partitioned Table Parallelism
Elparalelismo tabla particionada(PTP) en SQL Server 2008 R2.Aplicaciones de almacenamiento de datos suele reunir grandes cantidades de datos histricos en las tablas de hechos, que a menudo son divididas por la fecha.En SQL Server 2005, las consultas que tocan ms de una particin usa un thread (y por lo tanto un ncleo del procesador) por particin.A veces, esto limita el rendimiento de las consultas que implican las tablas con particiones, especialmente cuando se ejecuta en paralelo con varios procesadores de memoria compartida (SMP) con ncleos de procesador.
8. 9. La figura anteriorilustra el impacto de paralelismo tabla con particiones en un escenario tpico de almacenamiento de datos.
Consulta Q resume las ventas de ms de siete das.La consulta se puede tocar particiones diferentes segn el momento en que se ejecuta.Esto se ilustra en la consulta Q1, que toca una sola particin P2 y Q2, que toca dos particiones ya que los datos pertinentes en el momento de la ejecucin se extiende por P3 y P4.
10. Partition-Aligned Indexed Views
Particin de las vistas indizadas alineadas le permiten crear y gestionar los agregados de resumen en su almacn de datos relacionales de manera ms eficiente, y utilizarlos en situaciones en las que no podra usarlos con eficacia antes, la mejora de rendimiento de las consultas.
Cuando se cambia en una particin nueva tabla, las particiones de los puntos de vista coincidentes alineadas por particin ndice definido en la tabla con particiones tambin cambian, de forma automtica.
La particin alineados funcin de las vistas indizadas en SQL Server 2008 R2 le ofrece las ventajas de las vistas indizadas en tablas con particiones grandes, evitando al mismo tiempo el costo de la reconstruccin de los agregados en toda una tabla con particiones.Estos beneficios incluyen el mantenimiento automtico de los agregados, y se pongan vista indizada (reescritura de la consulta automtica de utilizar los agregados para resolver las consultas que se refieren slo a las tablas base, no los agregados).Para ms detalles sobre las vistas indizadas
11. La siguiente figura muestra cmo se mueven los agregados con las particiones de la tabla base cuando se cambia de una particin.
12. GROUPING SETS
GROUPING SETS le permiten escribir una consulta que produce varias agrupaciones y devuelve un solo conjunto de resultados.El conjunto de resultados es equivalente a una UNION ALL de filas agrupadas de manera diferente.Mediante el uso de GROUPING SETS, usted puede concentrarse en los diferentes niveles de informacin (grupos) en sus necesidades de negocio, en lugar de la mecnica de cmo combinar varios resultados de la consulta.
13. Salida de una consulta GROUPING SETS, con formato de tabla dinmica
14. MERGE
La instruccin MERGE le permite utilizar varios lenguajes de manipulacin de bases de datos (DML) (INSERT, UPDATE y DELETE) en una tabla o vista en una sola instruccin Transact-SQL.La tabla o vista de destino est unido a una fuente de datos y las operaciones de DML se realizan en los resultados de la unin.
La instruccin MERGE tiene tres clusulas WHEN, cada una de ellas le permite realizar una accin especfica de DML en una fila determinada en el conjunto de resultados
15. Para cada fila que existe tanto en el objetivo y la fuente, la clusula WHEN MATCHED le permite actualizar o eliminar la fila en la tabla de destino.
Por cada fila que existe en el origen pero no en el de destino, el CUANDO que no se repite la clusula le permite insertar una fila en el blanco.
Para cada fila que existe en el destino pero no en la fuente, la clusula WHEN FUENTE que no se repite le permite actualizar o eliminar la fila en la tabla de destino
Tambin se puede especificar una condicin de bsqueda con cada una de las clusulas WHEN para elegir el tipo de operacin de DML se debe realizar en la fila.La clusula de salida para la instruccin MERGE incluye una nueva columna virtual llamadoaction,que se puede utilizar para identificar la accin DML que se llev a cabo en cada fila
16. Change Data Capture
La captura de datoses una de las caractersticas de los nuevos datos de seguimiento introduce en SQL Server 2008 R2.Diseado principalmente para escenarios de data warehousing, la captura de datos proporciona un mecanismo eficaz para rastrear y recopilar datos de los cambios realizados en las tablas de usuario y le proporciona acceso a modificar los datos en un formato relacional.
La informacin auxiliar se reunieron junto con los datos de cambio permite captura de datos modificados para dar respuesta a una serie de preguntas.
aqu hay una serie de preguntas para las que la captura de datos puede proporcionar las respuestas de manera eficiente:
17. Quiero que todas las filas que han cambiado entre las 12:00 am y 12:00 pm
Necesito saber si un cambio es una insercin, actualizacin o eliminacin.
Para una fila actualizada, me gustara saber en qu columna (s) modificado.
La captura de datos que proporciona una forma muy eficiente para extraer los cambios de manera gradual, reduciendo el tiempo general de procesamiento ETL.
El siguiente diagrama proporciona una visin general de los componentes que conforman la captura de datos.
18. 19. Minimally Logged INSERT
En general, cuando se escriben datos en una base de datos de usuario, debe escribir en el disco dos veces: una para el registro, y una vez a la propia base de datos.Esto es porque el sistema de base de datos utiliza un undo / redo log por lo que puede deshacer o rehacer operaciones cuando sea necesario.
Esto es lo que la nueva funcin de registro mnimo INSERTAR hace en SQL Server 2008 R2.Un factor de 2 o ms aceleracin es comn con el registro mnimo en comparacin con el registro completo.Sus resultados dependern de su aplicacin y el hardware.
Las operaciones que se registra al mnimo en SQL Server 2005 incluye las operaciones de importacin masiva, SELECT INTO, y la creacin de ndices y la reconstruccin.SQL Server 2008 R2 extiende la optimizacin de INSERT INTO ... SELECT FROM T-SQL operaciones que insertan un gran nmero de filas en una tabla de destino existente en esa tabla es un montn que no tiene ndices no agrupados, y la sugerencia TABLOCK se utiliza en el objetivo.
20. Data Compression
La caracterstica de compresin de datos en SQL Server 2008 R2 reduce el tamao de tablas, ndices o un subconjunto de las particiones de almacenamiento de longitud fija los tipos de datos en formato de almacenamiento de variables longitud y por reducir los datos redundantes.
SQL Server ofrece dos tipos de compresin de la siguiente manera:
CompresinROWpermite el almacenamiento de tipos de longitud fija en formato variable de almacenamiento de longitud.
LacompresinPAGE se construye en la parte superior de la compresin de fila.Reduce al mnimo el almacenamiento de datos redundantes en la pgina mediante el almacenamiento de patrones de bytes que ocurren comnmente en la pgina de una vez y luego hacer referencia a estos valores en las columnas respectivas.El reconocimiento de patrones de bytes es de tipo independiente.Bajo la compresin PAGE, SQL Server optimiza el espacio en una pgina mediante dos tcnicas.
21. La primera tcnica esprefijo de columna.En este caso, el sistema busca un patrn de bytes comn como un prefijo para todos los valores de una columna especfica en las filas de la pgina.
La segunda tcnica es eldiccionario de nivel de pgina.Este diccionario almacena los valores comunes a travs de columnas y filas y los almacena en un diccionario.Las columnas se modifica para referirse a la entrada del diccionario.
Los comandos para comprimir los datos se exponen como opciones en el modo de CREATE / ALTER DDL y el apoyo tanto online como offline.Adems, un procedimiento almacenado se proporciona para ayudarle a calcular el ahorro de espacio antes de la compresin real.
22. Backup Compression
Al reducir el tamao de las copias de seguridad de SQL, se ahorra mucho en los medios de comunicacin en disco para copias de seguridad de SQL.Mientras que todos los resultados de compresin depende de la naturaleza de los datos se