john freddy duitama muñoz juan camilo alzate restrepo facultad de ingeniería u.de.a. john freddy...

35
John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. Diseño de Bases de Datos Relacionales Esta presentación puede ser usada solo para fines académicos y mencionando siempre al autor. John Freddy Duitama M. Universidad de Antioquia. Facultad de Ingeniería.

Upload: damian-camisa

Post on 23-Jan-2016

225 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo

Facultad de IngenieríaU.de.A.

John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo

Facultad de IngenieríaU.de.A.

Diseño de Bases de DatosRelacionales

Esta presentación puede ser usada solo para fines académicos y mencionando siempre al autor.

John Freddy Duitama M.Universidad de Antioquia.Facultad de Ingeniería.

Page 2: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

NormalizaciónLa Normalización, abarca dos tópicos:

Dependencia Funcional: Técnica de diseño que permite examinar las relaciones entre los atributos.

Formas Normales: Pruebas para el agrupamiento óptimo de los atributos.

Page 3: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Con la normalización se pretende que: Los atributos con una relación lógica fuerte

(dependencia funcional) se encuentren en la misma relación.

Definir el número mínimo de atributos necesarios para soportar requisitos de datos de una organización.

Las relaciones tengan una redundancia mínima. Cada atributo se representa una sola vez, con excepción de las claves foráneas. Actualización con un mínimo de operaciones.

Reduce posibles inconsistencias de datos.

Reduce espacio de almacenamiento.

Page 4: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

DEPENDENCIA FUNCIONALDEF: Sean y atributos de la relación R.

Decimos que determina funcionalmente a en R, denotado por

Tambien se puede decir que:depende funcionalmente de

Si y sólo si :Para todos los pares de tuplas t1, t2 de la relación R, tales que t1[] = t2[] también se cumple que t1[ ] = t2[]

Ejemplo: cédula --> nombre.Cada vez que se tiene un número de cédula, esta debe coincidir con el mismo nombre.

Si t1 y t2 coinciden en el atributo ,Entonces deben coincidir también en el atributo .

Page 5: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Sean las relaciones:Préstamo (sucursal, número_préstamo, nombre_cliente, valor)Cliente (nombre_cliente, dirección, ciudad )

Si Número_préstamo --> nombre_cliente. Un préstamo sólo puede efectuarse a un cliente. Un cliente puede tener varios préstamos.

Número_préstamo -->valor es cierta en préstamo?dirección --> ciudad es cierta en cliente?

Ejemplos de dependencias Funcionales

El diseño de una Base de Datos relacional requiere definir aquellas dependencias funcionales (D.F.) que se deben cumplir siempre.

Page 6: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

CLAVE CANDIDATASea K un conjunto de uno o más atributos de la

relación R.

DEF: K es una clave candidata para la relación R si:

Si K todos los atributos de R;

Ningún subconjunto de K determina funcionalmente a todos los demás atributos de R.

Page 7: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

DEP. FUNCIONAL COMPLETADEF: Sean y atributos de la relación R.

Decimos que depende funcionalmente de manera completa de

Si y sólo si: depende funcionalmente de pero no de ningún subconjunto propio de .

Es decir, Una dependencia funcional es completa si la eliminación de cualquier atributo de hace que la dependencia deje de existir.

Cedula, nombre salario Si se quita el nombre la dependencia continúa

Cedula salario Entonces no era completa

Page 8: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

1. Reglas de reflexividad: (dependencia trivial)Si y son conjuntos de atributos y entonces se cumple que

Si los atributos (Tipo-doc,numero) de una persona son su ID, entonces con el ID podemos determinar el tipo-doc.

2. Regla de aumento: Si para los conjuntos de atributos y se cumple que --> y es un conjunto de atributos, entonces se cumple que --> .

(cedula, teléfono) (nombre, teléfono)

3. Regla de la transitividad: Si se cumple --> y se cumple --> , entonces se cumple -- > .

Axiomas de Armstrong

Page 9: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Reglas adicionales - ArmstrongReglas adicionales, derivadas de las anteriores :4. Regla de unión:

Si se cumple --> y --> se cumple --> Cédula nombre y cédula teléfono

Cédula (nombre , teléfono)

Regla de la descomposición: Si se cumple --> entonces se cumple --> y --

> cédula (apellido, dirección)

cédula apellido y cedula dirección

6. Regla de la pseudo-transitividad: Si --> y --> entonces se cumple -->

Cédula Ciudad_residencia

(Teléfono, Ciudad_residencia) dirección_residencia

(Cédula,Teléfono) dirección_residencia

Page 10: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Implicación lógica de las D.F.

Ejemplo :

Sea la relación R (A, B, C, G, H, I) Con el conjunto de Dependencias Funcionales

F={ A B, A C, CG I, CG H, B H }

Puedo hallar nuevas dependencias funcionales implicadas lógicamente por F:

a. A B y B H luego : A H. por axioma-3.b. CG H y CG I luego CG HI por axioma-4c. A C luego AG CG por axioma-2d. AG CG y CG I luego AG I por axioma-3e. AG CG y CG H luego AG H por axioma-3.

Page 11: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Objetivo: Almacenar la información con un mínimo de redundancia y fácil recuperación.

Problemas: Repetición de la información.1. Representación de la información 2. Pérdida de información.

Problemas en el diseño de una B. de D.

nombre_sucursal activos ciudad Número_préstamo Nombre_cliente valor

Centro 9’000.000 Arganzuela 17 Santos 1.000

Moralzarzal 2’100.000 La Granja 23 Gómez 2.000

Navacerrada 1’700.000 Aluche 15 López 1.500

Centro 9’000.000 Arganzuela 14 Sotoca 1.500

Becerril 400.000 Aluche 93 Santos 500

Collado Mediano 8’000.000 Aluche 11 Abril 900

•Qué ocurre al agregar un préstamo ?•Qué ocurre si una sucursal cambia de activos ?•Qué ocurre con las sucursales que no tengan préstamos?•Qué ocurre si eliminamos el último préstamo de una sucursal?

Prestamo

Page 12: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

En otras palabras :Una sucursal existe independiente de los préstamos que haga.

Una sucursal está situada exclusivamente en una ciudad.una sucursal tiene solo un valor total de activos.

Una sucursal puede efectuar muchos préstamos.Un préstamo solo se otorga en una sucursal.

Solución:Sucursal (nombre_sucursal, activos, ciudad)

Préstamo (número_préstamo, nombre_cliente, valor, nombre_sucursal)

Problemas en el diseño de una B. de D.

Page 13: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Cómo descomponer una relación en varias?Objetivo: evitar la pérdida de información.

Cómo descomponer la relación préstamos en varias relaciones sin pérdida de información?préstamo (nombre-sucursal, activos, ciudad, número-préstamo, nombre-cliente, valor)

Sean:Sucursal (nombre-sucursal, activos, ciudad, valor)Préstamos (número-préstamo, nombre-cliente, valor) Dos proyecciones de la relación original, nótese que valor actúa como si fuera clave foránea.

Qué ocurre si pretendo reconstruir a préstamo?

Si hay varios préstamos con el mismo valor; significa que no podemos identificar a qué sucursal corresponde que préstamo.

Page 14: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Descomposición sin pérdidaSea R una relación.

Una descomposición {R1, R2, ..., Rn} de R es una descomposición de producto sin pérdida

si :R = R1(R) R2(R) Rn (R)

Se debe Verificar:R1 y R2 forman una descomposición sin pérdida de R, si por lo

menos una de las D.F. siguientes se cumple:R1 R2 --> R1.R1 R2 --> R2.

Veamos un Ejemplo:

Page 15: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Ejemplo de descomposición sin pérdidaPrestar (nombre-sucursal, activos, ciudad, préstamo, valor, nombre-

cliente)

F= { nombre-sucursal activos, nombre-sucursal ciudad, préstamo nombre-cliente, valor, nombre-sucursal}

Si la descomponemos en :Sucursal (nombre-sucursal, activos, ciudad)Préstamo (nombre-sucursal, préstamo, nombre-cliente, valor)

Debemos probar :Sucursal préstamo Sucursal

es decir: nombre-sucursal nombre-sucursal, activo, ciudad.Por unión : nombre-sucursal activo, ciudadPor aumento : nombre-sucursal nombre-sucursal, activo, ciudad.

Page 16: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

NORMALIZACIÓN

Page 17: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Normalización Es la técnica utilizada para diseñar

“buenas” relaciones desde el punto de vista de: Minimizar la redundancia Minimizar el mantenimiento de datos Minimizar el impacto de futuros cambios de

datos e ingreso de información

Anomalías de Inserción

Anomalías de Actualizacióny Borrado

Page 18: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

FORMAS NORMALES

Page 19: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

6 formas normales clásicas:1NF, 2NF, 3NF, BCNF (Boyce Codd Normal Form), 4NF, 5NF

Mientras una relación esté en una forma normal más alta “mucho mejor”

Generalmente se acepta normalizar hasta BCNF

Las formas normales 4 y 5 son casos “especiales”

Page 20: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Si una relación cumple una forma normal nn automáticamente cumplirá las n-1n-1 formas normales anteriores, es decir, cada forma normal es “más fuerte” que sus predecesoras.

El análisis de 1NF, 2NF y 3NF está considerado sólo relaciones con una sola clave candidata.

Para relaciones con más de 1 clave candidata directamente se aplica BCNF

Page 21: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Dominio Atómico. Los elementos del dominio son indivisibles.

Ejemplos:Libros (código, titulo, autores[i], editorial)No está en primera forma normal.

Posible solución: Libros (código, titulo, editorial) Autor (autor, codigo_libro)

Primera Forma normal : 1FNUna relación está en primera forma normal si y sólo si todos los dominios de los atributos son atómicos.

Primera Forma Normal : 1FN

Aplicar la primera forma normal es muy simple, bastará con dividir cada columna no atómica en tantas columnas atómicas como sea

necesario

Page 22: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Empleado (código, nombre, teléfono) código = 016-242224 donde

016 = departamento 242224 = código empleado

No está en primera forma normal.

Posible solución: Empleado(departamento, cod-empleado, nombre, teléfono)

Primera Forma Normal : 1FN

Primera Forma normal : 1FNUna relación está en primera forma normal si y sólo si todos los dominios de los atributos son atómicos.

Page 23: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Ejemplo, sea la relación : venta (nro-factura, producto, ced-cliente, unidades, fecha)

clave primaria: número-fac, producto.

Segunda Forma Normal: 2FNUna relación está en 2FN, si y sólo si está en 1FN y todos los

atributos no clave dependen funcionalmente de manera completa

(DFC) de la clave primaria.

Esta regla significa que en una relación sólo se debe almacenar información sobre un tipo de entidad, y se traduce en que los

atributos que no aporten información directa sobre la clave principal deben almacenarse en una relación separada.

Page 24: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Ejemplo de Segunda Forma Normal

¿Las unidades DFC de la clave primaria?

(número-fac, producto) unidades

Comprobar si al quitar alguno de los atributos del lado izquierdo, se conserva la dependencia funcional.

número-fac unidades F

producto unidades F

Al quitar el atributo producto o el número-fac la

dependencia NO se conserva, entonces (número-fac ,

producto) si DFC a unidades. Sin embargo, falta

comprobar…

Page 25: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Ejemplo de Segunda Forma Normal

¿La fecha DFC de la clave primaria?(número-fac , producto) fecha

Comprobamosnúmero-fac fecha V

producto fecha F

Al quitar el atributo producto, la dependencia se conserva,

entonces (número-fac , producto) NO DFC a fecha.

Es decir (número-fac , producto) fecha de manera

parcial. Entonces no se cumple la 2NF

Page 26: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Ejemplo de Segunda Forma Normal

¿El Cliente DFC de la clave primaria?(número-fac , producto) cliente

Comprobamosnúmero-fac cliente V

producto cliente F

Al quitar el atributo producto, la dependencia se conserva,

entonces (número-fac , producto) NO DFC a cliente.

Es decir (número-fac , producto) cliente de manera

parcial. Entonces no se cumple la 2NF

Page 27: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Ejemplo de Segunda Forma Normal

Posible solución:

Dependencias funcionales completas:número-fac cliente, fecha número-fac, producto unidades

Se descompone en:

Factura (#número-fac, cliente, fecha)

Venta (#número-fac, #producto, unidades)numero-fac clave foránea de Factura

Que pasa con un posible atributo, valor unitario?

Page 28: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Equivalentemente.Una relación está en 3FN si y sólo si los atributos no clave son: Mutuamente independientes. Dependen por completo de la clave primaria.

Dicho de otro modo:

R(A,B,C) con clave primaria A.

R.B --> R.C y R.A-->R.Bse descompone en:R1(B,C) con clave primaria B.R2(A,B) con clave primaria A y B clave ajena de R1.

Tercera Forma Normal: 3FNUna relación está en 3FN si y solo si está en 2FN y todos los atributos no claves dependen de manera directa de la clave primaria.

En la práctica significa que se debe eliminar cualquier relación que permita llegar a un mismo dato de dos o más formas diferentes

Page 29: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Ejemplo de Tercera Forma Normal

R(número-fac, cliente, fecha-fac, teléfono-cliente)

Con: número-fac --> clientenúmero-fac --> fecha-faccliente --> teléfono-clienteClave primaria: número-fac

Se descompone en :

R1(cliente, teléfono-cliente) clave primaria(cliente)

R2(número-fac, cliente, fecha-fac)clave primaria (número-fac); cliente clave foránea de R1.

Page 30: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Ejemplo

OcupaciónHabitación

(Num_cliente, Nom_cliente, Num_hab, fecha_entrada)

Num_cliente Nom_cliente

Num_hab, fecha_entrada Nom_cliente ?

Num_hab, fecha_entrada Num_cliente

Forma Normal Boyce/Codd

Todos los determinantes de la tabla son clave candidata.

Una relación está en FNBC, si cumple la 3FN, y si y solo si cada

determinante, atributo o conjunto de atributos que determina

completamente a otro, es clave candidata.

Page 31: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Análisis:Los atributos Num_cliente y Nom_cliente sólo proporcionan información entre ellos mutuamente, pero ninguno de ellos es una clave candidata.

Solución.Separar esta relación en dos diferentes:

OcupaciónHabitación(Num_cliente, Num_hab, fecha_entrada)

Cliente(Num_cliente, Nom_cliente)

Page 32: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

PROBLEMA:Sea: asesor (sucursal, nombre-cliente, nombre-asesor) F = { nombre-asesor sucursal, sucursal, nombre-cliente nombre-asesor}

Asesor no está en BCNF.Como descomponer asesor para hallar dos relaciones en

BCNF?

R/ Ninguna descomposición BCNF de esta relación conserva todas las dependencias originales.

SLN: Debo abandonar BCNF para conservar las dependencias.

Conservación de dependencias en BCNF

Page 33: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

En general la 4FN La definición de la 4NF

confía en la noción de una dependencia multivalor.

Una tabla con una dependencia multivalor es una donde la existencia de dos o más relaciones independientes muchos a muchos causa redundancia; y es esta redundancia la que es suprimida por la cuarta forma normal.

Nombre Teléfonos Correos

Andrés 3014492880 [email protected]

Andrés 4514400 NULL

Andrés NULL [email protected]

Camilo 3115879866 NULL

Solución: Colocar los atributos en una nueva relación junto con una copia de los determinantes.

Nombre Correo

Andrés [email protected]

Andrés [email protected]

Nombre Teléfono

Andrés 3014492880

Andrés 4514400

Camilo 3115879866

Teléfonos

Correos

Page 34: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

Finalmente la 5FN También conocida como forma normal de

proyección-unión (PJ/NF).

Para detalles de esta forma, se recomienda la lectura de:

http://mysql.conclase.net/

Page 35: John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de Ingeniería U.de.A. John Freddy Duitama Muñoz Juan Camilo Alzate Restrepo Facultad de

35

BIBLIOGRAFÍA Thomas M. Connolly, Carolyn E Begg. Sistemas de bases de

datos. Un enfoque práctico para diseño, implementación y gestión. Cuarta edición. Pearson Addison-Wesley 2005.

Peter Rob / Carlos Coronel. Sistemas de bases de datos. Diseño, implementación y administración. International thomson editores. 2004.

C.J. Date. Introducción a los sistemas de Bases de Datos. Sexta edición. Volúmen 1. Addison-Wesley. 1995.

Jeffrey D. Ullman. Principles of Database and Knowledge-Base System. Volúmenes I. Computer Science Press. 1988. Capítulo 7.

Henry F. Korth, Abraham Silberschatz. Fundamentos de Bases de Datos. Tercera edición. 1998.