que son base de datos
DESCRIPTION
Todo el contenido sobre las base de datosTRANSCRIPT
FACULTAD DE CIENCIAS DE LA INGENIERIA
Ingeniería En Sistemas
Freddy Adrián Cedeño Arroyo
Base de Datos
Ing. Sara Franco
2014 - 2015
Freddy Adrián Cedeño Arroyo
1
1. CONCEPTOS ELEMENTALES DE BASE DE DATOS
CAMPO
Unidad básica de una base de datos. Un campo puede ser, por ejemplo, el nombre de
una persona. Los nombres de los campos, no pueden empezar con espacios en blanco y
caracteres especiales. No pueden llevar puntos, ni signos de exclamación o corchetes.
Si pueden tener espacios en blanco en el medio. La descripción de un campo, permite
aclarar información referida a los nombres del campo.
REGISTRO
Es el conjunto de información referida a una misma persona u objeto. Un registro
vendría a ser algo así como una ficha.
ARCHIVOS
Los ficheros o archivos son la herramienta fundamental de trabajo en una computadora
todavía a día de hoy. Las computadoras siguen almacenando la información en ficheros,
eso sí de estructura cada vez más compleja.
Los datos deben de ser almacenados en componentes de almacenamiento permanente,
lo que se conoce como memoria secundaria (discos duros u otras unidades de disco). En
esas memorias, los datos se estructuran en archivos (también llamados ficheros).
BASE DE DATOS
Una base de datos es una colección de archivos relacionados con la finalidad de permitir
el manejo de la información de alguna compañía.
Cada uno de dichos archivos puede ser visto como una colección de registros y cada
registro está compuesto de una colección de campos. Cada uno de los campos de cada
registro permite llevar información de alguna característica o atributo de alguna
entidad del mundo real.
Freddy Adrián Cedeño Arroyo
2
PRINCIPALES CARACTERISTICAS DE
UNA BASE DE DATOS
Independencia mutua datos / aplicaciones.
Interrelaciones.
Versatilidad.
Eficiencia.
Disminución de las redundancias.
Protección de los datos.
2. OBJETIVOS DE UNA BASE DE DATOS
Entre los objetivos más importantes de los sistemas de bases de datos están:
1. Disminuir la redundancia e inconsistencia de los datos: Puesto que los archivos
y los programas de aplicaciones fueron creados por distintos programadores en
un periodo largo, es posible que un mismo dato esté repetido en varios sitios
(archivos). Esta redundancia aumenta los costos de almacenamiento y acceso,
además de incrementar la posibilidad de que exista inconsistencia en la
información.
2. Reducir la dificultad para tener acceso a los datos: Supóngase que uno de los
gerentes del banco necesita averiguar los nombres de todos los clientes que
viven en cierta parte de la ciudad. El gerente llama al departamento de
procesamiento de datos y pide que generen la lista correspondiente. Como ésta
es una solicitud fuera de lo común no existe un programa de aplicaciones para
generar semejante lista. Lo que se trata de probar aquí es que este ambiente no
permite recuperar la información requerida en forma conveniente o eficiente.
Freddy Adrián Cedeño Arroyo
3
3. Evitar el aislamiento de los datos: Puesto que los datos están repartidos en
varios archivos, y éstos pueden tener diferentes formatos, es difícil escribir
nuevos programas de aplicaciones para obtener los datos apropiados.
4. Corregir anomalías en el acceso concurrente: Para mejorar el funcionamiento del
sistema y tener un tiempo de respuesta más corto, muchos sistemas permiten
que varios usuarios actualicen la información simultáneamente. En un ambiente
de este tipo, la interacción de las actualizaciones concurrentes puede resultar
en información inconsistente. Para prevenir estas situaciones debe mantenerse
alguna forma de supervisión en el sistema.
5. Disminuir los problemas de seguridad: No es recomendable que todos los
usuarios del sistema de base de datos pueda tener acceso a toda la información.
Por ejemplo, en un sistema bancario, una persona que prepare los cheques de
nómina sólo debe poder ver la parte de la base de datos que contenga
información de los empleados. No puede consultar información correspondiente
a las cuentas de los clientes.
6. Disminuir los problemas de integridad: Los valores que se guardan en la base de
datos debe satisfacer ciertos tipos de limitantes de consistencia. El sistema
debe obligar al cumplimiento de estas limitantes. Esto puede hacerse agregando
el código apropiado a los distintos programas de aplicaciones. El problema se
complica cuando las limitantes implican varios elementos de información de
distintos archivos.
3. GESTORES DE BASE DE DATOS
Un gestor de base de datos o sistema de gestión de base de datos (SGBD o DBMS) es
un software que permite introducir, organizar y recuperar la información de las bases
de datos; en definitiva, administrarlas.
El propósito general de los sistemas de gestión de bases de datos es el de manejar de
manera clara, sencilla y ordenada un conjunto de datos que posteriormente se
convertirán en información relevante para una organización.
Freddy Adrián Cedeño Arroyo
4
Tipos
1. Sistemas de gestión de bases de datos (SGBD), cuyo propósito es general y
se basan, con frecuencia, en el modelo relacional. Su finalidad principal es la
gestión de datos comerciales, administrativos y, en general, cualquier tipo de
datos. Son propiamente sistemas de recuperación de datos.
2. Sistemas de gestión documental (SGD), que se soportan comúnmente en un
modelo textual. Están diseñados para gestionar datos textuales, no se
estructuran necesariamente bien y, en general, incorporan controles
terminológicos. Estos son sistemas para la recuperación de información.
Ejemplos de gestores de base de
datos
Libres:
Firebird
BDB
MySQL
PostgreSQL
Sqlite
Propietarios:
dBase
FileMaker
Fox Pro
IBM DB2 Universal
Database (DB2 UDB)
IBM Informix
MAGIC
Microsoft SQL Server
Open Access
Oracle
Paradox
PervasiveSQL
Progress (DBMS)
Sybase ASE
Sybase ASA
Sybase IQ
WindowBase
Freddy Adrián Cedeño Arroyo
2
3. DIAGRAMA DE ENTIDAD RELACIÓN
¿QUÉ ES EL MODELO ENTIDAD-
RELACIÓN?
Como ya he comentado este modelo es solo y exclusivamente un método del que
disponemos para diseñar estos esquemas que posteriormente debemos de
implementar en un gestor de BBDD (bases de datos). Este modelo se representa
a través de diagramas y está formado por varios elementos.
Este modelo habitualmente, además de disponer de un diagrama que ayuda a
entender los datos y como se relacionan entre ellos, debe de ser completado con
un pequeño resumen con la lista de los atributos y las relaciones de cada
elemento.
La estructura lógica general de una base de datos se puede expresar
gráficamente mediante un diagrama E-R. Los diagramas son simples y claros,
cualidades que pueden ser responsables del amplio uso del modelo E-R. Tal
diagrama consta de los siguientes componentes principales:
a) Rectángulos, que representan conjuntos de entidades.
b) Elipses, que representan atributos
c) Rombos, que representan relaciones.
d) Líneas, que unen atributos a conjuntos de entidades y conjuntos de entidades
a conjuntos de relaciones.
e) Elipses dobles, que representan atributos multivalorados.
f) Elipses discontinuas, que denotan atributos derivados.
g) Líneas dobles, que indican participación total de una entidad en un conjunto
de relaciones.
h) Rectángulos dobles, que representan conjuntos de entidades débiles
Como ejemplo
ilustrativo
mostramos un
diagrama:
Freddy Adrián Cedeño Arroyo
3
COMPONENTES
1. Entidad
Se trata de cualquier objeto u elemento (real o abstracto) acerca del cual se
pueda almacenar información en la base de datos. Es decir cualquier elemento
informativo que tenga importancia para una base de datos.
2. Relaciones
Representan asociaciones entre entidades. Es el elemento del modelo que
permite relacionar en sí los datos del mismo. Por ejemplo, en el caso de que
tengamos una entidad personas y otra entidad trabajos. Ambas se realizan ya
que las personas trabajan y los trabajos son realizados por personas:
2.1. Cardinalidad
Indica el número de relaciones en las que una entidad puede aparecer. Se anota
en términos de:
Cardinalidad mínima. Indica el número mínimo de asociaciones en las que
aparecerá cada ejemplar de la entidad (el valor que se anota es de cero o uno,
aunque tenga una cardinalidad mínima de más de uno, se indica sólo un uno)
Cardinalidad máxima. Indica el número máximo de relaciones en las que puede
aparecer cada ejemplar de la entidad. Puede ser uno, otro valor concreto mayor
que uno (tres por ejemplo) o muchos (se representa con n). Normalmente la
cardinalidad máxima es 1 ó n.
3. Atributos
Los atributos definen o identifican las características de entidad (es el
contenido de esta entidad). Cada entidad contiene distintos atributos, que dan
información sobre esta entidad. Estos atributos pueden ser de distintos tipos
(numéricos, texto, fecha…).
4. Identificador o clave
Se trata de uno o más atributos de una entidad cuyos valores son únicos en cada
ejemplar de la entidad. Se marcan en el esquema subrayando el nombre del
identificador.
Para que un atributo sea considerado un buen identificador tiene que cumplir con
los siguientes requisitos:
Deben distinguir a cada ejemplar de la entidad o relación. Es decir no puede haber
dos ejemplares con el mismo valor en el identificador.
Freddy Adrián Cedeño Arroyo
4
Todos los ejemplares de una entidad deben tener el mismo identificador.
Un identificador puede estar formado por más de un atributo.
Puede haber varios identificadores candidatos, en ese caso hay que elegir el que
tenga más importancia en nuestro sistema (el resto pasan a ser alternativos).
4. NORMALIZACIÓN DE UNA BASE DE DATOS
La normalización es el proceso de organizar los datos de una base de datos. Se
incluye la creación de tablas y el establecimiento de relaciones entre ellas según
reglas diseñadas tanto para proteger los datos como para hacer que la base de datos
sea más flexible al eliminar la redundancia y las dependencias incoherentes.
Los datos redundantes desperdician el espacio de disco y crean problemas de
mantenimiento. Si hay que cambiar datos que existen en más de un lugar, se deben
cambiar de la misma forma exactamente en todas sus ubicaciones. Un cambio en la
dirección de un cliente es mucho más fácil de implementar si los datos sólo se
almacenan en la tabla Clientes y no en algún otro lugar de la base de datos.
¿Qué es una "dependencia incoherente"? Aunque es intuitivo para un usuario mirar
en la tabla Clientes para buscar la dirección de un cliente en particular, puede no
tener sentido mirar allí el salario del empleado que llama a ese cliente. El salario del
empleado está relacionado con el empleado, o depende de él, y por lo tanto se debería
pasar a la tabla Empleados. Las dependencias incoherentes pueden dificultar el
acceso porque la ruta para encontrar los datos puede no estar o estar interrumpida.
Hay algunas reglas en la normalización de una base de datos. Cada regla se denomina
una "forma normal". Si se cumple la primera regla, se dice que la base de datos está
en la "primera forma normal". Si se cumplen las tres primeras reglas, la base de
datos se considera que está en la "tercera forma normal". Aunque son posibles otros
niveles de normalización, la tercera forma normal se considera el máximo nivel
necesario para la mayor parte de las aplicaciones.
Freddy Adrián Cedeño Arroyo
5
Al igual que con otras muchas reglas y especificaciones formales, en los escenarios
reales no siempre se cumplen los estándares de forma perfecta. En general, la
normalización requiere tablas adicionales y algunos clientes consideran éste un
trabajo considerable. Si decide infringir una de las tres primeras reglas de la
normalización, asegúrese de que su aplicación se anticipa a los problemas que puedan
aparecer, como la existencia de datos redundantes y de dependencias incoherentes.
PRIMERA FORMA NORMAL
Elimine los grupos repetidos de las tablas individuales.
Cree una tabla independiente para cada conjunto de datos relacionados.
Identifique cada conjunto de datos relacionados con una clave principal.
No use varios campos en una sola tabla para almacenar datos similares. Por ejemplo,
para realizar el seguimiento de un elemento del inventario que proviene de dos
orígenes posibles, un registro del inventario puede contener campos para el Código
de proveedor 1 y para el Código de proveedor 2.
¿Qué ocurre cuando se agrega un tercer proveedor? Agregar un campo no es la
respuesta, requiere modificaciones en las tablas y el programa, y no admite
fácilmente un número variable de proveedores. En su lugar, coloque toda la
información de los proveedores en una tabla independiente denominada Proveedores
y después vincule el inventario a los proveedores con el número de elemento como
clave, o los proveedores al inventario con el código de proveedor como clave.
SEGUNDA FORMA NORMAL
Cree tablas independientes para conjuntos de valores que se apliquen a
varios registros.
Relacione estas tablas con una clave externa.
Los registros no deben depender de nada que no sea una clave principal de una tabla,
una clave compuesta si es necesario. Por ejemplo, considere la dirección de un cliente
en un sistema de contabilidad. La dirección se necesita en la tabla Clientes, pero
Freddy Adrián Cedeño Arroyo
6
también en las tablas Pedidos, Envíos, Facturas, Cuentas por cobrar y Colecciones.
En lugar de almacenar la dirección de un cliente como una entrada independiente en
cada una de estas tablas, almacénela en un lugar, ya sea en la tabla Clientes o en una
tabla Direcciones independiente.
TERCERA FORMA NORMAL
Elimine los campos que no dependan de la clave.
Los valores de un registro que no sean parte de la clave de ese registro no
pertenecen a la tabla. En general, siempre que el contenido de un grupo de campos
pueda aplicarse a más de un único registro de la tabla, considere colocar estos
campos en una tabla independiente. Por ejemplo, en una tabla Contratación de
empleados, puede incluirse el nombre de la universidad y la dirección de un candidato.
Pero necesita una lista completa de universidades para enviar mensajes de correo
electrónico en grupo. Si la información de las universidades se almacena en la tabla
Candidatos, no hay forma de enumerar las universidades que no tengan candidatos
en ese momento. Cree una tabla Universidades independiente y vincúlela a la tabla
Candidatos con el código de universidad como clave.
5. PASOS PARA DISEÑAR UNA BASE DE DATOS
Determinar la finalidad de la base de datos: esto le ayudara a estar preparado
para los demás pasos.
Buscar y organizar la información necesaria: reúna todos los tipos de
información que desee registrar en la base como los nombres de productos o los
números pedidos.
Dividir la información en tablas: Divida lo elementos de información e entidades
o temas principales como, productos o pedidos. Cada tema pasara a ser una tabla.
Convertir los elementos de información en columnas: Decida qué información
desea almacenar en cada de tabla. Cada elemento se convertirá en un campo y se
mostrara como una columna en la tabla.
Freddy Adrián Cedeño Arroyo
7
Especificar claves principales: Elia al clave principal de la tabla. Lac lave
principal es una columna que se utiliza para identificar inequivocadamente cada
fila, como id.
Definir relaciones entre las tablas: Examine cada tabla y decida cómo se
relacionan los datos de una tabla con las demás tablas. Agregue campos a las
tablas o cree nuevas tablas para clarificar las relaciones según sea necesario
Ajustar el diseño: Analice el diseño para detectar errores. Cree las tablas y
agregue algunos registros con datos de ejemplo. Compruebe si puede obtener los
resultados previstos de las tablas. Realice los ajustes necesarios en el diseño.
Aplicar las reglas de normalización: Aplique las reglas de normalización de los
datos para comprobar si las tablas están estructuradas correctamente. Realice
los ajustes necesarios en las tablas.