bases de datos avanzadas - departamento de ingeniería de ...eleonguz/cursos/bda/... · metadata...
TRANSCRIPT
TABD - Introducción
Bases de Datos AvanzadasBases de Datos AvanzadasIntroducciónIntroducciónCurso MaestríaCurso Maestría
PorPorElizabeth León Guzmán, Ph.DElizabeth León Guzmán, Ph.D..
Profesora Asociada Profesora Asociada Ingeniería de SistemasIngeniería de SistemasGrupo de Investigación MIDASGrupo de Investigación MIDAS
TABD - Introducción
1. ¿Qué son Bases de Datos? Datos, Información, Conocimiento
2. Modelos de Bases de Datos E/R
3. Integracion de Datos
4. Análisis de Datos
5. Recuperación de Datos
Agenda
TABD - Introducción
¿Qué es un dato?
Hecho individual acerca de algo de interés para alguien
TABD - Introducción
¿Qué es información?Datos relacionados
TABD - Introducción
Los datos son la materia prima bruta
INFORMACIÓNINFORMACIÓN
TABD - Introducción
Generación de Datos
Web (e-commerce) Supermercados(compras) Bancos (transacciones con tarjetas)
Comercial
TABD - Introducción
Generación de Datos
Satélites (sensores)Telescopios Microarrays (información genética)Simulaciones
CientíficoCientífico
TABD - Introducción
Datos
Datos almacenados
Bases de datos Web Archivos (excel, pdf, txt, etc)
TABD - Introducción
Modelo Relacional
TABD - Introducción
KDD Descubrimiento de Conocimiento en Bases de Datos
Nos referimos al
Conocimiento
TABD - Introducción
¿Qué es conocimiento?Información co-relacionada
Patrones!
TABD - Introducción
Algo peor que no tener información disponible es tener mucha información
Y no saber qué hacer con ella.
Información
TABD - Introducción
KDD Descubrimiento de Conocimiento en Bases de Datos
TABD - Introducción
Necesidad de Análisis“Conocimiento”
● Entender mejor el ambiente
● Seguimiento a transacciones diarias: evaluar como funciona la organización
● Evaluaciones y estrategías tácticas:● Promociones● Porción del mercado controlado● Atracción de nuevos clientes● Globalización● Ambiente cultural● Tecnología
TABD - Introducción
INTEGRARINTEGRAR ANALIZARANALIZAR
RECUPERARRECUPERAR
BDBDBDBD
BDBD
Optimización
Grandes repositoriosDescripción,
Algoritmos inteligentes
TABD - Introducción
Integrar Información
BODEGA DE
DATOS
BODEGA DE
DATOS
TABD - Introducción
Bodegas de DatosData Warehousing
Estructura del Proceso de Acceso a Datos y Entrega de Información en BI
Diseño y ConstrucciónModelos OLAP
OLAP
Modelos Molap / Rolap
Data Warehouse
ETLC Fuentes de datos
Calidad de datos
Data Quality
Data Warehouse
Score CardsReportes y ConsultasAnálisis OLAP Agregaciones Minería de datos
Metadata Integrada para Acceder Bases de Datos y Fuentes OLAPMetadata Integrada para Acceder Bases de Datos y Fuentes OLAP
TABD - Introducción
Analizar Información
Análisis Exploratorio Minería de Datos
TABD - Introducción
Análisis Exploratorio
Hacer uso de las habilidades humanas para el reconocimiento de patrones.
Una imagen vale más que mil palabras.
l 10th percentile
l 25th percentile
l 75th percentile
l 50th percentile
l 10th percentile
Gráficas de CajaGráficas de DispersiónHistogramas
TABD - Introducción
OLAP
TABD - Introducción
Minería de Datos
Uso de métodos inteligentesmétodos inteligentes para extraer conocimiento (búsqueda de oro!oro!) .
Minería de
datos
DatosConocimiento
TABD - Introducción
Minería de datosPaso del KDD,
Que descubre “conocimiento” en grandes conjunto de datosUsa métodos como:
Inteligenciaartificial
Aprendizaje
de Máquina Estadistica
Mineria de datosMineria de datosMineria de datosMineria de datos
Bases de datos
TABD - Introducción
Minería de datos
No es…
• Buscar un número telefónico en un directorio
• Buscar en Google
• Generar histogramas de salarios por grupos de edades diferentes
TABD - Introducción
es…
• Encontrar grupos de personas con similares hobbies.
• ¿Hay mas probabilidad de desarrollar cáncer si se vive cerca de una línea de poder?
Minería de datos
TABD - Introducción
Inteligencia de Negocios(BI)
Integración Análisis
Estructura del Proceso de Acceso a Datos y Entrega de Información en BI
Diseño y ConstrucciónModelos OLAP
OLAP
Modelos Molap / Rolap
Data Warehouse
ETLC Fuentes de datos
Calidad de datos
Data Quality
Data Warehouse
Score CardsReportes y ConsultasAnálisis OLAP Agregaciones Minería de datos
Metadata Integrada para Acceder Bases de Datos y Fuentes OLAPMetadata Integrada para Acceder Bases de Datos y Fuentes OLAP
TABD - Introducción
Recuperar InformaciónConsultas (queries) sobre los repositorios de datos
Datos estructuradosDatos estructurados Datos no estructuradosDatos no estructurados
TextoAudioVideo
imagenesIndices
DB
Informaciónestructurada
TABD - Introducción
Sistemas de Recuperación de Información
System(Db,
www,etc)
Query
SystemSystemquery
matched toobject stored
Query
SystemSystemRanking objectsTop ranking objects
System(Db,
www,etc)
Query refined
TABD - Introducción
Aplicaciones IR
Bibliotecas digitales: acceso a libros, revistas, etc.
Motores de búsqueda (search engines) tales como: Google, Yahoo search y Live Search (MSN Search)
TABD - Introducción
Optimización: Indices