republica bolivariana de venezuela universidad … filerepublica bolivariana de venezuela...

6
REPUBLICA BOLIVARIANA DE VENEZUELA UNIVERSIDAD ALONSO DE OJEDA VICERRECTORADO ACADEMICO FACULTAD DE INGENIERIA MENCION COMPUTACION CATEDRA: MINERIA DE DATOS Autor : Paolo Negron CI : 25 . 941 . 675 Tutora: ing. Dennis Chirinos Ciudad Ojeda, Junio 2018.

Upload: others

Post on 24-Sep-2019

28 views

Category:

Documents


0 download

TRANSCRIPT

REPUBLICA BOLIVARIANA DE VENEZUELAUNIVERSIDAD ALONSO DE OJEDAVICERRECTORADO ACADEMICO

FACULTAD DE INGENIERIA MENCION COMPUTACION

CATEDRA: MINERIA DE DATOS

Autor: Paolo Negron

CI: 25.941.675

Tutora: ing. Dennis Chirinos

Ciudad Ojeda, Junio 2018.

MINERIA DE DATOS

Es el proceso de detectar la información procesable de los

conjuntos grandes de datos. Utiliza el análisis matemático para deducir

los patrones en los datos. Normalmente, estos patrones no se pueden

detectar mediante la exploración tradicional de los datos porque las

relaciones son demasiado complejas o porque hay demasiado datos.

TECNICAS DE

MINERIA DE DATOS

Como ya se ha comentado, las técnicas de la minería de datos

provienen de la inteligencia artificial y de la estadística, dichas técnicas,

no son más que algoritmos, más o menos sofisticados que se aplican

sobre un conjunto de datos para obtener unos resultados.

Una de las técnicas más representativas es:

REDES

NEURONALES

Paradigmas de

aprendizaje

Aplicaciones

REDES NEURONALES

son un modelo computacional basado en un gran

conjunto de unidades neuronales simples (neuronas

artificiales), de forma aproximadamente análoga al

comportamiento observado en los axones de las

neuronas en los cerebros biológicos. Cada unidad

neuronal está conectada con muchas otras y los

enlaces entre ellas pueden incrementar o inhibir el

estado de activación de las neuronas adyacentes.

Cada unidad neuronal, de forma individual, opera

empleando funciones de suma. Puede existir una

función limitadora o umbral en cada conexión y en

la propia unidad, de tal modo que la señal debe

sobrepasar un límite antes de propagarse a otra

neurona. Estos sistemas aprenden y se forman a sí

mismos, en lugar de ser programados de forma

explícita, y sobresalen en áreas donde la detección

de soluciones o características es difícil de expresar

con la programación convencional.

• Aproximación de funciones, o el análisis de

regresión, incluyendo la predicción de series de

tiempo, aproximación de la capacidad y el

modelado.

• Clasificación, incluyendo el patrón y la secuencia

de reconocimiento, detección y de la toma de

decisiones secuencial.

• Procesamiento de datos , incluyendo el filtrado,

el agrupamiento, la separación ciega de fuentes

y compresión.

• Robótica, incluyendo manipuladores, que dirigen

la prótesis. De control, incluyendo control

numérico por ordenador .

El aprendizaje supervisado

Aprendizaje por refuerzo

Aprendizaje no supervisado

Las redes

con

memoria

La integración de los

componentes de memoria

externa con redes neuronales

artificiales tiene una larga

historia que se remonta a las

primeras investigaciones en

las representaciones

distribuidas y mapas de auto-

organización . Por ejemplo, en

memoria distribuida dispersa

los patrones codificados por

las redes neuronales se

utilizan como direcciones de

memoria para la memoria de

contenido direccionable, con

"neuronas" que sirven

esencialmente como dirección

codificadores y

decodificadores .

Software de

red neuronal

Tipos de redes

neuronales

artificiales

varían de aquellos con sólo una o

dos capas de lógica única

dirección, para muchos bucles

complejos multi-direccionales de

entrada de realimentación y capas.

En general, estos sistemas utilizan

algoritmos en su programación

para determinar el control y la

organización de sus funciones.

Software de la red neuronal se utiliza

para simular , la investigación ,

desarrollo y aplicación de redes

neuronales artificiales, redes neuronales

biológicas y, en algunos casos, una

gama más amplia de sistemas

adaptativos .

REDES NEURONALES

Las clases y

tipos de RNAs

Red Neural

dinámico

red neural física

red neuronal

oscilante

Red neuronal

asociativa (ASNN)

Red neuronal

feedforward (FNN)

La red neuronal

recurrente (RNN)

redes recurrentes

simples

La memoria a largo

plazo corto

Estática red

neuronal

perceptrón

Google / Mente

Profunda

memoria asociativa

holográfica

red neural

hibridación

redes neuronales

modulares

Técnicas de

Mireia de

datos

REDES

NEURONALES

REGRESION

LINEAL

ARBOLES DE DESICION REGLAS DE

ASOCIACION

AGRUPAMIENTO

O CLUSTERING

MODELOS

ESTADISTICOS

Que es?

Son un paradigma

de aprendizaje y

procesamiento

automático inspirado en

la forma en que funciona

el sistema nervioso.

Es la más utilizada

para formar

relaciones entre

datos. Rápida y

eficaz pero

insuficiente en

espacios

multidimensionales

donde puedan

relacionarse más de

2 variables.

Es un modelo de predicción

utilizado en el ámbito de la

inteligencia artificial y el análisis

predictivo, dada una base de

datos se construyen estos

diagramas de construcciones

lógicas, muy similares a los

sistemas de predicción basados

en reglas, que sirven para

representar y categorizar una

serie de condiciones que suceden

de forma sucesiva, para la

resolución de un problema.

Se utilizan para

descubrir hechos que

ocurren en común dentro

de un determinado

conjunto de datos.

Es un procedimiento de

agrupación de una serie

de vectores según

criterios habitualmente de

distancia; se tratará de

disponer los vectores de

entrada de forma que

estén más cercanos

aquellos que tengan

características comunes.

Es una expresión

simbólica en forma de

igualdad o ecuación que

se emplea en todos los

diseños experimentales y

en la regresión para

indicar los diferentes

factores que modifican la

variable de respuesta.

aplicaciones

reconocimiento de

patrones de voz,

imágenes, señales.

Asimismo se han

utilizado para encontrar

patrones de fraude

económico, hacer

predicciones en el

mercado financiero y

tiempo atmosférico.

• Informática

• Medicina

decisiones de inversión,

reinversión, políticas de créditos y

financiamiento a corto y largo

plazo.

Interés: descubrir

combinaciones de

pares atributo-valor que

ocurren con

frecuencia en un grupo

de datos

• Exploración de datos

• Minería de textos

• aplicación web

• Diagnósticos médicos

Ventajas

• Aprendizaje

• Auto organización

• Tolerancia a fallos

• Flexibilidad

• Tiempo real

Se tiene a disposición diferentes

soluciones a un problema o

situación.

Se pueden analizar los posibles

efectos que puede tener la toma

de una decisión determinada.

Es una ayuda práctica y útil para

representar los aspectos de una

decisión.

que las asociaciones

pueden existir entre

cualquiera de los

atributos.

• Alto rendimiento

• Alta disponibilidad

• Alta eficiencia

• Escalabilidad