presentacion tema memoria v2

Post on 14-Jul-2015

146 Views

Category:

Documents

4 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Diseño y construcción de una plataforma de clasificación y calificación de post para una red de blogs basada en textmining para Betazeta

Networks S.A.

Camilo López A.

betazeta

Volumen

Filtro de contenido

Categorizar

La Solución

Extract Obtención de datos

Extract

Transform Training

Datamanage

Limpieza, LDA y gestión de datos.

Extract

Transform Training

Datamanage

Predict Clasificación

Extract

Transform Training

Datamanage

Predict

Datos

Extract

Transform Training

Datamanage

Predict

Modelo

1 Sólo modelo -> Predicción Genérica

1 Cambio -> Cambiar todo

Análisis Histórico

Cliente

Sitios

Modelos

Clasific.

Clasificador A

Clasificador B

Clasificador C

Cliente

Modelo 2

Modelo 3

Clasificador A

Modelo 1

Sitio Z

Sitio X

Modelo 2 Sitio Z

Modelo 2

Modelo 3

Clasif. A

Modelo 1

Modelo Clasif. A

Topic A

Topic B

Topic C

M(1) C(A)

T(A)

T(B)

T(C)

M(2)

T(X)

T(Y)

T(Z)

M(1) C(A)

T(A)

T(B)

T(C)

M(2)

T(X)

T(Y)

T(Z)

Modelo General

M(1) C(A)

T(A)

T(B)

T(C)

M(2)

T(X)

T(Y)

T(Z)

Modelo Específico

Web Service

Clasificador A

Clasificador B

Cliente 1

Cliente 2

Cliente 3

Mejorar limpieza del texto y Stemming

Mejoras del modelo en el tiempo

Interfaz

Validación con expertos

Gantt Escritura Informe Mes Oct Noviembre Diciembre Enero

Semana 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Ca

pít

ulo

Intro 50% 25% 20% 5%

Metodología 30% 60% 5% 5%

MC 10% 10% 10% 10% 20% 20% 20%

Solución 10% 20% 20% 20% 20% 10%

Experimentos 20% 30% 20% 20% 10%

Conclusiones 50% 40% 10%

T. Futuro 30% 60% 10%

Gantt Proyecto Mes Oct Noviembre Diciembre Enero

Semana 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Ite

raci

on

es

Iteracion 1 50% 50%

Diseño I2 100%

Iteracion 2 30% 30% 40%

Diseño I3 50% 50%

Iteracion 3 40% 60%

Diseño I4 100%

Iteracion 4 30% 30% 40%

Interfaz 20% 20% 30% 30%

Muchas Gracias

top related