Transcript
Page 1: Data Science al Descubierto

Data Science al Descubierto

Hector Cuesta@hmcuesta

Page 2: Data Science al Descubierto
Page 3: Data Science al Descubierto

•Definir el Problema•Obtener los datos•Limpiar y Formatear los datos•Explorar (Distribuciones, Patrones y Tendencias)

•Modelar (Escoger algoritmos)•Escalar la solución (Infraestructura)•Visualizar e Interpretar resultados

Ciencia de Datos

Page 4: Data Science al Descubierto

El rol del Científico de Datos

Page 5: Data Science al Descubierto

Datos Crudos

Datos Limpios

Consultas y Reportes

OLAP –Reportes Ad-Hoc

Análisis Estadístico

Modelado Predictivo

Optimización

Ven

taja

Co

mp

eti

tiva

Madurez Analítica

¿Qué paso?

¿Por que paso?

¿Qué va a pasar?

¿Que es lo mejor que puede pasar?

Sistemas basados en Datos

Page 6: Data Science al Descubierto

HerramientasLenguajes de Programación

Visualización

Procesamiento de Datos

D3js

Machine Learning

Page 7: Data Science al Descubierto

Procesamiento de Datos

Page 8: Data Science al Descubierto

Procesando datos con MapReduce

Page 9: Data Science al Descubierto

Sistemas de Recomendación

Page 10: Data Science al Descubierto

http://nyti.ms/1lZEpyQ

Sistemas basados en Grafos

Page 11: Data Science al Descubierto

Customer Profile

The 343 Industries development team hosts and manages Halo 4, an award-winning game for the Microsoft Xbox 360 video game and entertainment console. Business Situation

The team needed to provide business intelligence (BI) insight about the game to internal and external customers.  Solution

The team implemented a solution that uses Windows Azure HDInsight Service, based on the Apache Hadoop data-processing framework, and Microsoft BI technologies.  Benefits Enhances user experience through

increased agility and faster response times. Connects Halo 4 team directly to customers through weekly updates. Keeps playing field level by providing in-game analysis to detect cheaters. Facilitates customized campaigns aimed at retaining players.

“With Hadoop on Windows Azure, we can mine data and understand our audience in a way we never could before. It’s really the BI solution for the future.”Mark Vayman, Lead Program Manager, Halo Services Team

La vida en Tiempo Real

Page 12: Data Science al Descubierto

Quantified Self

Page 13: Data Science al Descubierto
Page 14: Data Science al Descubierto

¿Y el Big Data apa?

“Cuando más es diferente”

Volumen, Variedad y Velocidad

Page 15: Data Science al Descubierto

Preguntas

Hector Cuesta@hmcuesta


Top Related