bigdatacienciacomputacional-computerdayversion2.0.pdf

Upload: ivan-mn

Post on 08-Jul-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    1/20

    1

    Big Data y CienciaComputacional

    César Beltrán Castañón Ph.D.

    [email protected] Pontificia Universidad Católica del Perú2015-2016 Vice-President, IEEE Computer Society - Peru 

    The community for technology leaders

    1

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    2/20

    http://ouzor.github.io/blog/2015/02/02/data-science-definition.html 

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    3/20

    3

    Large-Scale DataManagement

    Big Data Analytics

    Data Science and Analytics•  Como enseñar al computador a extraer conocimiento valioso de grandes

    cantidades de información?

    MachineLearning

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    4/20

    Revolución de la información

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    5/20

    Big Data vs. Data Mining

    5

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    6/20

    Definición de Big Data

    • 

    No existe una única definición

    “ Big Data” es información cuya escala,diversidad, y complejidad requiere nueva

    arquitectura, técnicas, algoritmos y análisis

     para manejarla y extraer valor yconocimiento escondido de ella….

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    7/20

    Características de Big Data:1-Escala (Volumen) 

    •  Volumen de información

    –  Incremento en 44x desde 2009 al 2020–  De 0.8 zettabytes a 35 Zb

    •  Volumen de información crece

    exponencialmente

     Incremento exponencial en la

    recolección/generación de data

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    8/20

    • 

    Varios formatos, tipos, yestructuras

    • 

    Texto, numerico, imágenes,audio, video, secuencias, series

    de tiempo, social media data,matrices multi-dim, etc…•

     

    Data estática vs. streaming data•

      Una simple aplicación puede sergenerar/colectar varios tipos de

    dataPara extraer conocimiento! todos estos

    tipos de información necesitan estar juntos

    Características de Big Data:2-Complejidad (Variedad) 

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    9/20

    • 

    Data está siendo generada rápido y necesitaser rápidamente procesada.

    •  Análisis de data Online

    • 

    Decisiones tardías!

     pérdida deoportunidades•

     

    Ejemplos–  E-Promotions: Basado en su actual ubicación, su histórico de

    compra, lo que gusta ! envío de promociones al momento de latienda próxima a Ud.

    –  Monitoreo del cuidad de la salud: sensores monitoreando susactividades y su cuerpo ! cualquier medida anormal requiereuna inmediata reacción

    Características de Big Data:3-Velocidad (Velocidad) 

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    10/20

    Big Data 3V´s

    http://www.teradata.com/

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    11/20

    Quiénes generan Big Data?

    Social media y networks

    (todos generamos data)Instrumentos científicos

    (colectando todo tipo de data)

    Dispositivos móviles

    (Siguiendo objetos todo el tiempo)

    Tecnologia y redes de sensores

    (midiendo todo tipo de data)

    •  El progreso e innovación no esta limitada por la habilidad de colectar data.

    •  Sino, por la habilidad de gestionar, analizar, resumir, visualizar y descubrirconocimiento a partir de la data colectada de forma periódica y de maneraescalable.

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    12/20

    Big Data Visualization

    12

    http://d3js.org/

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    13/20

    Data scientist=

    statistician, programmer,consultant and visualizer

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    14/20

    Grandes analistas necesitan ser curiosos!!

    http://strataconf.com/stratany2012/public/schedule/detail/25491 

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    15/20

    Herramientas de Big Data - Analytics

    15

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    16/20

    Nueva formación en Ciencia de laComputación¿Ciencia de la Computación

    =

    Programación de Computadoras?

    Habilidad de programación es importante,pero no lo único.

    Let's Help Computer-Science Students Crack the Code http://chronicle.com/article/Lets-Help-Computer-Science/137649/ 

    16

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    17/20

    Nueva formación en Ciencia de laComputaciónEl ambiente de computación de hoy no es el

    mismo de las décadas pasadas,- Pero la curricula no ha cambiado mucho.

    - Antes la formación era centrada en el

    computador-

     Hoy se re-orienta a la data “data-orientedcomputation”, la cual involucra grafos,algoritmos para memoria intensiva,

    aprendizaje de máquina, …

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    18/20

    Qué habilidades necesito potenciar?

    18

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    19/20

    19

    Crea tu Capítulo IEEE Computer Society - Perú

    19

  • 8/19/2019 BigDataCienciaComputacional-ComputerDayVersion2.0.pdf

    20/20

    20

    Gracias

    Síguenos en:

    https://es-la.facebook.com/IEEEComputerSocietyPeru 

    IEEE Computer SocietyThe community for technology leaders

    www.computer.org