el big data como fenómeno y herramienta para el e‐research en csyh digitales
DESCRIPTION
Congreso Latina de Comunicación Social. La Laguna, Tenerife. 5 de diciembre de 2013. Mesa de debate “Ciencias sociales y humanidades digitales (…)”. *Aportación enmarcada en Proyecto de Investigación “Ciencias Sociales y Humanidades Digitales: casos, gestión y modelos de negocio” (Campus de Excelencia Internacional BioTic Granada, convocatoria 2013). *Próximamente disponible en monográfico CAC.TRANSCRIPT
El Big Data como fenómeno y herramienta para el e‐research en
CSyH Digitales
Imagen de Web Design Hot. Fuentehttp://www.freepik.com
Dra. María Sánchez GonzálezProfesora Asociada e investigadora Periodismo UMA/ Técnico Innovación UNIA/ Miembro de @[email protected]/ @cibermarikiya
Congreso Latina de Comunicación Social. La Laguna, Tenerife. 5 de diciembre de 2013. Mesa de debate “Ciencias sociales y humanidades digitales (…)”
Introducción: evolución de los datos en el ecosistema digital
Los datos han existido siempre…•Huella digital de entidades e individuos (búsquedas, navegación en red…).
•Las empresas del sector de la Economía digital buscan convertir datos en valor: desarrollo de sistemas de búsqueda personalizados; recomendaciones… en los últimos años. Sin ellas empresas como Google o Facebook no existirían de la misma manera hoy (Mayer-Schönberger, OII).
•Todos basados en el mismo principio, el almacenamiento y la utilización de datos masivos, y en tecnologías y estándares propios de la web semántica(término acuñado por Berners-Lee hace dos décadas).
Fuente de imagen: Victor V. Varela http://www.pinterest.com/pin/109564203404688024/
… Pero hoy vivimos en “the Age of Big data”. Factores clave
Crecimiento exponencial de datos: superan la capacidad de procesamiento de los sistemas convencionales (Strata Conference, O’Reilly).
“Three converging ‘perfect storms’”: computing, data y convergence(Big, Data, Big Analytics, Minelli et al, 2013): crecimiento anual del volumen de datos generados online de un 40%.
“Squared web” o web2 (participación + sistemas de inteligencia artificial):-Buena parte de los datos procede de usuarios conectados redes sociales a través de diversos dispositivos, incluyendo los móviles.-A más participación, más sensores alimentando aplicaciones en tiempo real.
Datos enlazados e interdependientes: Linked data: tecnologías que promueven la interconexión de datos y
facilitan su acceso y recuperación.
Los datos dejan de ser dependientes o independientes para convertirse en interdependientes
Posibilidad de tratamiento masivo de datos
Fuente: FICO. En http://bit.ly/1842rsk
“Big Data Analytics” como nueva forma de tratamiento y análisis de datos ante esta complejidad (Calero, 2013).
Nuevas vías para la investigación (técnicas y herramientas) y fenómeno poco explorado en CSyH Digitales.
open data, o-gov y transparencia, movimientos impulsores del big data
- Iniciativas que, desarrolladas bien por instituciones públicas (gobierno abierto), bien por colectivos de activistas, suponen, así, una oportunidad para la apropiación ciudadana del big data y el desarrollo de disciplinas como el periodismo de datos.- Las propias empresas de Economía Digital aprovechan esta apertura de datos y fomentan su utilización: Google Data Public.
Open data: los datos públicos en abierto (la nube pública) como base.
¿Big-Linked-Open Data?Empieza a ser posible disponer de un ecosistema digital compuesto por grandes bases de datos interconectados y abiertos de acceso público.
Análisis panorámico, exploratorio y cualitativo en torno al fenómeno big data y a sus posibles aplicaciones (e
implicaciones) para el e-research en CSyHD
• Acotar la significación, conforme al contexto actual y diferenciándolo de otros relacionados con el auge de los datos en red, el término big data.
• Identificar colectivos relacionados con la difusión y el análisis del fenómeno del bigdata, así como los nuevos perfiles profesionales y de investigadores que, como el llamado científico de datos, comienzan a demandarse.
• Explorar sobre incidencia del Big Data en la llamada Ciencia de los Datos y su función en la Nueva Ciencia de Redes.
• Describir técnicas de procesado y representación de datos masivos en red, como el llamado visual analythics, que facilitan la labor de investigadores.
• Detectar y analizar tendencias y casos significativos de uso del big data en los principales campos de conocimiento de las Ciencias Sociales y Humanidades.
Objetivos específicos
MetodologíaFuentes bibliográficas y fuentes hemerográficas online
Localización, análisis y taxonomía de iniciativas relevantes sobre big data(función del big data y aplicación; disponibilidad de resultados/herramientas en red y
potencial replicabilidad; destinatarios; promotores…).
Planteamiento de estudio
Big data: concepción y auge en el contexto actual
Primeras definiciones, aluden a datos masivos:
“Data that exceeds the processing capacity of conventional database systems” (Dumbill, 2012)
“Combinación entre algoritmos, tecnologías y estrategias, capaces de capturar y analizar grandes volúmenes de datos provenientes de múltiples fuentes heterogéneas a una alta velocidad, de forma económica y a tiempo real” (Paniagua, 2013)
Pero no sólo referido por tanto a datos masivos o macrodatos, sino también a su tratamiento
Desarrollo
Objetivo: convertir datos en conocimiento
Fuente: IBM. What is big data? En http://www.ibm.com/big-data/us/en/
Las 4 dimensiones o V’s del big data según IBM
La quinta V= VisualizaciónImportancia de la representación visual, comprensible, de los datos (Tascón, 2013)
Soluciones basadas en big data
Doble funcionalidad:
•Consultas/ bases de datos. Permiten acceder a grandes cantidades de información, en distintos formatos y en tiempo real; manejarlos, filtrarlos…
•Visualizaciones de datos. E integran sistemas de visualización para mostrar estos datos o, incluso, crear visualizaciones personalizadas y publicarlas...
Ciencia de los Datos como híbrido entre informática tradicional, matemáticas y arte.
En empresas del sector de la Economía Digital. El caso de Google: El gráfico del conocimiento (2012)/ Google Flu y Google Dengue Trends/ Hadoop/ Google Big Query…
En otros sectores: medicina, banca, comunicación, educación…Y adopción por parte de propias empresas
Implicaciones del big data para el e-research: nuevas Ciencias y Técnicas
La Ciencia de los Datos y su transformación con Big Data:Análisis más certeros y profundos, “transformar grandes volúmenes de datos en
inteligencia” (Paniagua, 2013).Dos grandes utilidades:
1. Seguimiento de información en tiempo real.2. Análisis de tendencias y prospectiva.
Visual analythics como técnica de visualización y análisis de grandes cantidades de datos
Ciencia del razonamiento analítico facilitada por interfaces visuales interactivas” (Thomas y Cook, 2005)
Proliferación de utilidades online que extraen información de cuestiones complejas y la representan visualmente, facilitando su comprensión para su estudio o toma de decisiones: grafos; información geoposicionada o espacio-temporal…
Ejemplo: Esteban Moro (UC3M): estudio sobre la influencia del comportamiento de usuarios en difusión de la información y viralidad a través de redes sociales (matemáticas). Fuente: http://www.uc3m.es/portal/page/portal/actualidad_cientifica/noticias/claves_difusion_informacion
Sinergia entre Big Data y la Nueva Ciencia de las RedesAnálisis experimental y estudio de su naturaleza, nodos… de forma más ágil,
gracias a la proliferación de data sets para el modelado de datos y la simulación y de tecnologías de visualización automática e inteligente de estas redes, online.
Big data y análisis de redes en la investigación aplicada• Precedir, prevenir y personalizar (ej. Sanidad).• Monitorizar a tiempo real la reputación digital de una entidad o la visibilidad de determinados
mensajes en redes y comunidades virtuales, detectar temas que interesan al público o líderes de opinión, analizar preferencias o hábitos de consumo… (comunicación y marketing digital)
• Identificar y seguir en tiempo real de patrones anómalos de seguimiento en red (ej.Ciberterrorismo).
• …
Demanda de nuevos perfiles profesionales: científicos de datos o data scientifics; expertos en big data…
Iniciativas y colectivos centrados en su análisis, divulgación y promoción:
Capacitación para el big data: primeras iniciativas por universidades y otras entidades, orientadas a
capacitación técnica: ¿qué ocurre con científicos de CSyH?
- O’Reilly y sus Conferencias Strata, iniciadas en 2011 en California. - En el caso español, Asociación Española de Linked Data (AELID)/
Grupo Macrodatos/ programas en fundaciones de grandes empresas (Telefónica, BBVA…)
Consecuentemente…
Exploración en torno al fenómeno desde la AcademiaInformes, análisis técnicos o reflexiones sobre iniciativas determinadas…Desde perspectiva de “Predictive Analytics”/ “Intelligence Business”.Casos significativos de centros/organismos de investigación adscritos a universidades.…
…O como herramienta para la investigación académica:construcción de aplicaciones web basadas en big data y visualizaciónde datos
NameGevDev, an online application forFacebook that allows “capture, analyse, and visualise your Facebook network”(Hogan)
http://apps.facebook.com/namegendev/
El caso del Oxford Internet Institute (Universidad de Oxford) en CSyHD
Big data como objeto de estudio…“Accessing and Using Big Data to Advance Social Science Knowledge” (Meyer)http://www.oii.ox.ac.uk/research/projects/?id=98
“The InteractiveVis project” (http://blogs.oii.ox.ac.uk/vis/?page_id=25), oninteractive visualization in the University of Oxford, and funded by JISC (2012).
Fuente: Twitter Network of @OIIOxford viaOxford Internet Institute
Ejemplos, demos y noticias en este blog: http://blogs.oii.ox.ac.uk/vis/
Y ofrece online recursos para el análisis de datos o sistemas interactivos de visualización, fruto del trabajo de investigadores
El valor del big data para el e-research en CSyH. Posibles aplicaciones, objetos de estudio y
radiografía de casosEstudios macroscópicos: macrodemografías, macroanálisis de contenidos… (no posibles de otra forma. Importante considerar el contexto yesencial función de investigadores como intérpretes en análisis cualitativos).
Exploraciones sobre la marca digital e influencia de personas o entidades en redes sociales (aplicaciones online basadas en visual analythics, como Klout. Escasamente personalizables, y muchas de pago).
Análisis de percepciones, clima social u opinión pública mediante sistemas de escucha activa online
Herramientas que proporcionan rankings y sistemas de escucha activa online, claves en seguimiento de campañas electorales y potencial de anticipación/control de votos.
Ej: elecciones de USA de 2012. Fuente de imagen: http://enteratech.com.mx/2012/11/08/el-papel-del-big-data-en-las-us-elections-2012/
Investigación sobre audiencias sociales (macroanálisis de perfiles y preferencias…. Alternativa/complemento a audiometrías clásicas para consumos transmediáticos).
Estudios antropológicos y sociológicos con big data: comprender el comportamiento humano (Ej: “The Human Face of Big data”, proyecto colaborativo basado en aportaciones de usuarios sobre vida cotidiana. Ver http://www.thehumanfaceofbigdata.com/).
Estudios geolocalizados y mapeados sobre usuarios en redes sociales para analizar posibles correlaciones (Ej. “Hedonometerproject” de Universidad de Vermont, análisis de niveles de felicidad de forma geolocalizada y correlación con otros factores: salud, fechas… Ver: http://hedonometer.org/about.html)
Fuente de imagen: http://onehappybird.com/2013/02/18/where-is-the-happiest-city-in-the-usa/
Herramienta para la investigación sobre e-learning y enseñanza-aprendizaje en red (sistemas métricos sobre PLEs de Knewton y Junyo; nuevas posibilidades de macroetnografías digitales ante MOOCs…)
Herramienta para la estrategia y prospectiva: modelos predictivos basados en big data en CSyHD:
-Ej: estudios de Preis y Mota, Universidad de Boston, en revista Nature, que correlacionan PIB de países con búsquedas en Google sobre presente/pasado; alertas tempranas sobre términos financieros…
-Limitaciones del big data en prospectiva: ruido estadístico. Fuente de imagen:
http://www.nature.com/srep/2012/120405/srep00350/full/srep00350.html#results
Incidencia sobre e-research en CSyH:
-Transformación en el modo de investigar online y nuevas posibilidades: técnicas de análisis inteligente de datos masivos sobre diversos fenómenos; sistemas de visualización en red (fuentes/herramientas para presentar resultados…).
-Demanda de nuevos roles expertos en big data y de competencias de investigadores (análisis de datos).
- Necesidad de equipos multidisciplinares y de la colaboración entre áreas: expertos en big data en CSyH y científicos sociales que den contexto e interpreten datos cuantitativos de otras áreas.
Discusión y conclusiones: oportunidades y retos del big
data en CSyHD
Fuente de imagen: FICO, en http://bit.ly/1b8bruB
Limitaciones actuales del big data:
-Barreras culturales “to data-driven change” y retraso y temores en adoptar las correspondientes tecnologías (“laggards and luddites”) por parte de determinadas entidades (Croll, 2013) -Solvencia de datos y riesgo de manipulación: ¿cómo comprobar fuentes y filtrar datos?-Escasa fiabilidad o validez de los resultados de determinadas investigaciones: “antropología de datos” (Croll, 2013), esencial (ej. Haití).-…
El “small data” como alternativa o complemento:
- Pequeños datasets que pueden ser almacenados y procesados a través de un simple ordenador personal. - Instrumento de visualización y empoderamiento colectivo del big data/ última fase de los procesos asociados a éste (los grandes volúmenes de datos se traducen en aplicaciones concretas asociadas a determinados objetivos).
En cualquier caso, ambos modelos, small y big data, no son excluyentes, y su combinación abre nuevas posibilidades
al e-research.
*Aportación enmarcada en Proyecto de Investigación “Ciencias Sociales y Humanidades Digitales: casos, gestión y modelos de negocio” (Campus de Excelencia Internacional BioTic Granada,
convocatoria 2013).*Próximamente disponible en monográfico CAC.
Muchas gracias Dra. María Sánchez GonzálezExposición para el Congreso Latina de Comunicación Social. La Laguna, Tenerife. 5 de diciembre de 2013. Mesa de debate “Ciencias sociales y humanidades digitales (…)”
Mis coordenadas online
Algunos de mis canales en la web social:
Blog personal (marca, espacio centralizador): www.cibermarikiya.com
http://pinterest.com/cibermarikiya/…
http://paper.li/cibermarikiya/
http://storify.com/cibermarikiya
http://www.slideshare.net/cibermarikiya
http://prezi.com/user/cibermarikiya/
http://issuu.com/cibermarikiya
http://www.twitter.com/cibermarikiya
http:// www.facebook.com/cibermarikiya
http://es.linkedin.com/in/cibermarikiya
http://unia.academia.edu/mariaSanchez
http://www.diigo.com/user/cibermarikiya