graficas visual analytics

19
INTRODUCCIÓN Una imagen es el valor de miles de palabras, especialmente cuando se trata de ganar y entender ideas a partir de los datos, en particular es relevante cuando se trata de encontrar relación entre cientos o incluso miles de variables, para determinar su importancia relativa. Organizaciones de todos los tipos y tamaños generan datos cada minuto, hora y día. Todos desde ejecutivos, analistas de mercado, encargados de call-center y empleados de las líneas de producción, esperan aprender cosas sobre los datos recolectados con la finalidad de tomar mejores decisiones, tomar acciones más inteligentes y operar eficientemente. Independientemente de cuantos datos tengas, una de las mejores formas para discernir las relaciones más importantes es a través del avanzado análisis y alta realización de la visualización de los datos. Si el sofisticado análisis se puede realizar rápidamente y los resultados presentados muestren y permitan la exploración y las consultas, la gente de todos los niveles en la organización podría tomar decisiones más rápidas y efectivas. Para crear visualizaciones significativas de los datos hay aspectos básicos que se deben considerar: el tamaño de los datos y su composición juegan un rol muy importante cuando se trata de seleccionar graficas que los represente. En este documento se discuten algunos de los problemas básicos que conciernen a los datos y se proporcionan sugerencias para atacar esos problemas. Además Big Data brinda un único conjunto de retos para crear visualizaciones. Si estás trabajando con una cantidad masiva de datos, uno de los retos es como mostrar los resultados de la exploración y el análisis se vuelve abrumador. Tal vez, necesites una nueva

Upload: david-arenas-romero

Post on 11-Jan-2016

36 views

Category:

Documents


0 download

DESCRIPTION

Herramientas de Visual Analytics

TRANSCRIPT

Page 1: Graficas Visual Analytics

INTRODUCCIÓN

Una imagen es el valor de miles de palabras, especialmente cuando se trata de ganar y entender ideas a partir de los datos, en particular es relevante cuando se trata de encontrar relación entre cientos o incluso miles de variables, para determinar su importancia relativa.

Organizaciones de todos los tipos y tamaños generan datos cada minuto, hora y día. Todos desde ejecutivos, analistas de mercado, encargados de call-center y empleados de las líneas de producción, esperan aprender cosas sobre los datos recolectados con la finalidad de tomar mejores decisiones, tomar acciones más inteligentes y operar eficientemente.

Independientemente de cuantos datos tengas, una de las mejores formas para discernir las relaciones más importantes es a través del avanzado análisis y alta realización de la visualización de los datos. Si el sofisticado análisis se puede realizar rápidamente y los resultados presentados muestren y permitan la exploración y las consultas, la gente de todos los niveles en la organización podría tomar decisiones más rápidas y efectivas.

Para crear visualizaciones significativas de los datos hay aspectos básicos que se deben considerar: el tamaño de los datos y su composición juegan un rol muy importante cuando se trata de seleccionar graficas que los represente.

En este documento se discuten algunos de los problemas básicos que conciernen a los datos y se proporcionan sugerencias para atacar esos problemas. Además Big Data brinda un único conjunto de retos para crear visualizaciones.

Si estás trabajando con una cantidad masiva de datos, uno de los retos es como mostrar los resultados de la exploración y el análisis se vuelve abrumador. Tal vez, necesites una nueva forma de mirar los datos, una alternativa es colapsar los resultados en una forma intuitiva, pero las gráficas, tablas e imágenes continúan siendo confusas para visualizarse. Y, como la sociedad de hoy requiere datos rápidos que puedan ser manipulados en dispositivos móviles y proporcionen al usuario una forma fácil de explorar los datos en tiempo real.

SAS Visual Analytics es un visualizador de datos y una solución del Business Intelligence, que usa un autocharting inteligente que ayuda a la analítica y a los usuarios a visualizar los datos.

Crea la mejor forma de visualizar la información según las características de los datos, en las visualizaciones es más fácil identificar patrones y tendencias, identificar oportunidades para un futuro análisis.

Page 2: Graficas Visual Analytics

El corazón y el alma de SAS Visual Analytics es el SAS LASR Analytics Server, el cual ejecuta y acelera la computación analítica mediante un procesador en la memoria.

La combinación de una alta realización de la analítica y un fácil uso de la interfaz de la exploración de datos, permite a los diferentes usuarios crear e interactuar con los datos y sus gráficos de tal forma que puedan derivar resultados más fáciles.

Esto permite la habilidad de resolver problemas difíciles, mejorar la forma de hacer negocios y mejorar el riesgo de forma rápida y confidencial.

Consejos para empezar:

Aquí hay algunos conceptos básicos que pueden ayudar a generar las mejores imágenes para la visualización de los datos:

• Comprender los datos que está intentando visualizar, incluyendo su tamaño y su cardinalidad. • Determine lo que usted está tratando de visualizar y qué tipo de información que desea comunicar.• Conozca a su público y entender cómo se procesa la información visual. • Utilice un visual que transmite la información de la mejor y más sencilla forma para su público.

¿Qué es la cardinalidad de los datos?

Cardinalidad son los datos únicos que están contenidos en una columna.

Alta Cardinalidad se refiere a un porcentaje de datos únicos (números de cuenta bancarios, CURP, RFC, etc.)

Baja cardinalidad se refiere a una columna de datos que tiene un alto porcentaje de datos repetidos (genero)

Graficas de línea.

Las gráficas de línea muestran la relación de una variable con otra. Son las más utilizadas para mostrar los cambios o tendencias a través del tiempo, durante el mismo periodo.

Page 3: Graficas Visual Analytics

Gráfica De Barras

Los gráficos de barras se pueden configurar con cualquiera de las barras verticales u horizontales, con la longitud o altura de cada barra se representa el valor.

Page 4: Graficas Visual Analytics

Gráficos de dispersión

Gráficos de dispersión pueden ayudar a obtener una idea de cómo están distribuidos los datos o que tan estrechamente relacionados son. También pueden identificar rápidamente los patrones presentes en la distribución de los datos.

Graficas de burbuja

Son una variación del Gráfico de dispersión, especialmente útiles para los conjuntos de datos con decenas a cientos de valores o cuando los valores difieren en varios órdenes de magnitud.

Page 5: Graficas Visual Analytics

Pie Charts

Los gráficos circulares son más eficaces cuando hay componentes limitados y cuando el texto y los porcentajes se incluyen para describir el contenido.

Page 6: Graficas Visual Analytics

Hay muchos otros tipos de gráficos que puede utilizar para presentar datos y resultados analíticos. La selección de las cartas por lo general dependerá del número de categorías y medidas ( o dimensiones ) que desea visualizar .

VISUALIZACIÓN DE BIG DATA

Big Data brinda nuevos retos para la visualización por la velocidad, tamaño y diversidad de los datos, que deben de ser tomados en cuenta, la cardinalidad de las columnas que serán tratadas también se tienen que considerar.

Page 7: Graficas Visual Analytics

Una de las definiciones más comunes de Big Data es; “los datos cuyo volumen, variedad y velocidad deben tratarse más allá de su zona de confort tecnológica y derivar inteligencia para decisiones efectivas”

El volumen se refiere al tamaño de los datos. Variedad describe si los datos son estructurados o no estructurados Velocidad es la velocidad a la cual los datos son obtenidos que con frecuencia

cambian.

Construyendo sobre las técnicas comunes de visualización y gráficas. SAS Visual Analytics ha creado una innovadora aproximación para agregar los retos asociados con la visualización de Big Data.

Manejo de grandes volúmenes de datos.

Uno de los principales retos para Big Data es como mostrar los resultados de una exploración de datos y análisis de una forma significativa y fácil. Así mismo es difícil elegir la gráfica más óptima para para los tipos de datos que se están utilizando, para ello SAS Visual Analytics cuenta con un “autocharting”

La capacidad autocharting en SAS Visual Analytics echa un vistazo a todos los datos que desea examinar y luego, en base a la cantidad de datos y el tipo de datos, se presenta la visualización más adecuada.

Los diagramas de caja son otro ejemplo de cómo el volumen de datos puede afectar el bienestar visual de la muestra. Un diagrama de caja es una representación gráfica de cinco

Page 8: Graficas Visual Analytics

estadísticas (mínimo, cuartil inferior, la mediana, el cuartil superior y máximo) que resumen la distribución de un conjunto de datos. A menudo, los diagramas de caja se utilizan para entender los valores atípicos en los datos. En términos generales, el número de valores atípicos en los datos puede ser representado por un uno por ciento a un cinco por ciento de los datos. Con los conjuntos de datos de tamaño tradicional esta proporción es fácil de ver. Sin embargo, cuando se trabaja con grandes cantidades de datos, la visualización se vuelve un reto.

Visualizaciones de datos semiestructurados y no estructurados.

Nubes de palabras

Una nube de palabras donde el tamaño de la palabra representa la frecuencia en el texto. Puede ser utilizado en datos no estructurados y semiestructurados. Los usuarios tienen acceso a las frases o palabras más frecuentes de un tema en específico.

Page 9: Graficas Visual Analytics

Diagramas de redes.

Los diagramas de redes visualizan relaciones en términos de nodos y flechas, Los nodos representan a los actores individuales en la red y las flechas las relaciones entre los actores (amistad, relación de negocios).

Tienen varias aplicaciones en distintas disciplinas, desde e análisis de la relación entre el consumidor y proveedor hasta detección de crímenes organizados o mafias.

Visualización de alta velocidad con matrices de correlación.

La velocidad se refiere a la rapidez con la que se obtienen los datos. La habilidad de accesar y procesar estos datos es crítica.

Page 10: Graficas Visual Analytics

La matriz de correlación combinada con Big Data crea una respuesta rápida para identificar la relación entre las variables.

Las cajas de color más oscuro representan las variables indican una correlación más fuerte y las más claras una correlación más débil.

SAS permite obtener un resumen más detallado de las correlaciones entre las variable dando click a la caja correspondiente.

SAS permite obtener una gráfica de la cardinalidad de los datos, cuando se tienen muchos de ellos es posible obtener un zoom de la gráfica para conocer las etiquetas y porcentajes de cada variables.

Page 11: Graficas Visual Analytics

Visualización de forma fácil con Autocharting

SAS cuenta con un producto inteligente llamado autocharting que brinda la gráfica óptima para un grupo de datos dado, lo cual ayuda a tener una primera visualización de los datos para el análisis exploratorio.

Page 12: Graficas Visual Analytics

Una segunda aplicación son las gráficas de calor o scatter plot, los datos categóricos pueden ser de tres tipos, estándar, fechas o geográficos.

Cuando los datos son estándar, presenta las frecuencias en una gráfica de barras, si son fechas te presenta una gráfica de líneas y si son geográficos te muestra un mapa.

El autocharting toma en cuenta la cardinalidad de los datos y considerara una visualización acorde a ellos, si la cardinalidad es alta mostrara una gráfica de barras con una visión general de los ejes.

Page 13: Graficas Visual Analytics

Vea hacia el futuro con las técnicas de predicción.

Estimar datos futuros basados en las tendencias estadísticas es una herramienta importante para la organización y toma de decisiones.

SAS Visual Analytics cuenta con un menú fácil que te permite elegir la fecha hasta donde deseas la predicción, da intervalos de confianza, además de una breve explicación de lo que los resultados arrojan.

Adicionalmente te permite agregar medidas para las predicciones como:

Page 14: Graficas Visual Analytics

1.-Tener las variables que más influyen en un botón de fácil acceso.

2.- Cuando las variable influyentes son encontradas la predicción es recalculada y refinada

3.- Los usuarios pueden manipular los valores de las variables influyentes para ver el impacto potencial en la predicción y realizar simulaciones.

Entender la influencia con árboles de decisión.

Los arboles de decisión permiten analizar problemas que están involucrados por múltiples factores de una forma fácil de entender.

Ayudan a encontrar relaciones fuertes entre los valores de entrada y los valores objetivos de una base de datos.

Cuando los valore de entrada están muy relacionados con el valor objetivo son agrupados para convertirse en una raíz del árbol de decisiones, se considera una relación fuerte cuando el conocimiento de un valor de entrada mejora la habilidad de predecir los valores objetivos.

Identifica las variables con mayor influencia y los valores con mayor impacto jerárquicamente.

Page 15: Graficas Visual Analytics

Visualización del flujo con Diagramas de Sankey.

Utilizan el análisis de camino para mostrar la dinámica del movimiento de las transacciones en un sistema (por ejemplo, como los consumidores que navegan en tu página web)

El diagrama muestra una serie de nodos vinculados donde la anchura del arco que los une indica la frecuencia o la medida en la que interactúa un nodo con otro. Esto ayuda a ver los patrones y reconocer las tendencias, tales como donde los consumidores entran y en donde se salen.

Page 16: Graficas Visual Analytics

Visualización para aparatos móviles.

La adopción de aparatos electrónicos significó para el mundo de los negocios una necesidad. SAS Visual Analytics permite utilizarlo en tablets y celulares inteligentes.

La visualización puede ser divertida y un reto, es más fácil para entender la información de forma visual a comparación de largas tablas con muchas columnas y renglones.

Page 17: Graficas Visual Analytics