análisis de datos. se refiere a la transformación de los datos en bruto en una forma muy resumida...
TRANSCRIPT
Análisis de DatosAnálisis de Datos
Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación.
Síntesis DescriptivaSíntesis Descriptiva
Distribuciones de frecuencia
Medidas de dispersiónMedidas de
tendencia central
Distribución de porcentajes
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información.
Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central.
Medidas de tendencia central vs. Medidas de dispersión.
Medidas de DispersiónMedidas de Dispersión
Se utilizan para conocer la distancia de los valores de la variable a un cierto valor central. Permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable.
Varianza, Desviación Estándar, y el Rango.
Desviación estándar y Varianza
• La varianza: es la desviación cuadrada de la media. Nunca puede ser negativa.• La desviación estándar es la raíz cuadrada de la varianza.
Se utilizan para hacer generalizaciones estadísticas a partir de la muestra y aplicarlas a la población de donde se extrajeron.
Es una medida de la cantidad típica en la que los valores del conjunto de datos difieren de la media. Es la medida de dispersión más utilizada, se le llama también desviación típica.
• La desviación estándar es siempre un valor no negativo S será siempre > 0 por definición. Cuando S = 0 è X = xi (para todo i).
• Es la medida de dispersión óptima por ser la más pequeña.
• La desviación estándar toma en cuenta las desviaciones de todos los valores de la variable .
Desviación Estandar (S)
La varianza es una medida de dispersión relativa a algún punto de referencia. Ese punto de referencia es la media aritmética de la distribución.
Más específicamente, la varianza es una medida de que tan cerca, o que tan lejos están los diferentes valores de su propia media aritmética.
• Cuando más lejos están las Xi de su propia media aritmética, mayor es la varianza.
• Cuando más cerca estén las Xi a su media menos es la varianza.
• S siempre un valor no negativo, que puede ser igual o distinta de 0. Será 0 solamente cuando Xi= X
• La varianza es la medida de dispersión cuadrática
óptima por ser la menor de todas.
Varianza (S2)
Desviación Estándar (S)
Mayor valor del coeficiente Mayor dispersión de los datos del desvío estándar con respecto a su media
Menor valor del coeficiente Menor dispersión de los datos del desvío estándar (Mayor Homogeneidad)
Desviación Estándar (S)
Para Datos Aislados Para Datos Agrupados
1
)( 2_
n
XXS
1
)( 2_
n
XXfS
Desviación Estándar (S)
Para Datos Aislados
1
)( 2_
n
XXS
Edades de 7 personas encuestadas
X X – X (X - X)
10 10 -15,7= - 5,7 32,49
14 14-15,7= -1,7 2,89
15 15 -15,7= -0,7 0,49
16 16 -15,7= 0,3 0,09
18 18 -15,7= 2,3 5,29
18 18 -15,7= 2,3 5,29
19 19 -15,7= 3,3 10,89
Total 57,43
2
09,317
43,57
S
S = 9,572
Desviación Estándar (S)
Calificaciones de 23 personas encuestadas
X F X – X (X - X) f (X - X)
17 2 17 -14= 3 9 18
16 3 16 -14= 2 4 12
15 4 15 -14= 1 1 4
14 5 14 -14= 0 0 0
13 4 13 -14= -1 1 4
12 3 12 -14= -2 4 12
11 2 11 -14= 3 9 18
Total 23 68
2
Para Datos Agrupados1
)( 2_
n
XXfS
2
76,1123
68
S S = 3,1
2
Rango: Es la más elemental de las medidas, consiste simplemente en la distancia entre los dos valores extremos.
Es la diferencia entre el dato mayor y el dato menor.
R = X máx. - X mín.
Rango (R)Rango (R)
Por Ejemplo:
1. Un estudio sobre las marcas de afeitadoras arrojó que en un individuo
logró apenas 6 afeitadas con una marca, mientras que otro logró afeitarse 14
veces con otra marca, así el intervalo es de 14 - 6 con una diferencia de 8
afeitadas que representa el rango.
2. Numero de Comerciales de refrescos que recuerdan los estudiantes de
Mercadeo II son:
1 2 3 4 5 6 7 8 R=?
Rango (R)
R = 7
Resumen de fórmulas
Plan de tabulaciónPlan de tabulación: Disposición ordenada de datos en una tabla u otro formato resumido.
Tabulación y Gráficas
Síntesis GráficaSíntesis Gráfica: Resumir los resultados de la investigación en una forma gráfica.
• Enumérelas en secuencia
• No use numerales romanos
• El título debe indicar el contenido
• Etiquete las filas y las columnas claramente
• Use formatos estándares y convencionales
Diseñando las tablas de reporte
• Evite llenar demasiado las tablas
• Haga cada una auto explicativa
• Asegúrese que es limpia, simple y ordenada
• Prueba las tablas en algunas personas para asegurarse de que sean claras
• Inclúyalas después del texto de referencia
Diseñando las tablas de reporte
• Enumérelos en secuencia
• Cree y use un formato estándar para figura similares
• Los títulos deben indicar que representan las barras y líneas
• Añada etiquetas de valor si las cantidades no se muestran localizadas
Creando Gráficos
• Haga cada figura lo mas explicativa posible
• Incluya profundidad, sombras y color solo si esto no distrae
• Haga que alguien las revises para saber si son claras
• Incluya las figuras después del texto de ser posible
Creando Gráficos
Síntesis Gráfica
Los tres tipos más comunes son: Diagramas de sectores (Tortas), Diagrama de barras o histogramas.
Diagrama de Sectores (Tortas)
Grafico 1. Sexo de la muestra analizada
Masculino
Femenino
72%
28% Femenino
Masculino
Universitaria
TSU
Secundaria
Postgrado
59%
9%23%9%
Grafico 5. Nivel de Instrucción
Se evidencia la contribución de cada parte a un total.
Diagrama de Barras (Histogramas)Grafico 7. Lugar donde prefieren tomar whisky
Grafico 9. Activos/ Servicios que posee
Sirve para comparar datos entre diferentes
segmentos.
0
5
10
15
20
25
Cafés Fiestas Laborales P laya Casa Disco Casino Concierto Club
18%
23%
12%%
18%
9%
4%
11%%
4%1%
0 20 40 60 80 100 120
73%
99%
73%
90%
Internet
Celular
Telf. fijo
Computadora
Lavaplatos
Microonda
DVD
16%
92%
85%
77%
56%
100%
Secadora
VHS
TV
Se utilizan rectángulos separados, que tienen como base a cada uno de los datos y como altura la frecuencia de ese dato.
Ejemplo: Vacunas aplicadas a una población de reses en el Edo. Apure.
Diagrama de Barras (Histogramas)
El polígono de frecuencias es una representación gráfica de la distribución de frecuencias que resulta esencialmente equivalente al histograma y se obtiene uniendo mediante segmentos los centros de las bases superiores de los rectángulos del histograma.
Polígonos de Frecuencia
Polígonos de Frecuencia Acumuladas u Ojiva
La misma idea de unir los centros de las bases superiores de los rectángulos de la distribución del histograma de frecuencias acumuladas, da lugar al polígono de frecuencias acumuladas u ojiva.
Diagrama Línea
Por lo general se usan para mostrar un mismo tipo de dato y su evolución (valor de la acción y el tiempo, número de ventas y precio).
EjercicioEjercicio
Hallar la Media, Mediana, Moda, Rango, Desviación Estándar y la Varianza de la
siguiente serie de datos, que representan las edades de un subgrupo de 13 estudiantes de la
clase de Mercadeo II de UNITEC Guacara.
23, 19, 18, 23, 20, 22, 21, 20, 25, 23, 24, 22, 18
MEDIDAS DESCRIPTIVAS
TENDENCIA CENTRAL (Media, Mediana, Moda).
DISPERSION (Rango, Desviacion Estandar, Varianza)
Desviación Estándar Varianza.
Es el cuadrado de la desviación estándar = S2
1
)( 2_
n
XXS