conceptos basicos a 37666 completo

49
 Conceptos básicos de estadística Autor: Mario Blacutt Mendoza  1 mailxmail - Cursos para compartir lo que sabes  

Upload: o2308

Post on 09-Jul-2015

26 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 1/49

Conceptos básicos deestadística

Autor: Mario Blacutt Mendoza 

1

mailxmail - Cursos para compartir lo que sabes 

Page 2: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 2/49

Presentación del curso

Este es un curso de estadística básica está dirigido principalmente a la

aplicación por profesionales, estudiantes y hombres de negocios. Particularmente,

para administradores, economistas, psicólogos, sociólogos y, en general, para todas

las personas que deseen contar con un instrumento ágil y oportuno para usar einterpretar datos.

En este primer curso aprenderemos conceptos relacionados con la variable y

la escala de medida. A continuación profundizaremos en los conceptos relativos a

la recolección de datos, tales como la muestra las encuestas, etc.

Seguidamente analizaremos las diferentes medidas de tendencia central,

como son la mediana aritmética, la mediana aritmética ponderada, la media

geométrica, la mediana y las varianzas, entre otras. Es importante conocer estasmedidas ya que nos aportarán datos muy valiosos a la hora de analizar los

resultados de una encuesta.

Finalmente atenderemos la distribución de frecuencias y las gráficas que nos

van a permitir transmitir de una manera muy visual y atractiva las conclusiones

extraídas de los datos estadísticos. También haremos una pincelada a la

probabilidad.

2

mailxmail - Cursos para compartir lo que sabes 

Page 3: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 3/49

1. Conceptos fundamentales de estadística

Variable 

Una variable es una magnitud que varía pero, en todo caso, que puede ser

medida, manipulada, controlada o simplemente tomada en cuenta tal como está.

Las variables pueden estar relacionadas con otras variables y cambiar de

acuerdo con la modificación de alguna; desde esta óptica, las variables se

clasificarán en dependientes e independientes.

Una variable será considerada dependiente, en el marco de un estudio

concreto si su magnitud cambia debido a los cambios de otra u otras variables.

Por ejemplo, el consumo es una variable que está relacionada al ingreso; si el

ingreso aumenta, el consumo de un bien determinado también aumentará, aunqueno se puede saber, a priori, en cuánto.

En este caso, dentro del marco del estudio concreto que estamos realizando,

el Ingreso sería la variable independiente, pues cambia sin estar ligado a otra, se

reitera, para los efectos del análisis concreto.

Las variables independientes pueden ser manipuladas por el diseñador de un

estudio estadístico para ver reaccionaría la variable dependiente en la realidad,

cuando se produzcan variaciones en el Ingreso.

Escalas de medida 

Las variables se dividen en tres grandes grupos: Cuantitativas, Categóricas y

de Intervalo.

Variables cuantitativas son las que conocemos como variables numéricas; son

este tipo de variables las que generalmente se usa en los estudios estadísticos, pues

son las que varían en su magnitud.

Variables categóricas , son las que conocemos como variables cualitativas;

ahora bien, las variables categóricas se dividen en dos grandes ramas: las variables

nominales y las variables ordinales.

Variables nominales son aquéllas que no pueden ser clasificadas ni en una

magnitud cuantitativa ni en una magnitud de jerarquía; por ejemplo, las categorías

3

mailxmail - Cursos para compartir lo que sabes 

Page 4: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 4/49

de género; varón, mujer , son variables de tipo nominal.

Variables ordinales , son las que aceptan una jerarquización de importancia; el

ingreso familiar, por ejemplo, es una variable nominal, puesto que puede ser

calificado de acuerdo a un orden, v.g, descendente.

Variables de intervalo , son las que nos permiten expandir un tanto el radio de

las variables numéricas; por ejemplo, el promedio del ingreso semanal de un grupo

de estudiantes puede encontrarse entre $30 y 32.

Relación de las variables 

Desde el punto de vista de la relación, hay tres clases de variables.

Variables dependientes : son las que cambian debido a que otra variable o

variables también han cambiado.

Variables Independientes , son las que cambian sin depender del cambio de

otras.

Una de las principales tareas del estadístico en este campo es establecer

cuáles serán las variables independientes y cuáles las dependientes en el análisis

concreto que debe realizar.

En otros capítulos más avanzados veremos que una variable X puede cambiar

de magnitud si cambia una variable Y; el mismo tiempo, ésta cambia cuando cambia

la primera.

Variables neutras son las que no están relacionadas con ninguna otra.

Hay dos requerimientos sobre las variables: que obedezcan a una teoría pre

establecida o a una hipótesis racional, lógico y que el grado de relación entre ellas

sea suficientemente sólido.

Por ejemplo, puede suceder que los precios en España cambien en relación

directa con los nacimientos en Corea; esta aparente relación no es aceptable, puesto

que no hay ninguna teoría científica que la avale.

La relación entre el consumo y el ingreso es una relación que proviene de una

teoría. Una vez que aceptamos teóricamente la relación entre dos variables, toca

establecer cuándo esa relación es sólida; para ello se cuenta con un estadístico

 

4

mailxmail - Cursos para compartir lo que sabes 

Page 5: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 5/49

denominado valor p .

El valor p 

Estima la significancia estadística de una relación al mostrarnos que las

relaciones observadas pueden deberse al azar o a la existencia de una verdadera

relación entre las variables que estamos estudiando.

El valor p nos cuantifica la probabilidad de que estemos cometiendo un error

al interpretar una relación; esta cuantificación está directamente relacionada con el

grado de confianza que deseamos de los resultados.

Como se verá después, por lo general decimos que aceptamos un error del

5% en el grado de relación de las variables; el valor p será el que determine si los

resultados están o no dentro de ese margen de error.

El 5%, que escribimos 0.05 nos dice que de 100 casos corremos el riesgo deque tomemos por ciertos 5 casos que son errados; el concepto del valor p se

asentará a medida que los vayamos usando.

Todos estos datos son computados por el SPSS; pero podemos adelantar que

mientras más numerosa es la muestra en la que trabajamos más explícita se hará la

relación o neutralidad de las variables.

En la anterior afirmación también estamos adelantando algo que luego será

analizado con mayor detalle: los estudios estadísticos se basan, en la gran mayoría

de los casos en muestras tomadas de alguna población.

También nos enteraremos, en el capítulo relativo a la Muestra, que los

elementos de una población, de la que extraemos la muestra, están distribuidos de

diferentes maneras, pero que habrá una que nos interesará.

Esa distribución se llama Distribución Normal, y es la que se apega más a la

forma en que los sucesos se distribuyen en la realidad que deseamos analizar.

Por otra parte, la Estadística en general se divide en Estadística Descriptiva eInferencia Estadística.

La Estadística Descriptiva usa gráficas, tablas y diagramas para conocer las

características más importantes de los datos con los cuales debemos trabajar; es

con el estudio de esta rama que empezamos este curso.

 

5

mailxmail - Cursos para compartir lo que sabes 

Page 6: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 6/49

Esta parte de la Estadística nos ilustra sobre las medidas denominadas de

tendencia central, tales como la media aritmética, la mediana, la moda; muy pronto

nos haremos expertos en estos y otros temas.

También se ocupa de mostrar las medidas de dispersión: la varianza, la

desviación típica, las diferentes distribuciones de cada conjunto de datos.

Seguiremos con lo concerniente al muestreo y, finalmente, terminaremos este

primer curso test de hipótesis material para el que se reserva la Inferencia Estadística.

La metodología 

La parte teórica del curso se limitará a ofrecer los conceptos y exponer

algunos ejemplos muy sencillos para mostrar lo que hará la computadora por

nosotros, cuando le pidamos resultados sobre el análisis de datos.

Por esa razón, este curso de Estadística Aplicada I, incluirá también laenseñanza del uso del programa de estadística SPSS, versión 19; en realidad,

estaremos aprendiendo un par de materias al mismo tiempo.

En virtud de que se trata de un curso de Estadística Aplicada orientado a

resolver los problemas prácticos que se presentan todos los días, no habrá

demostraciones matemáticas; la operatividad la realiza el SPSS.

6

mailxmail - Cursos para compartir lo que sabes 

Page 7: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 7/49

2. La Recolección de datos

Datos, son la materia prima de las operaciones a la Estadística.

Información, pero los datos por sí solos nada nos dicen; para que sean útiles

al objetivo propuesto es preciso que los agrupemos y sistematicemos de la manera

adecuada; es decir, que los convirtamos en información.

Las fuentes de datos pueden provenir de registros que tienen otras

instituciones; también de la recopilación directa que realizamos; en este último

caso, uno de los medios más conocidos es la encuesta.

Los datos que recopilamos y sistematizamos, sobre la base de métodos ya

conocidos, nos permiten hacer suposiciones sobre las causas y los efectos de los

fenómenos que observamos en la realidad.

Por otra parte, nos sirven para establecer tendencias sobre los

comportamientos de las personas, objetos y fenómenos, tendencias que son muy

útiles, pues sus resultados nos orientan para obrar adecuadamente.

Una investigación sobre las preferencias por nuestros productos y la

competencia que se debe enfrentar debe acudir a las técnicas estadísticas para

lograr ese conocimiento y aplicar las políticas necesarias.

El concepto de Población 

En la disciplina estadística, la Población es el total de los elementos

potencialmente observables; v.g. el número de familias tienen un ingreso que les

permite satisfacer sus necesidades básicas.

Con el objeto de lograr esos datos exactos, es posible que se formule el

programa para realizar un censo nacional de todos los habitantes que hay en la

nación, en todos y cada una de las regiones que lo componen

En la disciplina estadística muy raras veces se usa la Población, pues es muy

difícil llegar a ella; además, es cara; más bien, se usa lo que se llama la Muestra. 

La Muestra 

Es una parte, proporcionalmente pequeña de la Población, la que, utilizando

las técnicas que aprenderemos en este curso, representa todas las características de

7

mailxmail - Cursos para compartir lo que sabes 

Page 8: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 8/49

la Población.

Hay varias maneras de lograr los datos que necesitamos en una muestra;

nosotros usaremos la encuesta.

La encuesta , es la recopilación sistematizada de datos que luego

transformaremos en información útil.

Una aclaración: en vez de enseñar primero el manejo del SPSS y luego

empezar con los temas del curso, más bien iremos aprendiendo ambos sobre la

marcha; esto es,Aprenderemos haciendo. 

Elaboración de la hoja de encuesta en SPSS 

Supongamos que el gerente de la empresa quiere averiguar nuestros

conocimientos en la elaboración de hojas de encuesta, utilizando métodos

computarizados, por medio de una prueba “a la vista”

Supongamos que nos deja a libre arbitrio el nombre de las columnas, pero

quiere estar seguro de que vamos a incluir diferentes clases de variables: desde

variables nominales hasta variables de escala.

Es en ese momento en que empezamos a explayarnos sobre la materia, para

lo cual, acudiremos a nuestro irremplazable amigo el SPSS, el que nos acompañará a

lo largo de éste y otros cursos.

El gerente, al pedirnos que realicemos una tarea como ésa, nos da una gran

oportunidad para explicarle, paso a paso, lo que estaremos haciendo para cumplir el

mandato

Para ello, hacemos click en el nombre del programa, el que debe estar en la

sección “archivos” con el nombre de IBM SPSS Statistics, versión 19; al hacer el click 

respectivo, aparecerán dos archivos.

Escogeremos el segundo de ellos: IBM SPSS Statistics 19; luego de la espera

correspondiente, cuya duración dependerá de la potencia del equipo que se tiene,aparecerá una hoja de diálogo.

En esa hoja habrá una pregunta en el lado izquierdo: ¿Qué desea hacer?

En el lado derecho aparecerán cuatro opciones; en esta oportunidad, haremos c

click en la tercera opción: “introducir los datos”; una vez que hemos escogido la

 

8

mailxmail - Cursos para compartir lo que sabes 

Page 9: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 9/49

opción, pulsamos Aceptar.

De inmediato se muestra ante nosotros una hoja con celdas constituidas por

columnas y filas.

Esa hoja se llama el Editor de Pantalla o Pantalla de Datos. 

En ella veremos que hay columnas y filas; en la parte superior de cada una delas columnas se lee la misma palabra: var, que es la abreviación de variable. 

Es una invitación para que pongamos los nombres de las variables que vamos

a utilizar.

Para ello, bajamos la vista y vemos que en la parte inferior de la hoja hay dos

casillas: una, con la leyenda Vista de datos y la otra: Vista de Variables ; también

observamos que Vista de datos tiene un fondo a color.

Eso quiere decir, que actualmente estamos en la sección de Vista de Variables

que es la que nos presentará los nombres de las variables y los registros

correspondientes.

Nuestra primera tarea será poner nombres a las columnas y registrar los

datos que nos interesen.

Pulsemos Vista de Variables; la hoja que veíamos cambiará a una nueva.

Esta nueva hoja sí tiene nombres en las columnas, las que usaremos de la

siguiente manera.

Nuestra primera variable se llamará sexo, porque define el género de las

personas encuestadas.

Ahora bien, vemos que la variable sexo no es una variable cuantitativa, sino,

cualitativa, pero el SPSS la va a transformar para que nos sirva en nuestra tarea de

hacer cálculos.

En consecuencia, en la primera casilla de la izquierda de Vista de Variables ,anotamos la palabra sexo  

Inmediatamente, las demás casillas horizontales de la misma fila se llenan

por defecto.

Nosotros vamos a la segunda casilla, donde dice numérico, al pulsar esa

 

9

mailxmail - Cursos para compartir lo que sabes 

Page 10: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 10/49

casilla, aparece una pequeña fila de puntos suspensivos; pulsamos esa pequeña fila

y se nos presente un cuadro de diálogo.

En ese cuadro hay opciones para los tipos de variables que vamos a necesitar;

en este caso, nos es útil, la opción Numérico, que ya estaba registrada por defecto;

pulsamos Numérico y aceptamos.

La tercera columna de Vista de Variables dice Anchura , lo que nos indica cuán

ancho ha de ser el espacio que ocupará el nombre de la variable sexo; por defecto

aparece 8 , pero nosotros queremos cambiar a 6.

Pulsamos en 8 y se nos aparecen dos flechas: la de arriba para aumentar el

ancho y la de abajo, para reducirlo; como la palabra sexo es más bien corta,

pulsamos la inferior hasta que aparezca 6.

Hacemos exactamente lo mismo para los decimales; no los necesitamos,

presionamos hasta 0.

Seguimos en la misma fila y llegamos a la casilla Etiqueta. 

El nombre que pondremos a sexo en esta casilla será más formal, puesto que

será ese nombre (etiqueta) que se mostrará en el informe final; en la casilla debajo

de Etiqueta escribimos Sexo (con mayúscula)

Una vez realizada estas operaciones nos encontramos con la casilla Valores; 

aquí es donde convertiremos esta variable sexo, que es cualitativa, en una

cuantitativa, asignándole un valor numérico.

Ahora nos corresponde convertir una variable categórica nominal en una

variable cuantitativa.

10

mailxmail - Cursos para compartir lo que sabes 

Page 11: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 11/49

3. Elaboración del Formulario de Encuesta

Vamos a identificar al sexo femenino con el número 0 y al masculino con el

número 1.

Para convertir la variable cualitativa sexo en una variable cuantitativa,

pulsamos la casilla que registra la palabra Valores; aparecerán tres puntos

suspensivos en fila; hacemos click en ellos.

Al hacerlo, veremos un cuadro de diálogo; en la casilla donde dice Valor 

inscribimos un 0.

En la casilla donde dice Etiqueta, registramos la palabra mujer ; y pulsamos Aña 

Añadir. 

Al hacerlo, veremos que en el cuadro inferior aparece “0 = mujer”.Aceptamos; la casilla Valores está vacía

Inscribimos en ella el número 1, y en la casilla Etiqueta registramos la palabra

hombre .

Pulsamos Añadir y en el cuadro aparecerá “1 = Hombre ”. Aceptamos

De ahora en adelante, el SPSS registrará con esos números el sexo de las

personas encuestadas.

Pasamos a la pantalla Vista de datos, pulsando la casilla del mismo nombre,

al pie de la hoja.

Allí vemos que la primera columna ya tiene un nombre: sexo. 

Si queremos conocer el nombre que irá en el Informe Final, apuntamos con el

cursor la casilla sexo. 

En unos segundos aparecerá la palaba Sexo, que es el nombre formal de la

casilla.

Supongamos que el gerente general quiere constatar las características que

tiene la variable sexo. 

Haremos click en la casilla Vista de variables , que está al final de la hoja y

volvemos a la hoja anterior.

11

mailxmail - Cursos para compartir lo que sabes 

Page 12: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 12/49

El nombre de la variable es sexo; el tipo es numérico; la anchura es de 6

espacios, tiene 0 decimales

Luego hacemos click en la siguiente casilla, lo que nos lleva al cuadro de

diálogo que ya conocemos.

En él, constatamos que el número 0 identifica a mujer y el 1 se reserva para ho 

hombre. 

Supongamos que hemos cometido un error y anotamos 3 para hombre.

En el cuadro de diálogo aparecerá lo siguiente: Valor 3; Etiqueta hombre y en

el cuadro tendremos:

0 = mujer; 3 = hombre.

Es preciso que modifiquemos la última entrada.

Hacemos click en el dato “3 = hombre” en el cuadro inferior; de inmediato se

activará la casilla eliminar .

El dato equivocado se elimina y procedemos a modificarlo de acuerdo con los

valore que habíamos asignado a cada género.

Ahora nos toca registrar las particularidades de la variable Edad.

Este procedimiento es mucho más fácil, porque la Edad es una variable

cuantitativa, no hay necesidad de hacer ninguna modificación.

Vamos a la hoja Vista de variables y hacemos click en la casilla que está

debajo de sexo. 

Allí anotamos: edad, dejamos la palabra que ya está allí Numérico, escogemos

una anchura de 4 y en la siguiente casilla anotamos 0 para el número de decimales.

En la casilla que corresponde a Etiqueta anotamos Edad en años cumplidos y

dejamos Ninguna en Valores puesto que la variable es cuantitativa.

Ya tenemos registrada la segunda variable; vamos a Vista de datos ; pulsamos

unos segundos con el cursor en la casilla edad y el nombre formal, la Etiqueta, nos

dice que la variable se llama Edad en años cumplidos. 

La tercera variable que nos interesa, según la encuesta virtual que estamos

haciendo, será Estado Civil. 

12

mailxmail - Cursos para compartir lo que sabes 

Page 13: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 13/49

Consideramos que hay cinco categorías: Soltero, Casado, Divorciado, Viudo,

Conviviente.

Cada una de estas variables, al igual que sexo, es cualitativa, por lo que

realizamos las mismas operaciones que hicimos para sexo .

Vamos a Vista de variables y pulsamos en la casilla que está debajo de edad; allí anotamos la siguiente palabra: estci , que significa Estado Civil ; la razón por la

que recurrimos a la abreviación será dada después.

Vamos a suponer los cinco estados civiles siguientes, en ese orden:

soltero, casado, divorciado, viudo y conviviente

La variable estci será numérica con 6 espacios, 2 decimales y la Etiqueta :

Estado Civil. 

Llegamos a Valores; pulsamos la casilla correspondiente donde dice Ninguna. 

Aparecerán los tres puntos, para ser pulsados por el cursor y tener acceso al

cuadro de diálogo.

Tal como hicimos antes, en la casilla Valo r escribimos 1, en la casilla Etiqueta ,

registramos soltero , pulsamos la casilla Añadir y aceptamos.

Procedemos a llenar la casilla Valor con el número 2 y la casilla Etiqueta con la

palabra casado  

Pulsamos Añadir y aceptamos; así, hasta que tengamos los cinco estados

civiles que hemos establecido.

Observemos que tanto la variable sexo como la de estado civil sólo nos

permite una opción: hombre o mujer, en el primer caso y cualquiera de los cinco

estados civiles, en el segundo.

En la siguiente variable, idiomas que habla, tendremos más de una opción.

Establezcamos los siguientes idiomas: Español, Inglés, Alemán y Francés.

En virtud de que tenemos más de una opción, cada idioma tendrá su columna

por separado

Empezamos con Español; esp, numérico, 8, 0, Espanol (sin la ñ)

13

mailxmail - Cursos para compartir lo que sabes 

Page 14: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 14/49

Lo mismo para todos los demás idiomas.

Ahora archivamos estos datos en el archivo que hemos escogido para el efecto

Ahora vamos a realizar una pequeña prueba para ver si el diseño de la hoja de

encuesta es correcto.

Para ello, hacemos haciendo click en Vista de datos y llenamos cinco filas condatos supuestos.

Recordemos que cada fila es una hoja de encuesta que los encuestadores nos

han entregado.

Tomamos la primera hoja hipotética y llenamos la primera fila con los datos

inventados.

Una vez que llenamos los datos supuestos, archivamos todo en el archivo que

hemos abierto.

En este caso el nombre del archivo que hemos habilitado es: ESTADISTICA

APLICADA EJERCICIO 1.sav

Ahora bien, una vez que el gerente ha visto que podemos usar el SPSS, nos

confía la tarea de analizar las características principales del personal de la empresa

en la que trabajamos.

Esas características incluyen estimar la media aritmética de los sueldos, la

mediana, la varianza, la desviación estándar, los intervalos de confianza, la

probabilidad de que el resultado sea cierto y otros.

Todo eso lo hará la computadora; pero nosotros tenemos que conocer los

conceptos de lo que se nos pide y, claro, interpretar los resultados que el SPSS nos

brindará al respecto.

14

mailxmail - Cursos para compartir lo que sabes 

Page 15: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 15/49

4. Medidad de Tendencia Central I

Una medida es de tendencia central se define como el punto medio de una

distribución; de inmediato vemos las más importantes con unos breves ejemplos

manuales para tener idea de lo que hace el SPSS.

La Media Aritmética  

Generalmente la conocemos como el promedio de una serie de datos.

Supongamos que deseamos saber el promedio de la edad de 6 personas que están

en un consultorio médico.

Para sacar ese promedio, simplemente sumamos las edades de todos y cada y

dividimos el resultado entre 6, que es el número de personas que nos interesa.

Media aritmética = (40 + 34 +28 + 10 + 23 + 50)/6 = 30.83

El resultado nos dice que la media aritmética o promedio de las edades de las

seis personas es 30.83 años.

Si queremos saber el ingreso promedio de cinco amigos que desean ir al cine,

preguntamos a cada uno cuanto tiene y luego hacemos lo mismo que en el caso

anterior:

Media aritmética = (4 + 20 + 12 + 9 + 13)/5 = 11,60

El resultado dirá que, en promedio, cada uno tiene 11 dólares con 60

centavos.

Ese es el concepto fundamental de la media aritmética, no importa cuán

pequeña o grande pueda ser el conjunto de datos que se nos presente, la media

aritmética siempre tendrá la misma definición:

Será la suma de todos los valores, dividida entre el número de casos.

Usando el lenguaje matemático, tendremos:

X* = X i / n

En esta igualdad, X* es la media aritmética de la muestra que hemos tomado;

Xi, son los valores que serán sumados; n es el número de observaciones.

Tomaremos un ejemplo cualquiera

15

mailxmail - Cursos para compartir lo que sabes 

Page 16: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 16/49

X* = (9 +7 + 7 + 6+ 4+ 4 + 2)/7 = 5.6

En este ejemplo, hay dos valores repetidos (el 7) pero eso no importa, igual se

lo toma en cuenta como cualquiera de los demás valores.

En los libros de Estadística se pone ejemplos sobre las formas de estimar la

media aritmética cuando los datos están ordenados o están desordenados; esto no

tiene importancia para el SPSS.

Después aprenderemos a usar rangos, pero eso será cuando ya sepamos

desenvolvernos mejor.

Ventajas y desventajas de la media aritmética 

Su principal característica es que un solo número representa a un conjunto de

datos; por otra parte es un concepto con el que todos estamos familiarizados y cada

conjunto de datos tiene una sola media.

También porque permite realizar comparaciones de medias de varios

conjuntos de datos.

Pero también tiene desventajas; v.g. puede haber valores extremos que no

son representativos del conjunto de los datos que estamos tomando en cuenta.

Derivemos la media aritmética de los siguientes datos, los que representan

los ingresos mensuales de 7 personas que trabajan en una empresa determinada.

2400, 3200, 2580, 3260, 2500, 2840, 19000

La media aritmética será: X* = (2400 + 3200 + 2580 + 3260 + 2500 + 2840

+ 19000)/ = 5111

De inmediato nos damos cuenta de que la media está muy influida por el

ingreso de 19000

En este caso, será más útil calcular la media anulando el valor extremo.

Para un conjunto grande de datos, la computadora

La media aritmética ponderada 

Tomemos el siguiente ejemplo (del libro “Estadística para Administradores”

Levin y. Rubin)

16

mailxmail - Cursos para compartir lo que sabes 

Page 17: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 17/49

Tipo de trabajo Salario por hora Sillas Mesas

No calificado

Semicalificado

Calificado

5

7

9

1

2

5

4

3

3

Observemos que el costo por producto incluye diferentes grados de

calificación de la mano de obra.

Ahora bien, si utilizáramos la media aritmética simple, tendríamos que salario

promedio sería:

X* = (5 + 7 + 9)/3 = $7

Si aplicamos ese salario promedio para estimar el costo de los sillas,

veríamos que la producción de este producto toma 5 hs. de trabajo no calificado; 2

hs. de semi calificado y 5 hs. de calificado

En consecuencia, estimaríamos el costo de producir una silla sería: 7(1 + 2 +

5) = $56

El costo de producir mesas sería: 7(4 + 3 + 3) = $70

Pero estos costos no sería los reales, puesto que el número de horas de cada

categoría de trabajo varía en la producción de las sillas y mesas.

El costo promedio correcto de la producción de sillas es: (5 x 1) + (7 x 2) + ( 9

x 5) = $64

En razón de que se invirtieron 8 horas de trabajo, el costo promedio del

trabajo por hora es:

64/8 = $8 por hora de trabajo.

En el caso de las mesas: (5 x 4) + ( 7 x 3) + (9 x 3) = $68

Como se invirtieron 10 hs. de trabajo en la producción de mesas, el promedio

salarial sería:

68/10 = $6.8 por hora de trabajo.

La media geométrica 

17

mailxmail - Cursos para compartir lo que sabes 

Page 18: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 18/49

Se usa, principalmente, para estimar los promedios de cantidades que

cambian con el tiempo.

Por ejemplo, tomemos una cuenta de ahorro que paga intereses.

Si dejamos el dinero depositado por algunos años, sin retirar, a una tasa

anual determinada, el depósito inicial se irá acumulando, de tal manera que cada

nuevo monto sumará los intereses y así sucesivamente.

Supongamos que dejamos $ 1000 en una caja de ahorros a una tasa anual de

10%.

Al final del primer año se tendrá un monto de $1100, es decir, los $1000

originales más el 10% que es $100. Al final del segundo año, tendremos una

ganancia del 10% de $1100, ya no de 1000.

Nuestra cuenta acumulada a fines del segundo año será 1100 x 0.10 = 110,los que sumados a los $1100 que ya teníamos, nos dará un total de 1210 y así

sucesivamente.

Pero hay todavía otros estadísticos de tendencia central.

18

mailxmail - Cursos para compartir lo que sabes 

Page 19: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 19/49

5. Medidad de Tendencia Central II

La Mediana 

Es el valor que está más al centro de un conjunto de datos ordenados de

menor a mayor.

Tomemos los siguientes datos ordenados de menor a mayor, los que

representan los ingresos semanales de 11 personas tomados al azar como una

muestra:

120, 140, 200, 240, 260, 380,450, 500, 630, 700, 750

De acuerdo con la definición dada, la Mediana será $380, pues ese monto

está exactamente al medio del conjunto de datos de la muestra.

Nos damos cuenta de ello, porque constatamos que hay cinco observaciones

a la izquierda de la Mediana y cinco a la derecha; esa simetría se da porque el

número total de observaciones es impar

Si agregamos un dato más a la muestra, tendremos:

120, 140, 200, 240, 260, 380, 390, 450, 630, 700, 750, 780

Vemos que el número de datos de la muestra es par (12) por lo que para

calcular la Mediana tendremos que usar una fórmula en la que n = número dedatos.

Mediana = (n + 1)/2 = (12 + 1)/2 = 13/2 = 6.5

El resultado, 6.5, nos indica que es preciso sacar la media de los datos sexto

y séptimo de la serie.

El sexto dato es 380; el séptimo es 450; la media aritmética de ambos: (380 +

450)/2 = $415

El SPSS Calculará inmediatamente la Mediana de series de prácticamente

cualquier tamaño.

Ventajas de la Mediana 

A diferencia de la media aritmética, la mediana no está influida por los

valores extremos.

19

mailxmail - Cursos para compartir lo que sabes 

Page 20: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 20/49

La Moda 

La moda el valor que más se repite en el conjunto de datos; tomemos los

datos utilizados en la mediana, pero lo transformemos de tal manera que el valor

260 se repite dos veces; en ese caso la Moda será 260.

120, 140, 200, 240, 260, 260, 380, 390, 450, 630, 700, 750, 780

La Moda no es muy utilizada; pero puede aplicarse cuando vemos valores

repetidos en la muestra.

Cuando lleguemos al capítulo de las distribuciones, haremos una

comparación entre la media aritmética, la mediana y la moda, con relación a la

posición central que ocupan en una gráfica de distribución.

Mientras tanto, diremos que no hay reglas generales que nos permitan

escoger alguna de ellas; en todo caso diremos que la media aritmética es la medida

de tendencia central más usada.

La Media Armónica 

También se la conoce como H, de una cantidad de números y es igual al

recíproco de la media aritmética.

La media armónica resulta poco influida por la existencia de determinados

valores mucho más grandes que el conjunto de los otros, pero es muy sensible a

valores mucho más pequeños.

Tales son las medidas de tendencia central más importantes.

Medidas de dispersión 

Si las medidas de tendencia central nos sirven para identificar un valor que se

acerque más al centro de una serie de datos; las medidas de dispersión nos

muestran el grado en que se alejan del centro.

El Rango: Es la diferencia entre el valor más alto y el más pequeño de los

datos.

Acudamos otra vez a las serie de datos utilizados para calcular la Mediana: el

rango 780 – 120 = 660

120, 140, 200, 240, 260, 260, 380, 390, 450, 630, 700, 750, 780

20

mailxmail - Cursos para compartir lo que sabes 

Page 21: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 21/49

Medidas de desviación promedio 

Estas medidas nos sirven para calcular la desviación promedio que hay entre

los valores de una serie de datos y una medida de tendencia central. (Estos ejemplos

son sólo conceptuales, pues el SPSS las calcula)

La Varianza: Concepto 

Es la media aritmética del cuadrado de las desviaciones respecto a la

media de una distribución estadística.

La varianza de la muestra se representa por S2

Para aclarar el concepto, tomemos los siguientes datos: 2, 4, 6, 8, 10

La media aritmética será: (2 + 4 + 6 + 8 + 10)/5 = 30/5 = 6

Ahora bien, tomemos los datos originales vemos que el valor 2 se desvía en -

4 de la media aritmética que (2 - 6 = - 4): el valor 4 se desvía en - 2 unidades: (4 – 

6 = - 2) el valor 6 no se desvía de la media aritmética

Pero el valor 8 sí se desvía en 2 (8 – 6 = 2) que es una desviación positiva

Si deseáramos sacar la media aritmética de estas desviaciones nos

encontraríamos que su valor sería 0, pues los valores positivos anularían a los

negativos.

Para calcular la varianza y eliminar este problema no tomamos en cuenta la

desviación simple de cada observación con la media aritmética, sino que recurrimos

a elevar cada desviación al cuadrado.

Los hacemos así, porque una cantidad elevada el cuadrado, ya sea positiva o

negativa, siempre nos dará un resultado positivo, que es lo que se busca.

La suma de los cuadrados de esas diferencias será dividida por el número de

observaciones (5) menos 1, lo que nos dará la varianza = S2

S2 = [(2 – 6)2 + (4 – 6)2 (6 – 6)2 + (8 – 6)2 + (10 – 6)2]]/(5 – 1)

S2 = [(-4)2 + (-2)2 + (0)2 + (2)2 + (4)2]4= [(16 + 4 + 4 + 16)]/4 = 40/4=

1 0

En consecuencia diremos que la varianza de la Muestra es 10

21

mailxmail - Cursos para compartir lo que sabes 

Page 22: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 22/49

La Desviación Típica de la Muestra = s 

Es la raíz cuadrada de la Varianza: s = raíz cuadrada de S2

En este caso, s = raíz cuadrada de 10 = 3.16

Como al principio tuvimos que elevar las diferencias al cuadrado para obtener

el estadístico denominado La Varianza, ahora hacemos la operación inversa ysacamos la raíz cuadrada de S2.

Las medidas de tendencia central y de dispersión son los estadísticos básicos

de la Estadística.

Por supuesto, son también los más usados en todos los niveles.

Este ejercicio, fácil, se vuelve complicado cuando la muestra tiene, digamos,

20000 observaciones.

Calcular una muestra para esos valores es una de las tareas más simples que

realiza el SPSS

22

mailxmail - Cursos para compartir lo que sabes 

Page 23: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 23/49

6. El Uso del SPSS

Una vez definidas conceptualmente las medidas de tendencia central y las

medidas de dispersión, vamos al SPSS para aprender cómo las obtenemos.

Supongamos que deseamos saber las medidas de tendencia central y de

dispersión de los sueldos actuales que reciben los empleados de la empresa donde

trabajamos.

Abrimos el SPSS, pulsamos la tecla registrar datos del cuadro de diálogo; una

vez que tenemos el editor de datos, pulsamos archivo, para abrir Employee dadt.sav

del archivo que viene con el SPSS 19.

Una vez que tenemos en la pantalla los datos de Empoyee data.sav,

colocamos el cursor en cada uno de los títulos de las columnas para saber cuáles

datos muestran los salarios actuales de los empleados

Cuando apuntamos el cursor en la columna “salary” vemos que el nombre

formal es Current Salary.

Es de esa columna que deseamos pedirle al SPSS que calcule las medidas

deseadas.

Pero, de entrada tenemos un problema; los salarios están registrados con el

signo $ = dólar; para calcular sin problemas los indicadores que deseamos, vamos acambiar los datos al tipo Numérico.

Para eso, vamos a Vista de Variables; encontramos la variable “salary” y vemos

que está con tipo dólar.

Hacemos click en la casilla que dice Dólar en la columna “Tipo”, ingresamos al

cuadro de diálogo y allí vemos que, efectivamente, la variable “salary” está medida

en Dólar; pulsamos Numérico y aceptamos.

Volvemos a Vista de datos y vemos que el signo Dólar ($) ha desaparecido;

ahora podemos instruirle al SPSS que nos calcule los indicadores que deseamos

sobre la variable “salary”.

En el menú superior pulsamos en “Analizar”, se nos presentará un cuadro de

opciones; pulsamos “Estadísticos Descriptivos”; a la derecha aparecerá otro cuadro,

 

23

mailxmail - Cursos para compartir lo que sabes 

Page 24: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 24/49

del cual escogemos “Descriptivos”

Se nos presentará un cuadro con todas las variables de Employee data.sa y un

cuadro en blanco a la derecha; pulsamos en “Current salary”, inmediatamente

pulsamos la flecha que apunta a ese cuadro.

La variable Current salary ya está en el cuadro blanco; pulsamos “options” y

en el cuadro que aparece, escogemos: Rango, Salario Mínimo, Salario Máximo,

Media Aritmética, Desviación Típica y Varianza

Volvemos al anterior cuadro de diálogo y pulsamos aceptar; se nos

presentará el Editor con los datos.

Para ver los resultados, vamos al menú superior del Editor y pulsamos

“Ventana”.

Aparecerán dos líneas: escogemos la primera que dice “Resultados”; así nostrasladamos hasta la hoja de resultados en la que vemos una pequeña tabla, la que

se muestra a continuación.

Estadísticos descriptivos

N Rango Mínimo Máximo Media Desv. típ. Varianza

Current Salary 474 119250 15750 135000 34419,57 17075,661 2,916E8

N válido(según lista)

474

N significa el número de observaciones, en este caso nos dice que en la

empresa hay 474 empleados y que el SPSS los ha tomado a todos; el Rango, es decir,

la diferencia entre el salario mayor y el menor, es $473

El Salario Mínimo es $15740 al año; el máximo es $135000; la Media

aritmética o el promedio de los salarios es $34419.57; la desviación típica es

17075.661 y la Varianza tiene un valor de 29160000.

Supongamos ahora que deseamos saber los mismos estadísticos pero paralos salarios que los empleados ganaban al momento de ser contratados por la

empresa.

Para volver al cuadro de datos, pulsamos “Ventana” en el menú superior y

escogemos la opción adecuada.

 

24

mailxmail - Cursos para compartir lo que sabes 

Page 25: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 25/49

Pero ahora nos encontramos que en el cuadro derecho aún está la variable

“salary·

Hacemos click en la variable “salary”, pulsamos la flecha, la que ahora indica

la dirección opuesta, y la variable “salary” vuelve a formar parte de las variables

consignadas en el cuadro izquierdo.

Pulsamos la columna donde se registra “salbegin” que tiene el nombre formal

de “Beginning Salary” y repetimos el proceso anterior; la tabla de resultados es:

Estadísticos descriptivos

N Rango Mínimo Máximo Media Desv. típ. Varianza

BeginningSalary

4 74 70980 9000 79980 17016,09 7870,638 61946944,959

N válido

(segúnlista) 474

Una comparación de los promedios salariales entre ambas dimensiones, los

salarios actuales y los que se recibían al comienzo nos muestra una gran diferencia:

34419 para los primeros y 17016 para los otros.

A medida que avancemos con el programa podremos establecer si la

diferencia de dos promedios es o no significativa; lo que es muy útil en una

investigación de tipo estadístico.

Borrar información de la Pantalla de Resultados 

Cada vez que deseamos tener una nueva pantalla de resultados, borramos las

que se encuentran en ella; lo hacemos de dos maneras: llevando el cursor a la

izquierda y pulsando el botón de “Resultado”.

Con esa instrucción, el SPSS borrará todos los elementos que constan en la

pantalla.

Si deseamos borrar sólo uno o algunos elementos de la pantalla, vamos

también a la izquierda y pulsamos cada uno de los elementos que deseamos borrar.

Sin embargo, la manera más práctica es hacer click en los elementos que ya

no necesitamos y apretar la tecla “suprimir” en el teclado de nuestra computadora.

El Coeficiente de Variación 

25

mailxmail - Cursos para compartir lo que sabes 

Page 26: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 26/49

Es la relación entre la desviación típica y la media de la muestra: s/X*

Tomemos la desviación típica de la tabla de Begining salary que es 7870 y la

media, 17016

El coeficiente de variación será 7870/17016 = 0,462

Si deseamos expresar este coeficiente en porcentaje, lo multiplicamos por

100 = 46.62 %

Por lo general, se usa este coeficiente para comparar la variabilidad que

tienen diferentes unidades de medida; supongamos que se desea comparar el grado

de variabilidad de dos poblaciones

La primera población tiene datos referidos al ingreso y la segunda a los años

de educación; en este caso, se usará el Coeficiente de Variación de cada una sobre

los datos de sus medias y desviaciones típicas.

La diferencia entre ambos coeficientes nos podrá dar alguna información

relevante.

26

mailxmail - Cursos para compartir lo que sabes 

Page 27: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 27/49

7. Distribución de Frecuencias

Una distribución de frecuencias es una tabla en la que organizamos los datos

dividiéndolos en Clases o grupos que describen alguna característica de los datos.

Si no dividimos los datos en grupos o clases, entonces, cuando pidamos, v.g,

las frecuencias de los salarios, el SPSS nos dará un cuadro con el salario de cada uno

de los empleados.

Si la fábrica tiene 2000 empleados, tendremos un cuadro de 2000 salarios;

pero, cuando necesitamos las medidas de tendencia central o cualquier otra, el SPSS

acudirá a los datos originales, no a los grupos.

A no ser que, por alguna razón, necesitemos la media u otro estadístico de

los grupos.

Una distribución de frecuencias muestra el número de observaciones del

conjunto de datos que caen en cada una de las clases en las que hemos dividido los

datos originales.

Para hacerlo, utilizaremos el SPSS y el archivo Employee.sav .

Vamos a construir el cuadro de frecuencias del salario actual de los

empleados de la empresa

Lo que debemos hacer es tomar una variable y sobre ella crear otra variable

que nos permita clasificar los datos en clases, de este modo podremos iniciar la

tarea de diseñar un cuadro de frecuencias.

Menú Principal Transformar ; en el cuadro que aparece escogemos

Recodificar en distintas variables . Cuando se abre el cuadro de diálogo vemos dos

pantallas.

La pantalla de la izquierda contiene todas las variables; escogemos Current 

Salaly y la trasladamos a la pantalla de la derecha, haciendo click en la flecha de

dirección.

Una vez en la casilla, vemos que la variable Current Salalry ha cambiado a

salary , que es el nombre que aparece al comienzo de la columna respectiva,

mientras que Current Salary , es la etiqueta formal.

27

mailxmail - Cursos para compartir lo que sabes 

Page 28: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 28/49

En el cuadro aparece un signo de interrogación después de salary , eso

significa que el SPSS nos pide dar un nuevo nombre a la variable que vamos a

recodificar.

En la parte derecha hay dos casillas: una que dice “nombre” y la otra

“etiqueta”; entramos a “nombre” y registramos el nombre que deseamos ponerle a la

nueva variable: rsalary (Podría ser cualquier otro)

En la casilla Etiqueta ponemos el nombre formal Salario Actual .

Pulsamos la casilla Cambiar” y la nueva variable aparece en la pantalla donde

está la variable salary .

La nueva variable rsalary ocupa el lugar donde estaba el signo de

interrogación.

Con esa operación hemos estructurado una nueva variable, rsalary , sobre labase de la variable salary, desde este momento, el SPSS tratará a la nueva variable

como independiente.

En la parte inferior hay una casilla que dice Valores antiguos y nuevos ; la

pulsamos y se nos presenta un cuadro de diálogo; éste cuadro es el que nos

ayudará a dividir nuestros datos en clases.

Vamos a dividir los datos en cuatro clases; para ello pulsamos el botón que

dice: rango, en la parte izquierda del cuadro; al hacerlo, se habilitarán dos casillas

en blanco.

En la primera registramos 15000 (el valor mínimo de los salarios) en la casilla

que está debajo, escribimos 35000; luego vamos a la parte superior derecha para

pulsar el botón de valor y en la casilla anotamos 1.

Click en “Añadir” y en la casilla inferior aparece 15000 trhu 45000 1.

Esto quiere decir que la primera de nuestras clases incluirán todos los valores

desde 15000 hasta 25000.

Otra vez vamos a la izquierda click “rango” y anotamos 45001 en la casilla

de abajo.

Vamos a la casilla inferior, donde dice “hasta” y anotamos 75000.

Nos trasladamos al lado derecho “Valor”, anotamos 2 en la casilla

28

mailxmail - Cursos para compartir lo que sabes 

Page 29: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 29/49

respectiva click en “Añadir”.

En la pantalla inferior aparecerá un nuevo registro después del anterior.

Esta vez con la leyenda que dice: 45001 thru 75000 2.

Repetimos la operación para la tercera clase: anotamos 75001 en la casilla

“rango” y 105000 en la que dice thru; vamos al lado derecho, pulsamos el botón“valor” y anotamos 3 en la casilla; luego pulsamos “Añadir”.

La tercera clase aparece en la parte de abajo con la leyenda: 105001 thru

135000 anotamos 4 OK.

Manchamos “current salary” de la pantalla, pulsamos la flecha direccional y la

devolvemos a la izquierda.

En la última columna de la pantalla de datos aparecerán los intervalos

codificados 1, 2, 3 y 4, de acuerdo con los valores de cada rango salarial.

Pero, lo que deseamos es que en la Pantalla de Datos aparezcan los intervalos,

tales como 15000 – 45000 para todos los rangos que hemos recodificado.

Para ello vamos a la sección Vista de Datos , al final de la misma está la

variable creada rsalary; hacemos click en la columna Cambios e iniciamo el proceso

de recodificación, tal como lo hicimos en Transform  

En la columna Valores correspondiente a la variable creada “rsalary, aparece el

rótulo Ninguna…

Hacemos click en los puntos y se nos presente un cuadro de diálogo.

En la casilla Valor anotamos 1 y en la que dice Etiqueta registramos 15000 – 

45000, pulsamos Añadir y esta primera clase aparece registrada en la pantalla;

hacemos lo mismo con 45001 – 75000.

Seguimos dando los mismos intervalos anteriores; estamos recodificando la

nueva variable “rsalary”, cuyo nombre formal Salario Actual incluimos en la casillacorrespondiente a la columna Etiqueta .

Continuamos del mismo modo, variando las clases de 75001 en 105000

hasta llegar a la última, la clase número que será 105001 – 135000; aceptamos y en

la pantalla de datos tendremos los intervalos creados.

 

29

mailxmail - Cursos para compartir lo que sabes 

Page 30: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 30/49

Hay dos cosas que es necesario tener en cuenta; primero, luego de que la

primera clase 15000 – 25000 ha sido registrada, la siguiente empieza con 25001,

para no repetir el valor de 25000; lo mismo con las demás.

Frecuencias 

Lo primero que deseamos saber es cuántas observaciones se incluyen en

cada intervalo.

En la pantalla de Vista de datos , vamos al menú superior y pulsamos Analizar 

Analizar ”; se abrirá el cuadro de opciones; de allí escogemos Estadísticos 

Descriptivos   Frecuencias .

Se abre el cuadro en el que la lista de variables está a la izquierda; si a la

derecha todavía figura la variable que habíamos transformado, “current salary”, la

manchamos con el mouse y la trasladamos a la izquierda.

Hacemos click en la variable Salario actual y con la flecha de dirección la

llevamos a la derecha.

Aceptamos; en la pantalla de Resultados aparece el cuadro de frecuencias con

las clases respectivas.

Este es el cuadro que nos servirá para diseñar nuestra primera distribución de

frecuencias.

Eso es lo que haremos en el próximo capítulo.

30

mailxmail - Cursos para compartir lo que sabes 

Page 31: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 31/49

8. Estructurar una Distribución de Frecuencias

El cuadro que aparece en la pantalla de resultados nos muestra el número

total de casos, 474, y el número de observaciones clasificados por los grupos

salariales que habíamos estructurado.

La clasificación de los salarios en clases, con los rangos determinados, nos

permite no sólo saber cuántas personas hay en cada clase, sino que podemos

graficar con mayor claridad los datos que usemos.

Hacemos click en el cuadro, pulsamos el botón derecho del mouse y

escogemoscopy , y posteamos en la presente página de manera tal que podamos

realizar las modificaciones necesarias.

Salario Actual Frecuencia Porcentaje

Porcentajeválido

Porcentajeacumulado

Válidos

15000 -45000

391 82,5 82,5 82,5

45001 -75000

6 6 13,9 13,9 96,4

75001 -105000

1 5 3,2 3,2 99,6

105001 -135000

2 ,4 ,4 100,0

Total 474 100,0 100,0

Para formular nuestro cuadro de distribución de frecuencias, reemplazamos el

título “Porcentaje válido” por “Probabilidad” y anulamos la última columna haciendo

click con el botón derecho del mouse Delete Cells

En las opciones que aparecen hacemos click en Delete Entire Colum; ponemos

el título Distribución de Frecuencias de los salarios; el cuadro queda estructurado dela siguiente manera

Distribución de Frecuencias de los Salarios 

Frecuencia Porcentaje Probabilidad

15000 - 45000 391 82,5 0,825

31

mailxmail - Cursos para compartir lo que sabes 

Page 32: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 32/49

Válidos

45001 - 75000 6 6 13,9 0,139

75001 - 105000 1 5 3,2 0,032

105001 - 135000 2 ,4 0,004

Total 474 100,0 100,0

El cuadro de probabilidad resulta de la división entre 100 de todos y cada

uno de los datos que aparecen como porcentaje en la tabla anterior.

Los datos de la nueva tabla se interpretan de la siguiente manera

En la empresa hay 391 empleados que ganan un salario comprendido entre

15000 – 45000; lo que representa una porcentaje del 82.5%

La probabilidad de que escojamos a uno de ellos, de entre todos los

empleados, es 0,825

En la empresa hay 66empleados que perciben un salario comprendido entre45001 – 75000 y constituyen el 13,9% del total; la probabilidad de que escojamos a

uno de ellos es 0,139; y así con los demás registros.

El total de las probabilidades suma 1, tal como se ve en la tabla; cada

probabilidad se obtiene dividiendo el porcentaje respectivo entre 100; para los

decimales se usa la coma.

Gráficas de las distribuciones de frecuencias. 

A continuación mostraremos las principales gráficas que representan a los

datos inscritos en una tabla de frecuencia; las gráficas son muy necesarias para

darnos una imagen más rápida de la información.

El Histograma 

Es una de las gráficas más conocidas; consiste en una serie de rectángulos

cuya anchura la distancia que existen entre las dos cantidades que estructuran una

clase.

Para obtener el Histograma respectivo, vamos al Menú Principal Gráf icas 

Cuadros de diálogos antiguos Histograma  

Antes de cerrar vemos en la parte superior derecha la casilla Títulos: hacemos 

click y en la primera línea escribimos Salarios Actuales; en la segunda, Niiveles 

Salariales Estratificados.  

32

mailxmail - Cursos para compartir lo que sabes 

Page 33: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 33/49

La clase 1 (15000 – 45000) está representada por la base de un rectángulo.

La altura de cada rectángulo señala el número de frecuencias que se

encuentran entre ese intervalo

A la derecha del histograma se muestra la media, la desviación típica y el

número total de empleados.

El histograma, como veremos, es útil para el técnico, pero no es muy claro

para los ejecutivos.

El Histograma es una gráfica muy útil, especialmente cuando queremos

comprobar si la distribución de una variable se aproxima a la distribución normal, tal

como veremos en otro capítulo.

Así, las clases simplemente están representadas por números, los que no dice

mucho cuando deseamos presentar un informe a los ejecutivos de la empresa.

Para presentar un informe más claro a los ejecutivos, recurrimos a la gráfica

de barras.

El SPSS nos presenta varias opciones de gráficas, las que iremos usando y

aprendiendo a diseñarlas a medida que vamos avanzando en el curso y tocamos

nuevo temas que exigen otros usos del SPSS.

En el próximo capítulo usaremos las gráficas de barras.

33

mailxmail - Cursos para compartir lo que sabes 

Page 34: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 34/49

34

mailxmail - Cursos para compartir lo que sabes 

Page 35: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 35/49

9. Gráficas

Para obtener las barras de frecuencias, pulsamos Gráficas en el Menú

Principal; elegimosCuadros de diálogos antiguos Barras Simple Definir No.

De Casos  

Introducimos Salario Actual en la casilla que dice Definir sectores por; e n la

parte superior derecha hacemos click en Títulos ; allí escribimos: Salarios Actuales en

la Primera Línea y Salarios Actuales Estratificados. 

 

 

Copiamos la gráfica y vemos que nos ha dado los intervalos y las frecuencias

de cada uno anotando el intervalo en cada caso; no sólo como categorías 1, 2, ….

Si se quiere cambiar las características del gráfico, por ejemplo, el color, la

textura, la letra….

Hacemos doble click en la gráfica de barras; aparecerá un nuevo menú;escogemos editar y allí elegimos la opción que nos parezca más adecuada.

Otra gráfica muy útil es la de “Sectores” (Pie)

35

mailxmail - Cursos para compartir lo que sabes 

Page 36: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 36/49

Gráficas Cuadros de diálogos antiguos Sectores Títulos; la gráfica que

aparece en el cuadro de resultados muestra los datos que le habíamos pedido; la

traemos a la presente página a través de Copy.

Podemos cambiar todo lo que nos parezca, haciendo doble clik en la torta del

cuadro de resultados.

Observemos cómo vamos aprendiendo Estadística y, al mismo tiempo, el uso

del SPSS; me pareció más conveniente este método de “aprender sobre la marcha”

en vez de dar un curso completo de una sola vez.

Cuando terminemos el curso de Estadístico, en todos sus niveles, éste es el

primero de ellos, habremos concluido también con el aprendizaje del SPSS en todo

lo que se refiere al campo concreto de la Estadística.

Podemos lograr un resultado más completo a través del Menú Gráficas – 

Generador de Gráficas  

36

mailxmail - Cursos para compartir lo que sabes 

Page 37: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 37/49

Se nos presenta una pantalla blanca, bajo de la cual hay varias opciones de

gráficas.

Escogemos la de barras, se nos presentará una advertencia, aceptamos y se

nos presenta un cuadro con una pantalla blanca arriba y varios modelos de gráficas,

abajo.

Pero, en vez de hacer click en la gráfica de barras, más bien la arrastramos

hasta la pantalla blanca.

Del mismo modo, de la casilla de archivos a la derecha, hacemos click en la

variable Salarios Actuales y la arrastramos hasta el eje de las abscisas de la gráfica

de barras.

Dejamos disponible el eje de la y’s para que consigne las frecuencias

(Recuento) de los intervalos.

En la casilla de títulos ponemos los mismos de la anterior barra.

También hacemos clic propiedades del elemento para especificar lo que

deseamos; luego hacemos clic Opciones y allí, escogemos en Nota al pie del espacio

inferior, la que aparece como el error aceptado.

En ese cuadro vemos la presencia de unas figuritas extrañas, cuyo significado

37

mailxmail - Cursos para compartir lo que sabes 

Page 38: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 38/49

aprenderemos luego.

38

mailxmail - Cursos para compartir lo que sabes 

Page 39: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 39/49

10. Probabilidad

Introducción 

Los principales precursores del cálculo de probabilidades fueron Jacob

Bernoulli (1674-1705) Abraham de Moivre (1667-1754) Thoma Bayes (1702-1761) y

Joseph Lagrange (1736-1813)

La teoría de la probabilidad es la base es la base de las investigaciones

estadísticas en las investigaciones de las ciencias sociales y en la toma de decisiones.

En realidad, las llamadas “leyes” en las ciencias sociales no son sino

tendencias estadísticas en el tiempo, las que pueden ser estimados con un grado de

probabilidad.

Conceptos básicos 

Probabilidad es la posibilidad cuantificada de que algo suceda

Evento : Uno más de los posibles resultados de hacer algo

Si lanzamos una moneda al aire, saldrá “cruz” o “cara”, cada resultado es

considerado un evento.

Experimento, la actividad que produce un evento; en este caso, el lanzar la

moneda.

¿Cuál será la probabilidad de que una moneda, al ser lanzada, caiga y nos

muestre “cara”? será ½ o 05.

Espacio muestral : al lanzar la moneda el espacio muestral es: {cara, cruz}

Si dos eventos pueden ocurrir al mismo tiempo, entonces decimos que los

eventos no son mutuamente excluyentes ; si dos eventos no pueden ocurrir

simultáneamente serán mutuamente excluyentes. 

La probabilidad de sacar una carta de un paquete de 52 cartas, será 1/52

La de sacar una reina será 4/52, pues existen cuatro reinas en el mazo.

La de sacar un trébol será 13/52, pues hay 13 tréboles en un mazo.

La probabilidad de sacar una carta roja es 26/52, dado que hay 26 cartas

39

mailxmail - Cursos para compartir lo que sabes 

Page 40: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 40/49

rojas.

La probabilidad de sacar un “as” al lanzar un dado es 1/6, porque hay seis

números y un solo as.

Del mismo modo con los otros números.

Probabilidad Clásica 

La probabilidad de que un evento ocurra es definida del siguiente modo:

E = F/(T)

E = Evento; F número de casos favorables; T, el total de casos

En los ejemplos de las cartas, el número favorable de sacar una reina era 4 y

el total de casos, 52

En el ejemplo de los dados, el número favorable de sacar un “as” es 1 y el

total de casos es 6.

La probabilidad clásica nos dice que los resultados posibles deben ser iguales

entre sí.

La probabilidad clásica es conocida también como probabilidad a priori,

porque los resultados puede ser conocidos de antemano, tal como sucede con los

experimentos de las cartas o los dados.

Frecuencia relativa de la presentación 

Es el porcentaje del resultado de casos favorables de un experimento con

relación al total de casos.

Probabilidades subjetivas 

Se basan en las creencias de las personas que diseñan el experimento; sería la

probabilidad asignada a un evento por parte de un individuo.

La probabilidad subjetiva es útil cuando no hay antecedentes para establecer

una probabilidad objetiva

¿Cuál es la probabilidad de que un reactor atómico a ser instalado en cierto

lugar irradie radiactividad?

Dado que no existe un antecedente, entonces se recurrirá a las suposiciones y

40

mailxmail - Cursos para compartir lo que sabes 

Page 41: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 41/49

al sentido común.

Los responsables de tomar decisiones en una empresa usan la subjetividad

para los casos únicos que se presentan a diario en asuntos de mercado, precios,

insumos y otros similares.

Reglas de la Probabilidad 

Los siguientes símbolos son los que mayormente se utilizan en el cálculo de

probabilidades:

P(A) = Es la probabilidad de que el evento A suceda.

Si puede llevarse a cabo sólo un evento, la probabilidad será sencilla; esta

clase de probabilidad también es conocida como probabilidad marginal o 

incondicional .

Si hay un sorteo para ganar un premio y el total de casos es 60, la

probabilidad de que alguien saque el número premiado es 1/60 = 0,0167; en este

caso, sólo un participante puede ganar.

Eventos mutuamente excluyentes 

Hay casos en los que pueden realizarse dos eventos: uno o el otro

Supongamos que hay 5 candidatos a un cargo público y que todos tienen los

mismos méritos.

Si utilizamos el concepto marginal de probabilidad, diremos que la

probabilidad de que uno de ellos sea elegido será 1/5; pero, si estamos interesados

en saber la probabilidad de dos candidatos, la cosa cambia.

Supongamos que tenemos un interés especial en saber las probabilidades de

que Juan Monasterios o María Zeballos ganen el concurso de méritos; en este caso

tenemos dos eventos que se suman entre sí.

Diremos que la probabilidad de Juan es de 1/5 y la de María también es 1/5;entonces de probabilidad de que alguno de los dos sea elegido será 1/5 + 1/5 =

2/5 = 0,40

En el primer caso, el de que uno de los cinco gane, la probabilidad será P(A) =

1/5 = 0,20

 

41

mailxmail - Cursos para compartir lo que sabes 

Page 42: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 42/49

En el segundo caso, la probabilidad se representará del siguiente modo: P(A o

B) que suceda uno de los dos

Para mostrar gráficamente lo que la suma de probabilidades significa, los

teóricos recurren a los símbolos de los conjuntos en matemáticas; esos símbolos

son muy útiles en la tarea de comprender los teoremas.

Tomemos la siguiente tabla, del libro de Levin y Rubin, en la que se consigna

datos sobre el número de hijos

Número de hijos 0 1 2 3

4 5 6 o más

Proporción de familias

Que tienen esa cantidad 0.05 0.10 0.30 0.25

0.15 0.10 0.05

De hijos

En el cuadro anterior tenemos una muestra para establecer las

probabilidades de que una familia tenga un número determinado de hijos; v. g: la

probabilidad de que una familia no tenga hijos es 0.05.

La probabilidad de que una familia tenga 4 hijos es 0.15 y así sucesivamente.

Ahora deseamos saber la probabilidad de que una familia del pueblo donde

se hizo la encuesta tenga 4 o más hijos; de inmediato nos damos cuenta de que ya

no estamos hablando de un solo evento sino de varios.

42

mailxmail - Cursos para compartir lo que sabes 

Page 43: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 43/49

11. Probabilidad en varios eventos

La condiciones del anterior capítulo se representan de la siguiente manera:

P(4,5,6 o más) = P(4) + P(5) + P(6 o más)

= 0.5 + 0.10 + 0.05 = 0.30

Ahora ingresamos a una situación que puede darse en muchas oportunidades.

Supongamos que deseamos obtener un diez o un trébol de un mazo de 52

cartas; en este caso, debemos tener en cuenta que también podemos sacar un “diez

de trébol”.

Nos damos cuenta que sacar un diez o trébol no son eventos mutuamente

excluyentes, debido a que hay la probabilidad conjunta de un diez y un trébol al

mismo tiempo.

Debemos ajustar la ecuación para evitar el conteo doble, es decir, hay que

reducir la probabilidad de obtener ambos eventos juntos cuando deseamos saber la

probabilidad de un as o un corazón.

De este modo tendremos: P(diez) + P(trébol) – P(diez y trébol)

4/52 + 13/52 – 1/52 = 16/52 = 4/13

Otro ejemplo; los empleados de la empresa han elegido a 5 de ellos para que

los representen en el consejo de administración; los perfiles de los elegidos son:

Hombre, edad 30

Hombre 32

Mujer 45

Mujer 20

Hombre 40

Una vez elegidos, los cinco deciden, a su vez, elegir un portavoz

¿Cuál será la probabilidad de que la persona elegida sea mujer o tenga una

edad por encima de 35 años?

43

mailxmail - Cursos para compartir lo que sabes 

Page 44: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 44/49

P(mujer o mayor a 35) = P(mujer) + P(mayor a 35) – P(mujer y mayor a 35) =

2/5 + 2/5 – 1/5 = 3/5 = 0.60

Probabilidad bajo condiciones de independencia estadística 

En primer lugar, definiremos el concepto de “Independencia”

Dos eventos serán estadísticamente independientes entre sí cuando el eventoo resultado de uno de ellos no tiene influencia en el resultado o evento del otro.

Existen tres tipos de probabilidad independiente: Marginal, Conjunta,

Condicional

Probabilidades marginales en condiciones de independencia 

Vimos que una probabilidad es marginal o incondicional cuando es la

representación simple de un evento; v.g el lanzamiento de una moneda normal

tendrá un evento: cara o cruz, con una probabilidad de 0,5 c/u.

No importa cuántas veces lancemos la moneda, la probabilidad de que salga

cara o cruz será la misma; cada lanzamiento es único y no tiene influencia sobre el

próximo lanzamiento.

Probabilidades conjuntas bajo condiciones de independencia estadística  

La probabilidad de dos o más eventos independientes que se presentan

 juntos es el producto de sus probabilidades marginales.

Usando la simbología aprendida, representamos ese caso de la siguiente

manera: P(AB) = P(A) x P(B)

P(AB) = probabilidad de que ambos eventos se presenten juntos o

probabilidad conjunta de A y B

P(A) = probabilidad marginal de que se presente el evento A

P(B) = probabilidad marginal de que se presente el evento B

Ejemplos 

¿Cuál es la probabilidad cruz, cara y cruz, en ese orden, en tres lanzamientos

consecutivos de una moneda?

El resultado será: 0.5 x 0.5 x 0.5 = 0.125.

44

mailxmail - Cursos para compartir lo que sabes 

Page 45: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 45/49

¿Cuál es la probabilidad de obtener cruz, cruz y cara, en ese orden luego de

tres lanzamientos consecutivos? 0.5 x o.5 x 0.5 = 0.125

¿Cuál es la cara de obtener al menos dos caras en 3 lanzamientos

consecutivos?

Estamos ante el caso mixto de probabilidad de eventos mutuamente

excluyentes, las que son aditivas (la probabilidad de obtener una cara más la

probabilidad de obtener otra cara) y un evento independiente.

Para visualizar mejor este proceso, tomemos la tabla 4.2 del texto de Levin y

Rubin, en la que se descomponen todas las probabilidades posibles de los eventos

que conforman el total del experimento

Denominaremos cara = H; cruz = T

Un lanzamiento Dos lanzamientos Tres lanzamientoR. Posibles Probalilidad R. Posibles Probabilidad R. Posibles Probabilidad

H1 0,5 H1,H2 0.25 H1, H2, H3 0.125

T1 0,5 H1,T2 0.25 H1, H2, T3 0.125

T1,H2 0.25 H1, T2, H3 0.125

T1.Y2 0.25 H1, T2, T3 0.125

T1, H3, H3 0.125

T1, H2, T3 0.125

T1, T2, H3 0.125

T1, T2, T3 0.125

1000

En la parte superior del cuadro se registra los tres lanzamientos de la moneda.

H1 significa “cara” y T1 es igual a “Cruz”

En el primer lanzamiento los posibles resultados son o una cara (H1) o una

cruz (T1) y la probabilidad para cada uno de estos resultados, tal como vimos es 0.5.

Tomemos en cuenta que 1 y 2 representan el primer y el segundo

lanzamiento, en todos los casos

Cuando lanzamos la moneda por segunda vez, nos trasladamos a la columna

45

mailxmail - Cursos para compartir lo que sabes 

Page 46: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 46/49

“Dos lanzamientos”. Los resultados posibles son: el primer lanzamiento fue cara

(H1) y el segundo también (H2)

Vemos que los eventos del segundo lanzamiento están ligados a los eventos

que resultaron en el primero.

El segundo evento posible en la columna del segundo lanzamiento es H1, T2,

esto asume que en el primer lanzamiento salió una cara (H1) y en el segundo

lanzamiento salió una cruz (T”).

El tercer evento muestra que en el primer lanzamiento se obtuvo una cruz

(T1) y en el segundo, cara (H2)

El cuarto evento muestra que en el primer lanzamiento salió cruz (T1) y en el

segundo, cara (H2)

Las probabilidades en cada caso son 0.25, que resultan de

cara = probabilidad de 0.5

cruz = probabilidad de 0.5

La probabilidad, digamos del primer evento del segundo lanzamiento H1,H2

es 0.5 x 0.5 = 0.25

Lo mismo con las demás probabilidades

En la columna del tercer lanzamiento se anotan, como en las dos anteriores,los respectivos eventos; v.g en el primer lanzamiento se obtuvo una cara (H1) en el

segundo también (H2) y en el tercero, una cruz (T3).

La probabilidad de este evento será 0.5 x 0.5 x 0.5 = 0,125

El mismo razonamiento para los siguientes eventos, hasta que agotamos

todas las probabilidades posibles de los tres lanzamientos de la moneda.

Ahora ya podemos responder a la pregunta que nos hicimos al iniciar este

capítulo: ¿Cuál es la probabilidad de obtener cruz, cruz y cara, en ese orden luego

de tres lanzamientos consecutivos?

La pregunta ya nos hace saber que se trata de un experimento de tres

lanzamientos; en nuestra tabla vemos que los eventos que la pregunta exige son:

T1, T2, T3 = 0.125

46

mailxmail - Cursos para compartir lo que sabes 

Page 47: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 47/49

Estos ejercicios nos muestran lo que hace la computadora, en el programa

SPSS, cuando le pedimos que calcule las probabilidades de un problema en el que

estamos interesados.

Probabilidades condicionales 

Hasta ahora vimos dos clases de probabilidad: la probabilidad marginal (o

incondicional) y la probabilidad conjunta; la probabilidad marginal se representa por

(PA) y la conjunta por P(AB)

La Probabilidad Condicional que analizaremos ahora se representa por P(A/B)

que muestra dos eventos:

A, el primer evento y B, el segundo.

De esta manera, la Probabilidad Condicional P(A/B) representa el caso en que

el segundo evento B ocurre luego que el primero, A, ya ha tenido lugar.

Es decir, nos dice cuál será la probabilidad del evento B una vez que el evento

A ya ocurrió.

Antes de continuar, recordemos que para dos eventos independientes, A y B,

la ocurrencia de A nada tiene que ver con el la ocurrencia del evento B.

Así la probabilidad de lograr una cara en un segundo lanzamiento de la

moneda, después de que el primer lanzamiento dio como resultado, seguirá siendo

0.5, debido a que ambos eventos son independientes.

A continuación diseñaremos una pequeña ayuda-memoria para eventos

estadísticamente independientes.

Vemos allí que la probabilidad marginal, llamada también “incondicional” es

(PA)

La probabilidad Conjunta de dos eventos independientes estadísticamente es

P(AB) = P(A) x P(B)

La probabilidad condicional P(A/B) es P(B)

47

mailxmail - Cursos para compartir lo que sabes 

Page 48: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 48/49

Tipo de Probabilidad Símbolo Fórmula 

Marginal P(A) P(A)

Conjunta P(AB) P(A) x P(B)

Condicional P(A/B) P(B)

Probabilidad Condicional Bajo Dependencia Estadística 

Antes de proponer la definición formal, vayamos a un ejemplo ilustrativo.

Hay una caja que contiene diez bolas de colores distribuidas de la manera

siguiente:

Tres bolas son de color y tienen puntos

Una es de color y tiene franjas

Dos son grises y tienen puntos

Cuatro son grises y tienen franjas

Siguiendo a Levin y Rubin, hacemos un pequeño cuadro para visualizar mejor

las condiciones del problema

La distribución de las diez bolas 

Evento Probabilidad del Evento

1 0.1

2 0.1 (De color y con puntos)

3 0,1

4 0.1 (De color y con franjas)

5 0.1 (Grises y con puntos)

6 0.1

7 0.1

48

mailxmail - Cursos para compartir lo que sabes 

Page 49: Conceptos Basicos a 37666 Completo

5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com

http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 49/49

8 0.1 (Grises y con franjas)

9 0.1

10 0.1

Como hay diez bolas, la probabilidad de sacar una cualquiera de ella es 1/10

= 0.10

Supongamos que alguien saca una bola de color: ¿cuál es la probabilidad de

que ésta tenga puntos?

Simbólicamente, el problema puede representarse como P(D/C), es decir

¿cuál es la probabilidad de que la bola tenga puntos (D) dado que es de color (C)?

(Vemos que D representa una bola con puntos, C, de color)

La probabilidad de que la bola que se sacó era de color, queremos saber la

probabilidad de que, siendo de color, tenga puntos; para ello, ignoramos las bolas

grises, pues no cumplen con ninguna condición dada.

Sólo tomaremos en cuenta las que restan; hay cuatro bolas de color, tres de

las cuales tienen puntos y la cuarta tiene franjas; con esa información sólo tenemos

que encontrar las probabilidades sencillas.

Es decir, la probabilidad de que la bola tenga puntos y de que tenga franjas;

para ello nos damos cuenta que el total de bolas que tienen color son 4 y las que

tienen color y puntos son tres.

Por lo tanto, la probabilidad de una bola a color con puntos es = ¾ = 0.75

La probabilidad de color con franjas es = ¼ =0.25; ambas suman 1.

En el próximo capítulo veremos la fórmula general sobre la probabilidad

condicional

salto de capitulo} 

49

mailxmail - Cursos para compartir lo que sabes