guÍa de laboratorio n°1 estadistica
DESCRIPTION
PARA PRINCIPIANTESTRANSCRIPT
ING. CLAUDIO CERRÓN LANDEO
Contenido:
Muestreo Aleatorio Simple
Muestreo Aleatorio Sistemático
Muestreo Aleatorio Estratificado
Ejercicios
Unidad 1
Muestreo
Muestreos Probabilísticos
Muestreo
Contenido teórico:
Muestreo Aleatorio Simple
Muestreo Aleatorio Sistemático
Muestreo Aleatorio Estratificado
Todas las aplicaciones se realizaran en base al archivo de datos Datos de
Empleados.sav, disponible en la carpeta Lectura…CCERRON…ESTADÍSTICA
II…ARCCHIVOS SPSS.
Muestreo Aleatorio Simple
Archivo de datos Datos de Empleados.sav:
Observe que en este archivo se han registrado 474 observaciones para un total de 10
variables.
Puede solicitar un reporte de frecuencias para alguna variable de interés, como por
ejemplo Categoría laboral (catlab)
Muestreo
Ejercicio 1.
Seleccione una muestra aleatoria simple de 50 empleados
Para ello debe seguir los pasos siguientes:
Datos → Seleccionar casos
Por defecto siempre estarán activos Todos los casos. Elija Muestra aleatoria de casos,
haga clik en el botón Ejemplo …
Muestreo
Importante:
En la ventana anterior note que: por defecto se encuentra activa, en el
recuadro inferior de Resultado, la opción: Descartar casos no seleccionados.
Esto permite realizar la selección sin eliminar el caso no seleccionado.
En seguida se muestra la siguiente
ventana en la que usted puede
solicitar al programa seleccione
aproximadamente cierto
porcentaje de casos, conocidos
también como registros u
observaciones, para la muestra.
También puede solicitar al
programa la selección de un
número exacto de casos o
registros. Para nuestro caso
utilizaremos esta opción para
solicitar que seleccione
exactamente 50 observaciones de
los primeros 474 casos.
En esta selección se obtuvo una muestra en la que se ha seleccionado las observaciones
9, 10, 12 y otras. Observe que el programa tacha con una línea oblicua la observación
que NO ha sido seleccionada. Además, ha generado una variable Filtro (filter_$) en la
última columna en la que ha asignado el código 0 a las observaciones que no han sido
seleccionadas y 1 a las que sí han sido seleccionadas.
Muestreo
Si usted vuelve a solicitar un reporte de frecuencias para la variable catlab, observará
que ahora solo son consideradas las 50 observaciones que han sido seleccionadas.
Observación:
Cualquier análisis que usted solicite se efectuará solamente sobre las 50
observaciones seleccionadas.
Las observaciones que no han sido seleccionadas no se han perdido,
simplemente por ahora no se encuentran disponibles.
Si desea reestablecer todo el archivo de datos debe hacer lo siguiente:
Datos → Seleccionar casos → Todos los casos
Muestreo
Observe que ahora ya no se encuentran tachados los números correspondientes a cada
caso. Nuevamente tenemos disponibles TODOS los casos, a pesar que la variable
filter_$ permanezca.
Es muy frecuente observar que quienes se inician en el manejo de esta herramienta
olvidan reestablecer toda la data y luego obtienen resultados solo de la última muestra
seleccionada.
Muestreo Aleatorio Sistemático
La aplicación del muestreo sistemático se hará siempre sobre el mismo archivo de datos
Datos de Empleados.sav:
Ejercicio 2.
Seleccione una muestra aleatoria sistemática de 50 empleados
Recuerde que para l aplicación de un muestreo sistemático debemos determinar el valor
de K correspondiente al salto sistemático o período de selección.
948,950
474 K
n
NK
Luego, de los primeros 9 registros del archivo de datos seleccionaremos uno,
aplicando el mismo procedimiento del muestreo aleatorio simple, a este elemento
seleccionado se le conoce como punto de arranque que se le puede denotar como A.
Posteriormente debemos seleccionar a partir de A, incluyendo A, cada 9 registros uno
para la muestra hasta completar los 50 registros solicitados para la muestra.
Por ejemplo: si A = X7 este sería el primer elemento seleccionado.
Muestreo
Luego seleccionamos: X16 , X25 , X34 , … , X439 , X448
Para lograr esto con ayuda del SPSS, se debe seguir los pasos siguientes:
Elección del Punto de Arranque. Aplicaremos un muestreo aleatorio simple para
seleccionar un caso de los primeros nueve registrados en el archivo de datos.
Datos → Seleccionar casos → Muestra aleatoria de casos
En nuestro caso se ha seleccionado como Punto de arranque el caso 7: A = X7
Muestreo
Ahora viene la parte más importante para la selección automática de los siguientes
elementos de la muestra.
Primero recuperamos la selección de Todos los casos
Muestreo
Luego elegimos la opción condicional para la selección de casos.
Al hacer picar en el botón Sí la op… se mostrará la siguiente ventana, que ofrece una
serie de funciones dentro del Grupo de funciones
Muestreo
Dentro del Grupo de funciones Aritméticas podemos encontrar la función Mod
(Módulo) que como señala el cuadro explicativo permite determinar el resto o residuo
de dividir una expresión numérica entre el módulo.
Muestreo
Para subir la función elegida picamos en la flecha
Luego debemos indicar para cada signo de interrogación lo que mostramos en el
siguiente cuadro.
Muestreo
Tenga en cuenta que:
id: es el código del empleado asignado en el archivo de datos
K = 9 : es el periodo de selección o salto sistemático
A = 7 : es el punto de arranque
n = 50 : es el tamaño de la muestra
Lo que se busca en la primera expresión es encontrar los registros cuya división con el
valor de K nos de residuo CERO. La segunda expresión busca establecer un tope hasta
donde se debe verificar estos cocientes. Dado que el valor de K, al ser redondeado al
menor entero, suele ocasionar que sobren casos para realizar más selecciones, esta
segunda expresión evitará que se tomen más observaciones que las establecidas para la
muestra.
Observe que:
Si id = 1 1 + (9 – 7) entre 9 no muestra resto CERO el registro 1 no será
seleccionado
……
Si id = 7 7 + (9 – 7) entre 9 si muestra resto CERO el registro 7 si será
seleccionado
……
Si id = 447 447 + (9 – 7) entre 9 no muestra resto CERO el registro 447 no será
seleccionado
Muestreo
Si id = 448 448 + (9 – 7) entre 9 si muestra resto CERO el registro 448 si será
seleccionado
Picamos en: Continuar Aceptar
Observe en el cuadro siguiente que el primer registro seleccionado corresponde al punto
de arranque A = X7 seguido del X7 + 9 = X16
Muestreo
Observe que los dos últimos casos seleccionados son precisamente: X439 y X448
Muestreo Aleatorio Estratificado
Recuerde que para l aplicación de esta técnica de muestreo debemos separar la
población en sub-poblaciones homogéneas. En nuestro caso generaremos un archivo
para cada estrato. El archivo de datos ha utilizar sigue siendo Datos de Empleados.sav.
No olvide que primero debe observar que tenga todos los casos del archivo disponibles.
Ejercicio 3.
Muestreo
Seleccione una muestra aleatoria estratificada de 50 empleados con asignación
proporcional a la categoría laboral.
Dado que la muestra se desea asignar proporcionalmente a la categoría laboral podemos
solicitar una tabla de frecuencias para esta variable y así conocer el tamaño de cada
estrato
En seguida hacemos los cálculos para la determinación del tamaño de muestra para cada
estrato (categoría laboral)
Categoría Laboral Frecuencia Proporción ni = ( Ni / N ) * n
Administrativo 363 ,7658 38,3 38
Seguridad 27 ,0570 2,8 3
Directivo 84 ,1772 8,9 9
Total 474 1,0 50
Para la conformación de los estratos hacemos uso de la selección condicional:
Datos → Seleccionar casos → Si se satisface la condición → Si la op…
Muestreo
Seleccionamos la variable catlab y la igualamos a 1 esto permitirá seleccionar todos
los casos cuya categoría laboral sea Administrativo (1).
Algo muy importante con el Resultado, ahora solicitaremos que Copie los casos
seleccionados a un nuevo conjunto de datos que llamaremos Administrativo,
obteniendo de esta manera nuestro primer estrato.
Muestreo
El resultado será un nuevo archivo de datos que considera solo los 363 casos
correspondientes a Administrativos.
Repetimos el procedimiento anterior para generar el segundo y tercer estrato que
llamaremos respectivamente: Seguridad (catlab = 2) y Directivo (catlab = 3)
Muestreo
Muestreo
Observe que hasta aquí se ha logrado conformar el estrato que llamaremos Seguridad
que cuenta con 27 casos registrados.
Muestreo
Tenemos el estrato llamado Directivo conformado por 84 casos.
Muestreo
Muestra por estrato. Ahora estamos en condición de aplicar un muestreo aleatorio
simple por cada estrato, seleccionando el número de observaciones calculado al inicio.
ADMINISTRATIVO
Muestreo
Ahora puede hacer uso de la tercera opción de Resultados: Eliminar casos no
seleccionados
Es importante que esté conciente que al elegir esta opción los casos no seleccionados
serán eliminados sin posibilidad de volverles a recuperar.
Muestreo
Observe que el archivo correspondiente a la muestra seleccionada del estrato de
Administrativos cuenta con 38 casos.
SEGURIDAD
Del estrato Seguridad seleccionaremos con una muestra aleatoria simple de 3 de los 27
casos
No olvide elegir en Resultados la opción de Eliminar casos no seleccionados. El
resultado debe ser un archivo correspondiente a Seguridad reducido a 3 casos.
Muestreo
DIRECTIVO
Si hacemos lo propio para el estrato de Directivos lograremos obtener este archivo
reducido a 9 casos de los 84 que muestra inicialmente.
Finalmente puede unir los tres archivos en uno solo teniendo la muestra total de 50
registros
Muestreo
Solicite un reporte de frecuencias para este último archivo
Muestreo
Este resultado confirma que la muestra ha sido seleccionada conforme se ha solicitado,
respetando la asignación proporcional a la categoría laboral.