análisis de varianza_aplicaciones con spss

48
 CAPACITACIÓN Análisi s e stastico co n SPSSSesión 4  M artes 23 de Junio de 2 015 Relator: Os valdo Blanco www.socialis.cl @_socialis [email protected] 1

Upload: osvaldoblanco

Post on 04-Nov-2015

9 views

Category:

Documents


1 download

DESCRIPTION

Análisis de varianza_aplicaciones con SPSS.

TRANSCRIPT

  • CAPACITACINAnlisis estadstico con

    SPSSSesin 4

    ANOVA DE UNO Y DOS FACTORESMartes 23 de Junio de 2015

    Relator: Osvaldo Blanco

    Sesin 4ANOVA DE UNO Y DOS FACTORES

    Martes 23 de Junio de 2015

    Relator: Osvaldo Blanco

    www.socialis.cl

    @[email protected]

    1

  • 1.- ANOVA DE UN FACTOR

  • La prueba Anova de un factor tiene comoobjetivo comparar medias entre 3 o ms grupos.

    Se trata de concluir si el factor (la variablecualitativa con la cual conformamos los grupos)es determinante o no en la diferencia de medias.

    En otras palabras, se busca analizar elcomportamiento de la variable dependiente(cuantitativa) en los distintos grupos establecidospor las categoras de la variable cualitativaindependiente (factor).

    La prueba Anova de un factor tiene comoobjetivo comparar medias entre 3 o ms grupos.

    Se trata de concluir si el factor (la variablecualitativa con la cual conformamos los grupos)es determinante o no en la diferencia de medias.

    En otras palabras, se busca analizar elcomportamiento de la variable dependiente(cuantitativa) en los distintos grupos establecidospor las categoras de la variable cualitativaindependiente (factor).

  • De esta forma, contamos con dosvariables:Una variable independiente cualitativanominal u ordinal (lamada factor) quedetermina la conformacin de los grupos.Una variable dependiente cuantitativa(intervalo o razn) gracias a la cualobtenemos las medias que comparamosentre los distintos grupos

    De esta forma, contamos con dosvariables:Una variable independiente cualitativanominal u ordinal (lamada factor) quedetermina la conformacin de los grupos.Una variable dependiente cuantitativa(intervalo o razn) gracias a la cualobtenemos las medias que comparamosentre los distintos grupos

  • Las hiptesis en la prueba Anova de unfactor son las siguientes:H0 = No existen diferencias significativas entrelas medias de los distintos grupos, lo cual seexplica por el hecho de que el factor no influyeen la distribucin de los valores de la variabledependiente.H1 = Las medias de los grupos son distintasentre s, lo que se explica por el hecho de quelas puntuaciones o valores de cada grupo estndeterminadas por el factor.

    Esto implica que al menos existira unade las medias que difiere de las dems.

    Las hiptesis en la prueba Anova de unfactor son las siguientes:H0 = No existen diferencias significativas entrelas medias de los distintos grupos, lo cual seexplica por el hecho de que el factor no influyeen la distribucin de los valores de la variabledependiente.H1 = Las medias de los grupos son distintasentre s, lo que se explica por el hecho de quelas puntuaciones o valores de cada grupo estndeterminadas por el factor.

    Esto implica que al menos existira unade las medias que difiere de las dems.

  • Condiciones para aplicar unaprueba Anova

    La prueba ANOVA es una prueba paramtrica, es decir, sedeben cumplir estrictas condiciones. Los supuestos son esencialmente 3:

    1) Muestreo aleatorio independiente, es decir, se supone que los sujetospertenecientes a todos los grupos conforman una muestra representativadel grupo al cual pertenecen.2) Normalidad, es decir, que las poblaciones de las cuales se obtuvieron lasmuestras (grupos) estn normalmente distribuidas. Si ello no es as,veremos que nuestros resultados de la prueba de Levene (para lahomogeneidad de la varianza) nos indicarn una violacin a estesupuesto y con ello no podremos seguir nuestro anlisis.3) Homogeneidad de la varianza u Homocedasticidad, el cual tiene relacincon la normalidad. Se supone que las poblaciones desde las cuales seextrajeron los grupos tienen la misma varianza. Este supuesto tienedirecta implicancia pues en el procedimiento se calcula una varianzacomn descomponindola en 2 componentes.

    La prueba ANOVA es una prueba paramtrica, es decir, sedeben cumplir estrictas condiciones. Los supuestos son esencialmente 3:

    1) Muestreo aleatorio independiente, es decir, se supone que los sujetospertenecientes a todos los grupos conforman una muestra representativadel grupo al cual pertenecen.2) Normalidad, es decir, que las poblaciones de las cuales se obtuvieron lasmuestras (grupos) estn normalmente distribuidas. Si ello no es as,veremos que nuestros resultados de la prueba de Levene (para lahomogeneidad de la varianza) nos indicarn una violacin a estesupuesto y con ello no podremos seguir nuestro anlisis.3) Homogeneidad de la varianza u Homocedasticidad, el cual tiene relacincon la normalidad. Se supone que las poblaciones desde las cuales seextrajeron los grupos tienen la misma varianza. Este supuesto tienedirecta implicancia pues en el procedimiento se calcula una varianzacomn descomponindola en 2 componentes.

  • PROPORCIN EXPLICADA DE LAVARIANZA

  • La variacin total se descompone en variacin intra grupo yvariacin inter grupo.

    1) La variacin inter-grupo es la que nos demuestra que elfactor explica en un importante proporcin lavariabilidad total (aceptando H1)

    2) La variacin intra-grupo es la variacin inexplicada ytiene que ver con variables propias de los sujetos que nose corresponden con el factor analizado. Adems, sonvariables que nunca podemos controlar (muchas vecesni siquiera conocer).

    La variacin inexplicada se calcula a partir de unprocedimiento que comprende el clculo de la varianza de lospuntajes individuales respecto de la media de su grupo.

    La variacin explicada est basada en el clculo de la varianzade las medias grupales respecto de la media global.

    La variacin total se descompone en variacin intra grupo yvariacin inter grupo.

    1) La variacin inter-grupo es la que nos demuestra que elfactor explica en un importante proporcin lavariabilidad total (aceptando H1)

    2) La variacin intra-grupo es la variacin inexplicada ytiene que ver con variables propias de los sujetos que nose corresponden con el factor analizado. Adems, sonvariables que nunca podemos controlar (muchas vecesni siquiera conocer).

    La variacin inexplicada se calcula a partir de unprocedimiento que comprende el clculo de la varianza de lospuntajes individuales respecto de la media de su grupo.

    La variacin explicada est basada en el clculo de la varianzade las medias grupales respecto de la media global.

  • Midiendo el efecto del factor: Proporcinexplicada de la varianza

    Eta al cuadrado (2) es una razn entre la suma decuadrados intergrupo y la suma de cuadrados total.

    Por tanto, sirve para determinar si el efecto del factores grande en trminos de la proporcin de lavarianza.

    La variacin inter-grupo es la variacin explicada porla manera como se han distribuidos los valores enfuncin del factor.

    Eta al cuadrado (2) es una razn entre la suma decuadrados intergrupo y la suma de cuadrados total.

    Por tanto, sirve para determinar si el efecto del factores grande en trminos de la proporcin de lavarianza.

    La variacin inter-grupo es la variacin explicada porla manera como se han distribuidos los valores enfuncin del factor.

  • POST - HOC

  • En general, a las tcnicas Post Hocdisminuyen la posibilidad de errores detipo I, (aunque a costa de aumentar elerror de tipo II). Dicho de otro modo, es probable que ensituaciones donde realmente existandiferencias entre grupos, las pruebasPost Hoc no lo detecten. Las diferencias entre grupos tienen queser realmente grandes para poder serreconocidas por estas pruebas.

    En general, a las tcnicas Post Hocdisminuyen la posibilidad de errores detipo I, (aunque a costa de aumentar elerror de tipo II). Dicho de otro modo, es probable que ensituaciones donde realmente existandiferencias entre grupos, las pruebasPost Hoc no lo detecten. Las diferencias entre grupos tienen queser realmente grandes para poder serreconocidas por estas pruebas.

  • Las pruebas post hoc existentes seclasifican segn los siguientes criterios:

    1. TEST DE RANGOS: son aquellas que buscanidentificar grupos homogneos o mediasperecidas.

    2. COMPARACIONES MLTIPLES: son las quebuscan establecer diferencias entre gruposbasndose en diferencias dos a dos.

    Las pruebas post hoc existentes seclasifican segn los siguientes criterios:

    1. TEST DE RANGOS: son aquellas que buscanidentificar grupos homogneos o mediasperecidas.

    2. COMPARACIONES MLTIPLES: son las quebuscan establecer diferencias entre gruposbasndose en diferencias dos a dos.

  • Sin embargo la clasificacin recindada no es estricta, pues puedenhaber tcnicas Post Hoc que incluyenlas dos categoras al mismo tempo.

    Sin embargo la clasificacin recindada no es estricta, pues puedenhaber tcnicas Post Hoc que incluyenlas dos categoras al mismo tempo.

  • Todos los grupos tienen el mismo nmerode individuos. Podemos asumir que estnigualmente dispersos.

    Diferencia Honestamente significativa de Tukey(HSD de Tukey): Se puede considerar como unatcnica de comparaciones mltiples y a la vez derangos. Se suele usar cuando se quiere compararcada grupo con todos los dems y el nmero degrupos es alto (6 o ms).Test de Scheff: Hace todas las comparacionesposibles. Por ejemplo, el primer grupo conrespecto a c/u de los restantes, pero tambin elprimero con respecto al grupo formado por launin de dos de los restantes, etc.

    Grupos equilibrados y varianzassimilares

    Todos los grupos tienen el mismo nmerode individuos. Podemos asumir que estnigualmente dispersos.

    Diferencia Honestamente significativa de Tukey(HSD de Tukey): Se puede considerar como unatcnica de comparaciones mltiples y a la vez derangos. Se suele usar cuando se quiere compararcada grupo con todos los dems y el nmero degrupos es alto (6 o ms).Test de Scheff: Hace todas las comparacionesposibles. Por ejemplo, el primer grupo conrespecto a c/u de los restantes, pero tambin elprimero con respecto al grupo formado por launin de dos de los restantes, etc.

  • Grupos desequilibrados Es cuando tenemos un nmero diferentede individuos en cada grupo. Podemoselegir las siguientes pruebas:

    LSD de Fisher (slo si hay 3 grupos).T3 de Dunnett.C de Dunnet.ScheffGames-Howell

    Es cuando tenemos un nmero diferentede individuos en cada grupo. Podemoselegir las siguientes pruebas:

    LSD de Fisher (slo si hay 3 grupos).T3 de Dunnett.C de Dunnet.ScheffGames-Howell

  • Varianzas desiguales Cuando la prueba de igualdad de varianzas(Levene) nos hace sospechar que las varianzasno son similares en todos los grupos. Podemosconsiderar las siguientes pruebas:

    T2 de TamhaneT3 de DunnetC de DunnetGames-Howell.Scheff *

    Cuando la prueba de igualdad de varianzas(Levene) nos hace sospechar que las varianzasno son similares en todos los grupos. Podemosconsiderar las siguientes pruebas:

    T2 de TamhaneT3 de DunnetC de DunnetGames-Howell.Scheff *

  • ANOVA DE 1 FACTOR EN SPSS

  • Analizar Compararmedias Anova de un

    factor

  • Colocar aqu lavariable

    cuantitativa(dependiente)

    Colocar aqu lavariablecualitativa(factor)

  • Clic enOpciones

  • Clic en: Descriptivos. Prueba dehomogeneidad de lasvarianzas. Grficos de lasmedias.

  • Clic aqu paraelegir el

    contraste Posthoc

  • Elegir el tipo de pruebaPost Hoc segn los

    criterios especificadosanteriormente

  • EJEMPLO DE RECHAZO DE H0

  • Descriptives

    cantidad de licencias

    22 17.7576 2.5659 .5471 16.6199 18.8952 14.00 22.6722 20.9091 2.8715 .6122 19.6360 22.1822 14.00 24.3322 20.1364 2.8687 .6116 18.8645 21.4083 15.00 25.3366 19.6010 3.0456 .3749 18.8523 20.3497 14.00 25.33

    obreros de plantaadministrativosgerenciaTotal

    N Mean Std. DeviationStd. ErrorLower BoundUpper Bound

    95% Confidence Interval forMean

    MinimumMaximum

    Variable dependiente

    La tabla nos muestra estadsticos descriptivos tales comomedias, desviacin estndar y erros estndar.

    Todo ello para cada nivel de factor (grupo) y para el total.

    Descriptives

    cantidad de licencias

    22 17.7576 2.5659 .5471 16.6199 18.8952 14.00 22.6722 20.9091 2.8715 .6122 19.6360 22.1822 14.00 24.3322 20.1364 2.8687 .6116 18.8645 21.4083 15.00 25.3366 19.6010 3.0456 .3749 18.8523 20.3497 14.00 25.33

    obreros de plantaadministrativosgerenciaTotal

    N Mean Std. DeviationStd. ErrorLower BoundUpper Bound

    95% Confidence Interval forMean

    MinimumMaximum

    Grupos (niveles del factor)

  • Test of Homogeneity of Variances

    Promedio de repitentes por curso

    1.603 4 23 .207

    LeveneStatistic df1 df2 Sig.

    Esta tabla nos permite evaluar si violamos o no el supuestode la homogeneidad de las varianzas (homocedasticidad).

    Si el valor de Sig. fuese menor que un nivel de 0,05 lasvarianzas de los grupos difieren significativamente. Portanto, todo el anlisis posterior sera en vano.

    Test of Homogeneity of Variances

    Promedio de repitentes por curso

    1.603 4 23 .207

    LeveneStatistic df1 df2 Sig.

  • ANOVA

    cantidad de licencias

    118.710 2 59.355 7.722 .001484.227 63 7.686602.938 65

    Between GroupsWithin GroupsTotal

    Sum ofSquares df Mean Square F Sig.Entre grupos

    Dentro degrupos

    El contraste resulta significativo, vale decir, haydiferencias entre medias (rechazamos H0).

    Sig. = 0,001 < 0,05

  • Para poder establecer la proporcin explicada de la varianza(esto es, la proporcin de la variacin total explicada por elfactor) recurrimos al clculo del estadstico 2 (eta alcuadrado) dividiendo la suma de cuadrados inter-grupo porla suma de cuadrados total.

    Para este ejemplo, el valor 2 se calcula de la siguiente manera:118.710 / 602.938 = 0.19 Lo que nos indica que un 19% de la varianza total se explicapor la variacin entre grupos.

    ANOVA

    cantidad de licencias

    118.710 2 59.355 7.722 .001484.227 63 7.686602.938 65

    Between GroupsWithin GroupsTotal

    Sum ofSquares df Mean Square F Sig.

    Para poder establecer la proporcin explicada de la varianza(esto es, la proporcin de la variacin total explicada por elfactor) recurrimos al clculo del estadstico 2 (eta alcuadrado) dividiendo la suma de cuadrados inter-grupo porla suma de cuadrados total.

    Para este ejemplo, el valor 2 se calcula de la siguiente manera:118.710 / 602.938 = 0.19 Lo que nos indica que un 19% de la varianza total se explicapor la variacin entre grupos.

  • Post-Hoc con Tukey y ScheffMultiple Comparisons

    Dependent Variable: cantidad de licencias

    -3.1515* .8359 .001 -5.1580 -1.1451-2.3788* .8359 .016 -4.3852 -.37233.1515* .8359 .001 1.1451 5.1580.7727 .8359 .627 -1.2337 2.7792

    2.3788* .8359 .016 .3723 4.3852-.7727 .8359 .627 -2.7792 1.2337

    -3.1515* .8359 .002 -5.2472 -1.0558-2.3788* .8359 .022 -4.4745 -.28313.1515* .8359 .002 1.0558 5.2472.7727 .8359 .654 -1.3230 2.8684

    2.3788* .8359 .022 .2831 4.4745-.7727 .8359 .654 -2.8684 1.3230

    (J) tipo de empleadoadministrativosgerenciaobreros de plantagerenciaobreros de plantaadministrativosadministrativosgerenciaobreros de plantagerenciaobreros de plantaadministrativos

    (I) tipo de empleadoobreros de planta

    administrativos

    gerencia

    obreros de planta

    administrativos

    gerencia

    Tukey HSD

    Scheffe

    MeanDifference

    (I-J) Std. Error Sig. Lower Bound Upper Bound95% Confidence Interval

    The mean difference is significant at the .05 level.*.

    Las diferencias que son significativas son marcadas con asterisco * Desde aqu podemos empezar a especificar cul es la media grupal que se distancia

    de las otras.

    Multiple Comparisons

    Dependent Variable: cantidad de licencias

    -3.1515* .8359 .001 -5.1580 -1.1451-2.3788* .8359 .016 -4.3852 -.37233.1515* .8359 .001 1.1451 5.1580.7727 .8359 .627 -1.2337 2.7792

    2.3788* .8359 .016 .3723 4.3852-.7727 .8359 .627 -2.7792 1.2337

    -3.1515* .8359 .002 -5.2472 -1.0558-2.3788* .8359 .022 -4.4745 -.28313.1515* .8359 .002 1.0558 5.2472.7727 .8359 .654 -1.3230 2.8684

    2.3788* .8359 .022 .2831 4.4745-.7727 .8359 .654 -2.8684 1.3230

    (J) tipo de empleadoadministrativosgerenciaobreros de plantagerenciaobreros de plantaadministrativosadministrativosgerenciaobreros de plantagerenciaobreros de plantaadministrativos

    (I) tipo de empleadoobreros de planta

    administrativos

    gerencia

    obreros de planta

    administrativos

    gerencia

    Tukey HSD

    Scheffe

    MeanDifference

    (I-J) Std. Error Sig. Lower Bound Upper Bound95% Confidence Interval

    The mean difference is significant at the .05 level.*.

  • Post-Hoc con Tukey y Scheffcantidad de licencias

    22 17.757622 20.136422 20.9091

    1.000 .62722 17.757622 20.136422 20.9091

    1.000 .654

    tipo de empleadoobreros de plantagerenciaadministrativosSig.obreros de plantagerenciaadministrativosSig.

    Tukey HSDa

    Scheffea

    N 1 2Subset for alpha = .05

    Means for groups in homogeneous subsets are displayed.Uses Harmonic Mean Sample Size = 22.000.a.

    Los obreros deplanta conformanun grupo aparte.

    Gerencia yAdministrativos

    tienden a conformarambos un grupodistinto de los

    Obreros.

    cantidad de licencias

    22 17.757622 20.136422 20.9091

    1.000 .62722 17.757622 20.136422 20.9091

    1.000 .654

    tipo de empleadoobreros de plantagerenciaadministrativosSig.obreros de plantagerenciaadministrativosSig.

    Tukey HSDa

    Scheffea

    N 1 2Subset for alpha = .05

    Means for groups in homogeneous subsets are displayed.Uses Harmonic Mean Sample Size = 22.000.a.

    Gerencia yAdministrativos

    tienden a conformarambos un grupodistinto de los

    Obreros.

  • 2.- ANOVA DE 2 O MSFACTORES

  • Tcnica que mide los efectosde dos o ms variablesindependientes cualitativassobre una variabledependiente cuantitativa.

    Tcnica que mide los efectosde dos o ms variablesindependientes cualitativassobre una variabledependiente cuantitativa.

  • Ejemplo Imaginemos que queremos determinar si existediferencia significativa entre dos metodologas depreparacin para la PSU. El mtodo A consiste en preparar a los alumnosmediante tres grados de intensidad de estudio (8 hrs.al da 4 hrs. al da 2 hrs. al da), mientras que elmtodo B tiene en cuenta el uso de mediostecnolgicos (facsmiles va email educacin adistancia asistencia presencial con soportecomputacional). Ambas metodologas son dos factores o variablesindependientes que hipotticamente influiran en lospuntajes del rendimiento en la PSU de distintamanera.

    Imaginemos que queremos determinar si existediferencia significativa entre dos metodologas depreparacin para la PSU. El mtodo A consiste en preparar a los alumnosmediante tres grados de intensidad de estudio (8 hrs.al da 4 hrs. al da 2 hrs. al da), mientras que elmtodo B tiene en cuenta el uso de mediostecnolgicos (facsmiles va email educacin adistancia asistencia presencial con soportecomputacional). Ambas metodologas son dos factores o variablesindependientes que hipotticamente influiran en lospuntajes del rendimiento en la PSU de distintamanera.

  • En el ejemplo recin dado, el investigador podra considerarlos puntajes de la PSU y analizarlos en funcin de un factorpor separado. Por ejemplo, el mtodo 1 y los puntajes PSU obtenidos conesta metodologa y hacer un anlisis Anova de un factor;luego tomar el otro factor y los puntajes PSU y analizarlosmediante otro anlisis Anova de un factor por separado. Pese a que puede ser una buena estrategia, cabe preguntarsesi acaso no sera ms interesante estudiar la combinacin deambos factores y su efecto en los puntajes de la PSU en vezde analizarlos separadamente. Es decir, podra ser mucho ms interesante investigar losfactores de manera conjunta y as combinar los dos estudiosAnova de un factor en uno solo, el cual ser este del anlisisde la varianza con dos factores (Anova de dos vas o dosfactores).

    En el ejemplo recin dado, el investigador podra considerarlos puntajes de la PSU y analizarlos en funcin de un factorpor separado. Por ejemplo, el mtodo 1 y los puntajes PSU obtenidos conesta metodologa y hacer un anlisis Anova de un factor;luego tomar el otro factor y los puntajes PSU y analizarlosmediante otro anlisis Anova de un factor por separado. Pese a que puede ser una buena estrategia, cabe preguntarsesi acaso no sera ms interesante estudiar la combinacin deambos factores y su efecto en los puntajes de la PSU en vezde analizarlos separadamente. Es decir, podra ser mucho ms interesante investigar losfactores de manera conjunta y as combinar los dos estudiosAnova de un factor en uno solo, el cual ser este del anlisisde la varianza con dos factores (Anova de dos vas o dosfactores).

  • Se trata entonces de explorar los efectos de 2 oms factores para as evaluar las distintasinteracciones entre ambos. Mediante este tipo de anlisis podemosestudiar los efectos de los dos factores porseparado en la variable dependiente (Y) ms lainteraccin entre ambos y los efectos de estainteraccin en Y. Vale decir:

    Efectos de A sobre Y (efecto principal).Efectos de B sobre Y (efecto principal).Efectos de AB sobre Y (efecto de interaccin).

    Se trata entonces de explorar los efectos de 2 oms factores para as evaluar las distintasinteracciones entre ambos. Mediante este tipo de anlisis podemosestudiar los efectos de los dos factores porseparado en la variable dependiente (Y) ms lainteraccin entre ambos y los efectos de estainteraccin en Y. Vale decir:

    Efectos de A sobre Y (efecto principal).Efectos de B sobre Y (efecto principal).Efectos de AB sobre Y (efecto de interaccin).

  • El objeto de este tipo de anlisises permitir decidir al investigador

    si los dos o ms factoresinteractan para producir efectosque no podran ver si tomramos

    a los factores por separado.

    El objeto de este tipo de anlisises permitir decidir al investigador

    si los dos o ms factoresinteractan para producir efectosque no podran ver si tomramos

    a los factores por separado.

  • Cuando se realiza un ANOVA dedos factores, se tienen 3 H0.

    H0: El factor A no ejerce ningnefecto en la variabilidad de laspuntuaciones.H0: El factor B no ejerce ningnefecto en la variabilidad de laspuntuaciones.H0: Los efectos de interaccin deAxB no ejercen ningn efecto en lavariabilidad de las puntuaciones.

    Cuando se realiza un ANOVA dedos factores, se tienen 3 H0.

    H0: El factor A no ejerce ningnefecto en la variabilidad de laspuntuaciones.H0: El factor B no ejerce ningnefecto en la variabilidad de laspuntuaciones.H0: Los efectos de interaccin deAxB no ejercen ningn efecto en lavariabilidad de las puntuaciones.

  • ANOVA DE 2 FACTORESEN SPSS

  • AnalizarModelolineal generalUnivariado

  • Colocar aqu lacuantitativa

    (dependiente)

    Colocar aqulas variablescualitativas(factor)

  • Clic en Post-Hocy elegir contrasteadecuado segn

    los criteriosdescritos

    anteriormente.

  • Una vez elegidoel anlisis PostHoc, volver al

    cuadro principaly hacer Clic en

    Opciones

  • Pasar todos los factoresy la interaccin al

    campo (mostrar lasmedias para)

    Clic en: Estadsticosdescriptivos. Estimacionesdel tamao delefecto. Potenciaobservada. Prueba dehomogeneidad .

    Clic en: Estadsticosdescriptivos. Estimacionesdel tamao delefecto. Potenciaobservada. Prueba dehomogeneidad .

  • EJEMPLO ANOVA DOS FACTORES

  • Descriptive Statistics

    Dependent Variable: Mortalidad infantil (muertes por 1000 nacimientos vivos)

    7,300 . 17,600 . 19,200 . 16,881 1,1189 155,933 ,7767 36,910 1,1722 21

    15,850 10,1116 219,167 2,2546 315,038 4,3266 827,000 . 116,893 5,4830 14

    168,000 . 150,789 38,7232 941,700 52,7502 250,600 36,0636 456,931 46,1738 16

    126,000 . 147,100 . 1

    104,400 20,9507 1080,000 42,4264 2

    111,000 8,4853 299,944 26,4983 1649,517 19,9922 639,875 21,3009 430,000 7,0711 251,250 16,6170 228,800 28,5671 242,294 19,4339 1644,500 13,4350 240,769 27,3346 1325,200 . 119,067 5,7839 336,916 24,2839 1960,443 34,1869 741,320 18,7280 554,050 57,8617 663,472 40,0852 3241,040 34,7120 1016,675 5,3125 422,433 29,1536 3411,200 10,5524 441,860 38,7517 102

    Clima predominanteridomediterrneomartimotempladortico / temp.Totalmediterrneomartimotempladortico / temp.TotalridotropicalmediterrneotempladoTotaldesiertorido / desiertotropicalmediterrneotempladoTotaldesiertorido / desiertoridomediterrneotempladoTotalridotropicalmediterrneotempladoTotaldesiertorido / desiertoridotropicalmediterrneomartimotempladortico / temp.Total

    Regin econmicaOCDE

    Europa Oriental

    Asia / Pacfico

    frica

    Oriente Medio

    Amrica Latina

    Total

    Mean Std. Deviation NBetween-Subjects Factors

    OCDE 21EuropaOriental 14

    Asia /Pacfico 16

    frica 16OrienteMedio 16

    AmricaLatina 19

    desierto 7rido /desierto 5

    rido 6tropical 32mediterrneo 10

    martimo 4templado 34rtico /temp. 4

    12

    3

    45

    6

    Regineconmica

    12

    356

    789

    Climapredominante

    Value Label N

    Las primeras dos tablas del output son deestadsticas descriptivas: hay un conteogeneral de los casos para cada grupo delos 2 factores; se calculan medias,desviaciones tpicas.

    Osvaldo BlancoSocilogo

    Descriptive Statistics

    Dependent Variable: Mortalidad infantil (muertes por 1000 nacimientos vivos)

    7,300 . 17,600 . 19,200 . 16,881 1,1189 155,933 ,7767 36,910 1,1722 21

    15,850 10,1116 219,167 2,2546 315,038 4,3266 827,000 . 116,893 5,4830 14

    168,000 . 150,789 38,7232 941,700 52,7502 250,600 36,0636 456,931 46,1738 16

    126,000 . 147,100 . 1

    104,400 20,9507 1080,000 42,4264 2

    111,000 8,4853 299,944 26,4983 1649,517 19,9922 639,875 21,3009 430,000 7,0711 251,250 16,6170 228,800 28,5671 242,294 19,4339 1644,500 13,4350 240,769 27,3346 1325,200 . 119,067 5,7839 336,916 24,2839 1960,443 34,1869 741,320 18,7280 554,050 57,8617 663,472 40,0852 3241,040 34,7120 1016,675 5,3125 422,433 29,1536 3411,200 10,5524 441,860 38,7517 102

    Clima predominanteridomediterrneomartimotempladortico / temp.Totalmediterrneomartimotempladortico / temp.TotalridotropicalmediterrneotempladoTotaldesiertorido / desiertotropicalmediterrneotempladoTotaldesiertorido / desiertoridomediterrneotempladoTotalridotropicalmediterrneotempladoTotaldesiertorido / desiertoridotropicalmediterrneomartimotempladortico / temp.Total

    Regin econmicaOCDE

    Europa Oriental

    Asia / Pacfico

    frica

    Oriente Medio

    Amrica Latina

    Total

    Mean Std. Deviation NBetween-Subjects Factors

    OCDE 21EuropaOriental 14

    Asia /Pacfico 16

    frica 16OrienteMedio 16

    AmricaLatina 19

    desierto 7rido /desierto 5

    rido 6tropical 32mediterrneo 10

    martimo 4templado 34rtico /temp. 4

    12

    3

    45

    6

    Regineconmica

    12

    356

    789

    Climapredominante

    Value Label N

  • Este es el contraste de Levene para determinar la homogeneidad de varianzas. Si es significativa (p < ) entonces se ha violado el supuesto de la homogeneidad de la

    varianza. En este caso la prueba de Levene fue significativa, por lo tanto las varianzas son heterogneas. Sin embargo, se ha demostrado que en tanto los tamaos grupales sean uniformes, las

    violaciones del supuesto de homogeneidad de varianza no afectarn mucho los resultados y nopondrn en entre dicho la interpretacin.

    En cambio, si los tamaos de los grupos son desiguales, las consecuencias podran ser graves eimpredecibles (Gardner: 2003: 95).

    Si vamos a la tabla de estadsticos descriptivos que recin vimos, podemos notar que los grupostienen tamaos desiguales.

    No obstante, como este es un ejercicio, simplemente vamos a obviar esta violacin al supuestode la homogeneidad de varianza y vamos a seguir revisando los siguientes resultados.

    Levene's Test of Equality of Error Variancesa

    Dependent Variable: Mortalidad infantil (muertespor 1000 nacimientos vivos)

    3,209 26 75 ,000F df1 df2 Sig.

    Tests the null hypothesis that the error variance of thedependent variable is equal across groups.

    Design: Intercept+regin+clima+regin * climaa.

    Este es el contraste de Levene para determinar la homogeneidad de varianzas. Si es significativa (p < ) entonces se ha violado el supuesto de la homogeneidad de la

    varianza. En este caso la prueba de Levene fue significativa, por lo tanto las varianzas son heterogneas. Sin embargo, se ha demostrado que en tanto los tamaos grupales sean uniformes, las

    violaciones del supuesto de homogeneidad de varianza no afectarn mucho los resultados y nopondrn en entre dicho la interpretacin.

    En cambio, si los tamaos de los grupos son desiguales, las consecuencias podran ser graves eimpredecibles (Gardner: 2003: 95).

    Si vamos a la tabla de estadsticos descriptivos que recin vimos, podemos notar que los grupostienen tamaos desiguales.

    No obstante, como este es un ejercicio, simplemente vamos a obviar esta violacin al supuestode la homogeneidad de varianza y vamos a seguir revisando los siguientes resultados.

  • Esta tabla contiene la mayor parte de la informacin deinters.

    Para nosotros, sern de inters las columnas Sig, Partial EtaSquared (eta cuadrada parcial, similar a la eta cuadrada 2), yObserved Power (potencia observada).

    Adems, slo nos interesan los valores para las filas de los dosfactores (regin y clima), as como para la interaccin entreambos (regin * clima).

    Tests of Between-Subjects Effects

    Dependent Variable: Mortalidad infantil (muertes por 1000 nacimientos vivos)

    113190,500b 26 4353,481 8,485 ,000 ,746 220,614 1,00089600,884 1 89600,884 174,637 ,000 ,700 174,637 1,00042358,902 5 8471,780 16,512 ,000 ,524 82,560 1,0007890,072 7 1127,153 2,197 ,044 ,170 15,378 ,789

    16363,821 14 1168,844 2,278 ,012 ,298 31,894 ,95238480,230 75 513,070

    330400,372 102151670,730 101

    SourceCorrected ModelInterceptreginclimaregin * climaErrorTotalCorrected Total

    Type III Sumof Squares df Mean Square F Sig.

    Partial EtaSquared

    Noncent.Parameter

    ObservedPowera

    Computed using alpha = ,05a.

    R Squared = ,746 (Adjusted R Squared = ,658)b.

    Esta tabla contiene la mayor parte de la informacin deinters.

    Para nosotros, sern de inters las columnas Sig, Partial EtaSquared (eta cuadrada parcial, similar a la eta cuadrada 2), yObserved Power (potencia observada).

    Adems, slo nos interesan los valores para las filas de los dosfactores (regin y clima), as como para la interaccin entreambos (regin * clima).

  • Tests of Between-Subjects Effects

    Dependent Variable: Mortalidad infantil (muertes por 1000 nacimientos vivos)

    113190,500b 26 4353,481 8,485 ,000 ,746 220,614 1,00089600,884 1 89600,884 174,637 ,000 ,700 174,637 1,00042358,902 5 8471,780 16,512 ,000 ,524 82,560 1,0007890,072 7 1127,153 2,197 ,044 ,170 15,378 ,789

    16363,821 14 1168,844 2,278 ,012 ,298 31,894 ,95238480,230 75 513,070

    330400,372 102151670,730 101

    SourceCorrected ModelInterceptreginclimaregin * climaErrorTotalCorrected Total

    Type III Sumof Squares df Mean Square F Sig.

    Partial EtaSquared

    Noncent.Parameter

    ObservedPowera

    Computed using alpha = ,05a.

    R Squared = ,746 (Adjusted R Squared = ,658)b.

    Significacin para c/u de los efectos(principales y de interaccin)

    Los valores de la columna Sig son los que usamos para ver la significacin de losefectos.

    El efecto principal de A (regin econmica) es significativo (Sig = 0,000), por tanto,el factor de la regin es un indicador importante como variable independiente a lahora de explicar la variabilidad de la variable dependiente (mortalidad infantil).

    El clima igual alcanza a ser significativo, aunque con mayor margen deprobabilidad de cometer el error tipo I al rechazar H0.

    Por ltimo, la interaccin regin * clima es tambin significativa.

    Tests of Between-Subjects Effects

    Dependent Variable: Mortalidad infantil (muertes por 1000 nacimientos vivos)

    113190,500b 26 4353,481 8,485 ,000 ,746 220,614 1,00089600,884 1 89600,884 174,637 ,000 ,700 174,637 1,00042358,902 5 8471,780 16,512 ,000 ,524 82,560 1,0007890,072 7 1127,153 2,197 ,044 ,170 15,378 ,789

    16363,821 14 1168,844 2,278 ,012 ,298 31,894 ,95238480,230 75 513,070

    330400,372 102151670,730 101

    SourceCorrected ModelInterceptreginclimaregin * climaErrorTotalCorrected Total

    Type III Sumof Squares df Mean Square F Sig.

    Partial EtaSquared

    Noncent.Parameter

    ObservedPowera

    Computed using alpha = ,05a.

    R Squared = ,746 (Adjusted R Squared = ,658)b.

    Significacin para c/u de los efectos(principales y de interaccin)

  • Tests of Between-Subjects Effects

    Dependent Variable: Mortalidad infantil (muertes por 1000 nacimientos vivos)

    113190,500b 26 4353,481 8,485 ,000 ,746 220,614 1,00089600,884 1 89600,884 174,637 ,000 ,700 174,637 1,00042358,902 5 8471,780 16,512 ,000 ,524 82,560 1,0007890,072 7 1127,153 2,197 ,044 ,170 15,378 ,789

    16363,821 14 1168,844 2,278 ,012 ,298 31,894 ,95238480,230 75 513,070

    330400,372 102151670,730 101

    SourceCorrected ModelInterceptreginclimaregin * climaErrorTotalCorrected Total

    Type III Sumof Squares df Mean Square F Sig.

    Partial EtaSquared

    Noncent.Parameter

    ObservedPowera

    Computed using alpha = ,05a.

    R Squared = ,746 (Adjusted R Squared = ,658)b.

    Porcentaje de la varianza explicada para cada efectoprincipal y para el de interaccin. Es decir, la proporcin dela variacin total explicada por el factor por separado o por

    la interaccin de ambos factores.

    Debemos fijarnos fundamentalmente en los valores de eta cuadrada (2) para el factorA (regin econmica), el factor B (clima) y la interaccin entre ambos (A*B). La lectura de 2 tiene directa relacin con determinar primero cul de los factorestienen efectos significativos (es decir, p < ) En este ejemplo, los tres efectos (los dos efectos principales y el efecto de interaccin)son significativos, por tanto, debemos interpretar los tres valores de 2correspondientes. El efecto de la regin tiene un 52,4% de varianza explicada. El clima, apenas un 17%. La interaccin entre clima y regin econmica alcanza a 29,8% El modelo de dos factores (Modelo corregido o Corrected Model) en su conjunto tieneun porcentaje de varianza explicada de la mortalidad infantil que llega a 74,6%.

    Porcentaje de la varianza explicada para cada efectoprincipal y para el de interaccin. Es decir, la proporcin dela variacin total explicada por el factor por separado o por

    la interaccin de ambos factores.

  • Tests of Between-Subjects Effects

    Dependent Variable: Mortalidad infantil (muertes por 1000 nacimientos vivos)

    113190,500b 26 4353,481 8,485 ,000 ,746 220,614 1,00089600,884 1 89600,884 174,637 ,000 ,700 174,637 1,00042358,902 5 8471,780 16,512 ,000 ,524 82,560 1,0007890,072 7 1127,153 2,197 ,044 ,170 15,378 ,789

    16363,821 14 1168,844 2,278 ,012 ,298 31,894 ,95238480,230 75 513,070

    330400,372 102151670,730 101

    SourceCorrected ModelInterceptreginclimaregin * climaErrorTotalCorrected Total

    Type III Sumof Squares df Mean Square F Sig.

    Partial EtaSquared

    Noncent.Parameter

    ObservedPowera

    Computed using alpha = ,05a.

    R Squared = ,746 (Adjusted R Squared = ,658)b.Potencia de la prueba. Es til para determinar

    la validez externa de cada factor.

    Los valores de la columna de potencia observada son las probabilidadesde obtener valores significativos, si estos valores de 2 fueran de hechovalores poblacionales. Es decir, si repitiramos el estudio, esperaramos obtener resultadossignificativos con el factor A (regin econmica) en el 100% de las veces(potencia observada de A = 1,000). Si repitiramos el estudio, el clima tendra un 78,9% de probabilidad demostrar resultados significativos. Si repitiramos el estudio la interaccin entre ambos factores serasignificativa en el 95,2% de las veces.

    Potencia de la prueba. Es til para determinarla validez externa de cada factor.