monografÍa

46
AUTORA: Anny Marisseth VASQUEZ DE LA CRUZ. ASESOR: Mg. José Estanislao CERNA MONTOYA. Octubre de 2015 Nuevo Chimbote - Perú UNIVERSIDAD NACIONAL DEL SANTA FACULTAD DE INGENIERÍA ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA CIVIL CONSTRASTACIÓN DE HIPÓTESIS Monografía previa a la obtención de la calificación de la II Unidad del ciclo de estudios IV – 2015 – II del curso de Técnicas de Estudio e Investigación.

Upload: anny-vasquez

Post on 07-Dec-2015

80 views

Category:

Documents


0 download

DESCRIPTION

CONTRASTE DE UNA HIPÓTESIS

TRANSCRIPT

AUTORA:

Anny Marisseth VASQUEZ DE LA CRUZ.

ASESOR:

Mg. José Estanislao CERNA MONTOYA.

Octubre de 2015

Nuevo Chimbote - Perú

UNIVERSIDAD NACIONAL DEL SANTA FACULTAD DE INGENIERÍA

ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA CIVIL

CONSTRASTACIÓN

DE HIPÓTESIS Monografía previa a la obtención de la calificación de la II

Unidad del ciclo de estudios IV – 2015 – II del curso de

Técnicas de Estudio e Investigación.

Universidad nacional del Santa

CONSTRASTACIÓN

DE HIPÓTESIS

Universidad nacional del Santa

DEDICATORIA

Con profundo respeto para mi asesor Mg. José

Cerna Montoya, por sus enseñanzas y por

inculcarnos la investigación en nuestras vidas

universitarias.

A mis padres, guías en todo momento de mi vida y

ejemplos de tolerancia; a mi padre Dr. Francisco Vasquez

Carrillo, quien me enseño a ser perseverante y

responsable y a mi madre Mg. Nancy María De la Cruz

Chavez, quien me enseño la fortaleza y que en el mundo

hay muchos obstáculos los cuales siempre se enfrente con

la cabeza en alto.

A mi hermano, el mayor regalo de Dios, quien me

enseño que hay diversas formas de ver la vida y

que todo gran idea empieza como una mala idea o

un imposible.

Universidad nacional del Santa

AGRADECIMIENTO

Agradezco a mi asesor por su participación en mi formación profesional, por su

ayuda durante el proceso de elaboración de esta monografía, por su paciencia y

su enseñanza.

A mi familia por su paciencia en el tramo de la ejecución de la monografía y su

colaboración para culminar el presente trabajo.

Universidad nacional del Santa

PRESENTACIÓN

Todo estudio de educación superior requiere de la elaboración de trabajos de

investigación realizadas por los alumnos, con el fin de desarrollar actitudes,

aptitudes, destrezas y conocimientos en diferentes áreas.

Por eso es importante el conocimiento de ¿qué es una hipótesis?, ¿qué es el

contraste de una hipótesis? y ¿cómo podemos hacer el contraste de una

hipótesis?

El presente trabajo radica principalmente más que todo en conceptualizar los

métodos para la contrastación de una hipótesis.

En el primer capítulo contiene los conceptos fundamentales de las variables de

una contrastación de una hipótesis.

En el segundo capítulo contiene tres de los métodos más sencillos, para que el

estudiante se vaya familiarizando con ellas y para que pueda ir aplicándolas en

los contextos en los que sean pertinentes.

En este documento se ofrece un esquema general de los pasos que se deben

dar en un Contraste de Hipótesis y luego se exponen tres técnicas concretas,

como ilustración de su aplicación.

Universidad nacional del Santa

ÍNDICE

I. DEDICATORIA

II. AGRADECIMIENTO

III. PRESENTACIÓN

IV. CAPÍTULO i: Conceptos Fundamentales

V. CAPÍTULO II: CONSTRASTE DE UNA HIPÓTESIS:

Esquemas y ejemplos

Universidad nacional del Santa

CAPÍTULO I

Conceptos fundamentales

Universidad nacional del Santa

1. LA HIPOTESIS.

1.1. Definición.

Una hipótesis es una «suposición de algo posible o imposible para

sacar de ello una consecuencia». Es una idea que puede no ser

verdadera, basada en información previa. Su valor reside en la

capacidad para establecer más relaciones entre los hechos y explicar

por qué se producen. Normalmente se plantean primero las razones

claras por las que uno cree que algo es posible. Y finalmente ponemos:

en conclusión. Este método se usa en el método científico, para luego

comprobar las hipótesis a través de los experimentos.

Una hipótesis científica es una proposición aceptable que ha sido

formulada a través de la recolección de información y datos, aunque no

esté confirmada, sirve para responder de forma alternativa a un

problema con base científica.

Una hipótesis puede usarse como una propuesta provisional que no se

pretende demostrar estrictamente, o puede ser una predicción que

debe ser verificada por el método científico. En el primer caso, el nivel

de veracidad que se otorga a una hipótesis dependerá de la medida en

que los datos empíricos apoyan lo afirmado en la hipótesis. Esto es lo

que se conoce como contrastación empírica de la hipótesis o

bien proceso de validación de la hipótesis. Este proceso puede

realizarse mediante confirmación (para las hipótesis universales) o

mediante verificación (para las hipótesis existenciales).

Universidad nacional del Santa

2.2. Importancia.

Las hipótesis son el punto de enlace entre la teoría y la

observación. Su importancia es que dan rumbo a la

investigación al sugerir los pasos y procedimientos que deben

darse en la búsqueda del conocimiento.

Cuando la hipótesis de investigación ha sido bien elaborada, y

en ella se observa claramente la relación o vínculo entre dos o

más variables, es factible que el investigador pueda:

Elaborar el objetivo, o conjunto de objetivos, que desea

alcanzar en el desarrollo de la investigación.

Seleccionar el tipo de diseño de investigación factible con el

problema planteado.

Seleccionar el método, los instrumentos y las técnicas de

investigación acordes con el problema que se desea resolver.

Seleccionar los recursos, tanto humanos como materiales, que

se emplearán para llevar a feliz término la investigación

planteada.

2.3. Características.

Deben referirse a una situación real o realizable, no a una situación

que no puede ocurrir bajo un cierto estado de hechos.

Las variables de la hipótesis tienen que ser comprensibles, estar

bien definidas y ser lo más concretas posible.

La relación entre variables propuesta por una hipótesis debe ser

clara y verosímil.

Los términos de la hipótesis y la relación planteada entre ellos,

deben poder ser observados y medidos.

Las hipótesis deben estar relacionadas con técnicas disponibles

para probarlas.

Asimismo, cada tipo de hipótesis tiene sus características extra.

Las hipótesis descriptivas del valor de variables que se van a

observar en un contexto.

Las hipótesis correlacionales especifican las relaciones entre dos o

más variables y el orden de éstas no es importante. Pueden

alcanzar un nivel predictivo y parcialmente explicativo.

Universidad nacional del Santa

2. CONSTRASTACIÓN DE HIPÓTESIS.

2.1. Definición.

Es a última fase del método hipotético‑deductivo (etapa III) consiste en

la verificación o contrastación de hipótesis. Este es el momento en el

que el investigador recopila los datos relevantes que le permiten

concluir si la hipótesis debe ser aceptada o rechazada. En este punto

el científico dispone de diversos métodos, los cuales se pueden dividir

en experimentales y no experimentales. La diferencia principal entre

ambos métodos consiste en el grado de control que ejerce el

investigador sobre el fenómeno estudiado (Ballesteros & Garcia,

1995b) (Fernández-Trespalacios, 1986b) (Llor, Abad, García, & Nieto,

1995b) (Grzib & Briales, 1996b).

2.2. Métodos.

2.2.1. Métodos no experimentales.

Entre los métodos no experimentales de contrastación de hipótesis están

la observación sistemática y el método correlacional en ellos el

investigador recoge y mide los fenómenos tal y como se producen

naturalmente, sin manipular las causas de forma intencionada. En este

tipo de métodos el investigador no controla ninguna de las posibles

variables que pueden influir en los resultados, por lo tanto los resultados

observados pueden ser debidos a la influencia de variables extrañas que

no se han controlado.

Un ejemplo histórico de utilización de la observación sistemática como

método de contrastación de hipótesis lo tenemos en la teoría evolucionista

de Darwin. Darwin observando a diferentes especies animales y la

adaptación de estas a su medio llegó a las conclusiones que dieron origen

a su teoría evolucionista.

El método correlacional consiste en aplicar un análisis estadísticos a un

conjunto datos seleccionados, con el fin de averiguar si hay o no

correlación entre ellos (si están relacionados). Al igual que en la

observación sistemática en este método el investigador tampoco ejerce

ningún control sobre las variables objeto de estudio.

Universidad nacional del Santa

En los estudios correlacionales no se obtiene una información sobre cuál

de los fenómenos es causa y cuál efecto, únicamente lo que pretende es

conocer el grado y la dirección de la correlación. Una correlación no es

más que una expresión estadísticas mediante la cual se relacionan dos

hechos. El valor de la correlación puede oscilar entre 0 y 1, cuando más

próximo a 1 sea el valor obtenido mayor es la relación entre las dos

variables estudiadas. La correlación además puede ser positiva (+) o

negativa (-). La correlación será positiva cuando el aumento (o

disminución) en los valores de una de las variables estudiadas conlleva

también el aumento (o disminución) en la otra. Mientras que, por el

contrario, existirá correlación negativa cuando se produce una relación

inversamente proporcional entre dos fenómenos, de tal forma que al

incrementarse el valor de uno, se observa un decremento en el valor del

otro, o viceversa.

2.2.2. Métodos experimentales.

Los métodos experimentales son los únicos que permiten

establecer relaciones de tipo causa‑efecto. El experimentador

realiza un experimento para poner a prueba hipótesis sobre las

relaciones existentes entre dos tipos de variables: la variable

dependiente y la variable independiente. La variable que

manipula el experimentador se denomina variable

independiente. La variable que se refiere a la conducta que nos

interesa medir es la variable dependiente. Además, el

experimentador debe controlar todas las posibles variables

extrañas que puedan contaminar los resultados del experimento.

Si no se controlan adecuadamente las variables extrañas, no

será posible atribuir las variaciones que se observan en la

variable dependiente a las manipulaciones experimentales de la

variable independiente.

Universidad nacional del Santa

2.3. Diferencias entre los métodos experimentales y no experimentales.

La señal distintiva del experimento, en contraste con los

procedimientos no experimentales, es el control sobre las múltiples

variables que convergen en la producción de una determinada

conducta. Por lo tanto, debido a un mayor control de las variables

los resultados obtenidos, en el método experimental, tienen una

mayor relación con la manipulación a la que hemos sometidos los

hechos. Otra diferencia es que mientras en el método experimental

el experimentador manipula intencionadamente la variable

independiente, en el método no experimental el investigador se

limita a seleccionar los sujetos que ya poseen esos valores de la

variable independiente.

En el fondo se trata de dos alternativas metodológicas con

implicaciones científicas muy distintas. Ambas tienen ventajas e

inconvenientes. Muchas veces será utilizado uno u otro método en

función de la posibilidad de manipular las variables. Así en muchas

ocasiones, principalmente por motivos éticos, no será posible

aplicar un método experimental, por lo que tendremos que recurrir a

otro método menos preciso pero no por ello menos válido.

Una de las principales ventajas del método experimental, por el

mayor control de las variables implicadas, es su elevada validez

interna, mayor probabilidad de asegurar que el resultado obtenido

es fruto, exclusivamente, de la manipulación de nuestra variable.

Pero, uno de sus mayores inconvenientes es su alto grado de

“artificialidad”, provocado por la necesidad de controlar todas las

posibles variables extrañas que pueden estar alterando los datos,

con el fin de poder asegurar que el resultado obtenido (valor de la

variable dependiente) es, exclusivamente, debido a las

manipulaciones de las variables independientes. Esta artificialidad,

atenta contra la validez externa (o validez ecológica) que hace

referencia a la posibilidad de generalizar los resultados obtenidos a

Universidad nacional del Santa

otras situaciones en las cuales no se dé este control de las

variables.

Por el contrario, los métodos no experimentales son más naturales,

tienen mayor validez externa, pero tienen el inconveniente de un

menor control de las variables implicadas y, por lo tanto, tienen una

menor validez interna.

Un ejemplo que permita entender la diferencia entre método no

experimental y experimental puede ser el siguiente: Supongamos

que queremos comprobar la presunta relación existente entre el

cáncer (variable dependiente) y el tabaco (variable independiente),

para lo cual podemos emplear una metodología experimental

inyectando diferentes niveles de nicotina (variable independiente) a

diversas ratas de laboratorio. Transcurrido un tiempo,

comprobamos los efectos producidos (variable dependiente).

Durante el tiempo que dure el experimento controlamos las posibles

variables extrañas que puedan estar afectando al resultado final.

Pasado un tiempo, si observamos que las ratas a las que se ha

inyectado un cierto nivel de nicotina (variable independiente)

contraen el cáncer (variable dependiente), en número

significativamente mayor que el grupo de ratas a las que no se les

inyectó la nicotina, o se inyectó en menor cantidad, se puede

concluir, con un alto grado de probabilidad (porque hemos

controlado las posibles variables extrañas que podían haber influido

en el resultado final), que hay una relación causal entre las dos

variables.

Es evidente que en el caso del hombre no podemos utilizar la

misma técnica experimental, así que ahora para verificar la

hipótesis utilizamos un método no experimental, por ejemplo el

correlacional. Podríamos empezar haciendo una encuesta con el fin

de averiguar, en un grupo de sujetos previamente seleccionados

por presentar una patología pulmonar (ej.: cáncer de pulmón) la

cantidad de cigarrillos que fuman al día. Una vez conocido ambos

datos, la incidencia de cáncer de pulmón y el número de cigarros

Universidad nacional del Santa

consumidos al día, calcularíamos una correlación para saber si

ambas variables (tabaco y cáncer de pulmón) están o no

relacionadas en los seres humanos. Ahora bien, el que estén

relacionadas no significa, en este caso, que el tabaco sea un

agente causal, único o principal, respecto al cáncer de pulmón,

porque ambas variables pueden, a su vez, estar relacionados con

una tercera variable (ej.: la contaminación ambiental, la dotación

genética, la alimentación,...) que es la que lo produce o ejerce

mayor influencia.

2.4. Método Científico y contrastación de hipótesis

De forma resumida y algo simplista, podemos decir que el método científico propone soluciones tentativas a los problemas, en forma de hipótesis, deduce de esas hipótesis consecuencias verificables que somete a comprobación y mantiene la hipótesis o la rechaza, de acuerdo con el resultado de la comprobación.

En general, se consideran estrategias de investigación más potentes aquellas que buscan obtener evidencia contradictoria con la hipótesis establecida, ya que basta un resultado de este tipo para poder afirmar la falsedad de la hipótesis, mientras que los resultados confirmatorios sólo mantienen provisionalmente la hipótesis, quedando siempre abierta la posibilidad de que comprobaciones posteriores la contradigan. Es decir, si un enunciado A implica otro enunciado B, la negación de B implica la negación de A:

Si A c B Entonces B c A

Si expresamos esta regla en términos de ocurrencia de sucesos, puede que quede más claro su significado. Si siempre que ocurre A ocurre B, entonces el que yo observe que ha ocurrido B no me dice nada sobre la ocurrencia de A. Por el contrario, si en esas condiciones, observo que no ha ocurrido B podré derivar lógicamente que no ha ocurrido A. Ejemplo, siempre que llueve se moja el suelo, si observamos que el suelo está mojado eso no quiere decir que necesariamente halla llovido, pueden haber regado, puede

Universidad nacional del Santa

haberse roto una tubería, etc. Sin embargo, si observo que el suelo está seco, eso indica, sin ninguna duda, que no ha llovido.

Dentro de la Naturaleza y especialmente en la investigación del campo

psicológico las leyes no pueden establecerse de forma tan categórica, debido a la variabilidad inherente al proceso que se estudia o debido a la falta de control sobre algunos factores que lo determinan. En general, no podremos hacer afirmaciones del tipo "siempre que ocurre A ocurre B", sino que nuestras afirmaciones serán de la forma "siempre que ocurre A es probable que ocurra B y poco probable que no ocurra B". Los contrastes de hipótesis estadísticos estudian bajo que condiciones y en que forma una afirmación del tipo anterior nos puede conducir a que la comprobación de la no ocurrencia de B haga poco probable la ocurrencia de A.

Contrastes de Hipótesis Estadísticas

Si analizamos los datos de los estudios psicológicos desde un punto de vista probabilístico y con las herramientas de la Estadística Matemática, es porque numerosas características de los individuos no son determinísticas y en las mismas condiciones pueden manifestarse con distintos valores. Esto hace que tales características se nos presenten como variables aleatorias que toman distintos valores con diferentes probabilidades. En estas condiciones nuestras hipótesis tendrán que ser afirmaciones acerca de la distribución de esa variable en la población y la verificación de tales hipótesis se hará mediante la evidencia empírica que nos proporcionen los datos de una muestra. Definimos:

Hipótesis Estadística

Una hipótesis estadística es una afirmación sobre la distribución de un atributo o variable en la población.

Ejemplos de hipótesis estadísticas son afirmar que el C.I. medio de los alumnos de primero de Psicología es mayor que lOO, o decir que el número de aprobados en el primer parcial de Análisis de Datos sigue una distribución Binomial. En el primer caso se trata de una afirmación relativa al valor de un parámetro de la distribución, mientras que la segunda hace referencia a la forma de la distribución. Nosotros nos centraremos en el estudio de las hipótesis estadísticas relativas a un parámetro de la distribución de la población. Desde esta perspectiva podemos diferenciar dos contextos o modelos de actuación.

Contrastes Paramétricos

Son procedimientos que contrastan una afirmación acerca del valor de un parámetro, pero suponiendo conocida la forma de la distribución. Por ejemplo, contrastar la anterior hipótesis de que la media del C.I. de los alumnos es mayor que lOO, suponiendo que la distribución de las puntuaciones es una distribución Normal.

Contrastes No Paramétricos

En estos métodos la hipótesis que se somete a prueba puede ser la misma que en el caso anterior, pero no se especifica la forma de la distribución de la población, a lo más, se exige como condición que la distribución sea continua.

Universidad Nacional del Santa

Es obvio que las hipótesis relativas a un parámetro de la población podrían someterse a verificación midiendo la característica en cuestión, en todos los individuos de la población, y calculando el valor del parámetro, pero por las razones que se expusieron en el tema de inferencia, imposibilidad de acceder a la totalidad de la población, economía de los estudios y mayor calidad de los datos, en general para someter a prueba una hipótesis, observaremos los valores de una muestra, convenientemente seleccionada, y determinaremos si la hipótesis establecida es compatible o no con los datos de la muestra. En este sentido definimos:

Contraste de Hipótesis

Es una regla de decisión que nos indica si una hipótesis relativa a la población es compatible (en términos de probabilidad) con los datos de la muestra, o si es incompatible con los mismos y en consecuencia debe ser rechazada.

Señalaremos que una regla de decisión es una función que asigna a cada conjunto de datos la acción a emprender. En general, las reglas de decisión son construidas de tal forma que la acción que seleccionan es óptima, de acuerdo con algún criterio prefijado.

Si recordamos que las hipótesis estadísticas que vamos a considerar son afirmaciones acerca de los parámetros de la distribución de la población, podremos ver

Universidad Nacional del Santa

que toda hipótesis se identifica, o viene determinada por un subconjunto del espacio paramétrico.

Espacio Paramétrico

El espacio paramétrico, que designaremos por , es el espacio o conjunto donde toma valores el parámetro.

Por ejemplo, si el parámetro que estamos considerando, es la media de una distribución Normal, el espacio paramétrico será la recta real. Si es el número de pruebas de una distribución Binomial, será el conjunto de los números naturales, etc.

Al subconjunto del espacio paramétrico que identifica una hipótesis, se le designa por .

Una vez establecida una hipótesis y su correspondiente subconjunto del espacio paramétrico, surge automáticamente su hipótesis alternativa que estará definida por el resto del espacio paramétrico - .

Ejemplo: Cuando asegurábamos que el C.I. medio de los alumnos de primero de Psicología estaba por encima de lOO, establecíamos una hipótesis que se correspondía con el intervalo (lOO, ) que es un subconjunto de la recta real . La hipótesis alternativa sería la afirmación contraria de que el C.I. medio, de estos mismos alumnos, es menor o igual que lOO, a la cual correspondería el intervalo (- , lOO] que es precisamente igual a - (lOO, ).

Universidad Nacional del Santa

Hipótesis simple

Una hipótesis se dice que es simple cuando consta de un solo punto del espacio paramétrico. Por ejemplo, decir que el C.I. medio de los alumnos de primero es igual ll2 es enunciar una hipótesis simple.

Hipótesis compuesta

Una hipótesis es compuesta cuando consta de más de un punto del espacio paramétrico. Por ejemplo, la hipótesis ya vista de que la media de los C.I. de los alumnos es mayor que lOO, sería una hipótesis compuesta.

Hipótesis Nula

La hipótesis que se somete a contraste se denomina Hipótesis Nula y se designa por HO.

Por razones del método que se sigue para contrastar una hipótesis, la hipótesis nula debe ser una hipótesis de igualdad, de no diferencia entre las poblaciones, de falta de efectos de los tratamientos, es por esta razón que se denomina nula. la Hipótesis Nula HO es la que se somete a contraste y por tanto será la que aceptaremos o rechazaremos.

Universidad Nacional del Santa

Hipótesis Alternativa

Es la contraria de la Hipótesis Nula. Esta hipótesis afirma la existencia de una diferencia entre las poblaciones, o la presencia de un efecto no nulo de los tratamientos y suele ser la hipótesis que desea probar el experimentador. Se le designa por Hl.

Ejemplos: Supongamos que queremos verificar si existen diferencias, por término medio, entre el C.I. de las alumnas y de los alumnos. Independientemente de cual sea la hipótesis que nos interese probar, que las alumnas tienen mayor C.I. que los alumnos, o viceversa que es mayor en los alumnos, la hipótesis que debemos someter a contraste, es decir la Hipótesis Nula, deberá ser que ambos C.I. medios son iguales:

HO : CI

M CI H

Nuestras intenciones podrán reflejarse en la Hipótesis Alternativa que en este caso podría adoptar cualquiera de las siguientes formas:

Hl : CI

M CI H

Hl : CI

M

CI H

Hl : CI

M

CI H

Universidad Nacional del Santa

La aparente contradicción de que puedan existir distintas Hipótesis Alternativas a una misma Hipótesis Nula, será explicada posteriormente cuando hallamos visto los conceptos de potencia y nivel de confianza de un test.

De igual forma, si quisiéramos contrastar que el C.I. medio de una población es distinto de lOO tendríamos que establecer como Hipótesis Nula:

HO : CI lOO

Mientras que la Hipótesis Alternativa podría ser:

Hl : CI

Hl : CI

Hl : CI

lOO

lOO

lOO

Estadístico de Contraste

La aceptación o rechazo de la Hipótesis Nula se hace considerando su compatibilidad o incompatibilidad con los datos muestrales, pero esta decisión no se establece mediante la inspección directa de los datos muestrales, sino a partir de los valores de un estadístico, recuérdese que un estadístico es una función de los valores de la muestra. Si el estadístico es menor que un cierto valor crítico C, se aceptará la Hipótesis Nula HO. Por el contrario, si el

estadístico es mayor que el valor crítico, se rechazará la Hipótesis Nula. De esta forma el problema de tomar la decisión a partir de

Universidad Nacional del Santa

la información multidimensional que proporciona la muestra, que si se abordase directamente obligaría a definir una región del espacio muestral que es n-dimensional, se transforma en un problema unidimensional y para establecer la regla de decisión basta con establecer un punto de corte en la recta real, que si es superado indica que debe rechazarse la hipótesis. El valor

critico C se determinará atendiendo a minimizar, en su conjunto, las probabilidades de los distintos tipos de error que pueden producirse.

Requisitos del Estadístico de Contraste

Para poder construir adecuadamente la regla de decisión y mantener controladas las probabilidades de error, antes mencionadas, el estadístico de contraste debe de cumplir las siguientes condiciones:

Deberá de ser elegido de manera que pueda ser conocida su distribución, cuando sea cierta la Hipótesis Nula.

Cuando la Hipótesis Nula sea falsa su distribución debe ser diferente. El estadístico será más útil cuanto más fácil sea discernir esta diferencia, por lo que es preferible que ambas distribuciones se hallen diferenciadas por sus promedios y no por su forma.

Universidad Nacional del Santa

Ejemplo: Supongamos que tenemos una población, en la cual el C.I. sigue una distribución Normal de media y desviación típica , y queremos contrastar si la media del C.I. vale lOO. Por tanto la Hipótesis Nula será:

HO : CI lOO

El estadístico de contraste para esta hipótesis será:

g xl, x2 , ... xn

x lOO

S

n l

En virtud del teorema de Fisher sabemos que el estadístico:

t x S

sigue una distribución t de Student con n-l grados de libertad. Por consiguiente, cuando la Hipótesis Nula sea cierta y la media de la población sea lOO, tendremos que ambos estadísticos coincidirán y por tanto el estadístico de contraste seguirá una t de Student. Por el contrario, cuando la Hipótesis Nula sea falsa, estaremos restando una cantidad, que será distinta del valor de la media de la población, y el estadístico de contraste seguirá una distribución que ya no tendrá de media cero, y por ello estará desplazada, a la derecha o a la izquierda, de la t de Student.

n l

Universidad Nacional del Santa

Región Crítica o de rechazo

Es el conjunto de muestras, o puntos del espacio muestral, que determinan un valor del estadístico de contraste superior al valor crítico y por tanto conllevan la decisión de rechazar la Hipótesis Nula. Se designa por Wn y será:

Wn xl, x2 ,...

xn

g xl, x2 ,... xn C

Región de Aceptación

Es el conjunto de puntos del espacio muestral es decir, las diferentes muestras, que hacen que el estadístico tome un valor inferior o igual al valor crítico y que por consiguiente conducen a que se acepte la Hipótesis Nula. Si designamos por Rn al espacio muestral, tendremos:

Rn Wn

xl, x2 ,...

xn

g xl, x2 ,... xn C

Universidad Nacional del Santa

Tipos de Error

Como hemos visto, en un contraste de hipótesis podemos tomar dos decisiones, rechazar la Hipótesis Nula o aceptarla. A su vez la Hipótesis Nula puede ser verdadera o puede ser falsa, lo cual conduce a que se puedan producir cuatro resultados en un test de hipótesis, de los cuales dos son correctos y dos son erróneos. De forma esquemática

Rechazar

HO Aceptar

HO

HO Verdadera HO Falsa

Error Tipo I

Es el error que se comete cuando se rechaza una Hipótesis Nula que es cierta.

Error Tipo II

Es el error que se comete al aceptar una Hipótesis Nula que es falsa.

Es obvio, que lo ideal sería contar con un método de contrastación en el que no se cometieran errores, pero la naturaleza del procedimiento, que basa su decisión en los datos de una muestra, hace que siempre exista la posibilidad de tomar la opción equivocada debido a las fluctuaciones muestrales. Lo relevante es conseguir tener controlado este riesgo y en este sentido definimos:

Nivel de Significación

Es la probabilidad de rechazar una Hipótesis Nula que es cierta o lo que es lo mismo, es la probabilidad de cometer Error de Tipo I. Se designa habitualmente por .

Error Tipo I Rechazo correcto

Aceptación correcta Error Tipo II

Universidad Nacional del Santa

Nivel de Confianza

Es la probabilidad de aceptar la Hipótesis nula cuando es verdadera. Su valor es, uno menos el nivel de significación, l- .

Potencia de un contraste

Es la probabilidad que tiene el contraste de rechazar la Hipótesis Nula cuando es falsa. Será igual a uno menos la probabilidad de cometer Error de Tipo II, como esta última se suele designar por , la potencia será l- .

Criterio de Selección

A la hora de seleccionar un test estadístico, para contrastar una hipótesis, el óptimo sería aquel que hiciese mínimas la s probabilidades de Error de Tipo I y Tipo II. Sin embargo, esto no es posible ya que al disminuir el nivel de significación se reduce la región crítica y por consiguiente se pierde potencia. En sentido contrario, para disminuir la probabilidad de Error de Tipo II, debe aumentar el tamaño de la región crítica lo que conduce a que aumente el nivel de significación. Se impone por tanto una solución de compromiso entre ambos tipo de error. El criterio establecido parte del hecho de que la distribución del estadístico es conocida, cuando la Hipótesis Nula es cierta, por tanto podemos fijar el nivel de significación en el valor que deseemos. Una vez establecido el nivel de significación que queremos, de entre todos los tests existentes, con ese nivel de significación, seleccionaremos el que tenga máxima potencia.

Universidad Nacional del Santa

Para ilustrar el criterio anterior volvamos al ejemplo en que queríamos contrastar si la media del C.I. era igual a lOO. Sabíamos que cumpliéndose la Hipótesis Nula :

HO : CI lOO

el estadístico de contraste:

t x lOO

S

seguía una t de Student con n-l grados de libertad.

Partiendo de estas premisas puedo fijar el nivel de significación que desee y obtener el valor crítico correspondiente. En efecto, supongamos que la muestra es de tamaño 26 y que fijamos el nivel de confianza en el 9O%, que es igual que decir que el nivel de significación será del lO%. Buscando en las tablas de la t de Student, con 25 grados de libertad, obtengo que l,3l6 es el valor de la variable que deja por debajo de si una probabilidad de O,9 y por consiguiente, la probabilidad de obtener un valor mayor que l,3l6 es O,l.

n l

Queda así definido el test, cuya región de aceptación será el conjunto de muestras que hagan que el estadístico tome un valor inferior o igual a l,3l6. La región crítica será el conjunto de puntos del espacio muestral para los cuales el valor del estadístico sea mayor que l,3l6, caso de que la muestra obtenida al realizar el test pertenezca a este conjunto, rechazaremos la Hipótesis Nula.

Las dificultades surgen porque el test, anteriormente descrito, no es el único con un nivel de significación de O,l. Por ejemplo, si yo defino como región de aceptación el conjunto de muestras que hacen que el estadístico esté comprendido entre -l,7O8 y l,7O8 y como región de rechazo aquellas muestras que hacen que el estadístico sea mayor que l,7O8 o menor que -l,7O8, tendré, como puede verse en la figura, un contraste distinto del anterior, pero que también posee el nivel de significación del lO%.

Universidad Nacional del Santa

Se comprueba fácilmente que el número de tests con un nivel de significación

del lO% es infinito, hay tantos tests como formas de distribuir la probabilidad O,l entre las dos colas de la distribución, O,O7 y O,O3, O,O6 y O,O4, etc.

Universidad Nacional del Santa

La solución a esta dificultad es seleccionar de entre todos estos tests, con el mismo nivel de significación, el más potente y para ello entra en juego la hipótesis alternativa que se considere. Supongamos que se verificase la Hipótesis Alternativa de que la media es mayor que lOO.

Hl : CI lOO

entonces, en el numerador del estadístico, estaríamos restando una cantidad inferior a la media y por consiguiente la distribución del estadístico ya no tendría de media cero, sino un número positivo y estaría desplazada a la derecha de la t de Student, como vemos en la figura:

Por ello, el primer contraste que vimos, que tenía toda la región crítica a la derecha, será el más potente, ya que sitúa la región crítica en los valores más probables bajo la Hipótesis Alternativa.

De forma análoga, cuando la Hipótesis Alternativa sea que la media es menor que lOO:

Hl : CI lOO

tendremos que si la Hipótesis Alternativa es cierta la distribución del estadístico estará desplazada a la izquierda de la t de Student y por consiguiente el test más potente sería aquel que tiene como región crítica los puntos que hacen que el estadístico tome valores inferiores a -l,3l6.

Por el contrario, si la Hipótesis Alternativa, a considerar, es que la media es distinta de lOO:

Hl : CI lOO

si se verifica la Hipótesis Alternativa, la distribución del estadístico puede situarse tanto a la derecha como a la izquierda de la t de Student.

Por ello el contraste de hipótesis que tiene como región de aceptación el intervalo [-l,7O8 , l,7O8] es, de entre todos los tests con un nivel de confianza del 9O%, el más potente. En este caso la región crítica es el conjunto de muestras que hacen que el estadístico sea mayor que l,7O8 o menor que -l,7O8, por ello este tipo de tests se denominan contrastes bilaterales o de dos colas, mientras que los anteriores son conocidos como contrastes unilaterales o de una sola cola.

Contrastes Bilaterales y Unilaterales

Como hemos visto, el elemento determinante para que el contraste más potente sea un contraste bilateral o unilateral, es la forma que adopte la Hipótesis Alternativa.

Nos que da por dilucidar como es que una misma Hipótesis Nula puede aparentemente tener distintas Hipótesis Alternativas.

En realidad a la Hipótesis Nula:

HO : CI lOO

le corresponde únicamente la Hipótesis Alternativa:

Hl : CI lOO

y las otras Hipótesis Alternativas corresponden a contrastes en que se someten a prueba Hipótesis Nulas diferentes, en concreto los contrastes serían:

HO : CI lOO frente a Hl :

CI

lOO

HO : CI lOO frente a Hl :

CI

lOO

Lo que sucede es que en estos contraste la Hipótesis Nula consta de más de un punto del espacio paramétrico y no tendríamos un solo nivel de significación, sino tantos como valores de la media considerásemos. Por ello el cálculo de nivel de significación se hace para la situación más desfavorable que correspondería al caso en que = lOO, y si se rechaza la Hipótesis Nula de que la media es lOO, con mayor razón se haría para los valores inferiores, en el caso del primer test. Un argumento semejante puede realizarse para el segundo.

CAPÍTULO II CONSTRASTE DE UNA HIPÓTESIS:

Esquemas y ejemplos

1. Contraste de una hipótesis.

Las dos primeras se refieren al Contraste de Hipótesis sobre la media

poblacional (µ), mientras que la tercera se refiere al Contraste de Hipótesis sobre la

independencia lineal entre dos variables (ρ=0).

2. Pasos en el Contraste de Hipótesis.

1) Establecer las Hipótesis, indicando la Hipótesis Nula (H0) y la Hipótesis

Alterativa (H1).

2) Especificar los Supuestos que se van a asumir, incluyendo supuestos

distribucionales, de muestreo, de información conocida, etc.

3) Elegir un Estadístico de Contraste apropiado, especificando su distribución

cuando se asume como verdadera la H0 establecida en el paso 1 y los

supuestos indicados en el paso 2.

4) Establecer una Regla de Decisión, bilateral o unilateral, basada en el nivel de

significación (α) específico que se adopte.

5) Calcular, según la fórmula indicada, el valor del estadístico de contraste y el nivel

crítico.

6) Adoptar la Decisión y establecer la conclusión.

A. Contraste de hipótesis sobre la media, conocida σ

Para contrastar hipótesis sobre el valor de una media vamos a distinguir dos

casos: aquellos en los que se conoce la varianza poblacional y aquellos en los que

no se conoce. Aunque el primer caso es muy infrecuente en la práctica, por razones

didácticas se suele exponer en primer lugar. El procedimiento consiste, como ya

hemos dicho en aplicar el esquema habitual con los siguientes pasos:

1) Hipótesis. Si se trata de un contraste bilateral, éstas serán de la forma,

H0: µ = µ0

H1: µ ≠ µ0

σ n

2) Supuestos.

- La población se distribuye N(µ,σ) o la muestra es suficientemente

grande como para asumir la normalidad basándonos en el

Teorema Central del Límite.

- La media muestral se ha obtenido sobre una m.a.s.

- Conocemos σ.

3) Estadístico de Contraste y su distribución bajo H0 verdadera.

z X μ0

→ N(0, 1)

4) Regla de Decisión, basada en el nivel de significación (α) adoptado.

Rechazar si z ≥ 1-α/2z ó z ≤ α/2z

No rechazar si α/2z < z < 1-α/2z

5) Cálculo del Estadístico de Contraste (y eventualmente el Nivel Crítico).

6) Adoptar la Decisión y Concluir.

Ejemplo. Supongamos que queremos contrastar la hipótesis de que la media

poblacional en una determinada variable, X, es igual a 100, sabiendo que la varianza

poblacional es igual a 64 y que X es normal. Para ello extraemos una

m.a.s. de 25 observaciones y calculamos su media aritmética en X, que resulta ser

igual a 105; establecemos un nivel de significación (α) de 0,05.

1) Hipótesis.

H0: µ = 100

H1: µ ≠ 100 (Adviértase que en el problema no se especifica nada

sobre la dirección de la diferencia entre 100 y la media

poblacional real, en caso de ser falsa H0, por lo que se

realiza un contraste bilateral)

σ n

σ n

8 25

2) Supuestos.

- La población se distribuye N(µ, 8)

- Se trata de una m.a.s.

- Conocemos σ

3) Estadístico de Contraste. En las condiciones indicadas,

z X μ0

→ N(0, 1)

4) Regla de decisión.

Rechazar si z ≥ 1,96 ó z ≤ -1,96

No rechazar si -1,96 < z < 1,96

5) Cálculo.

z X

μ0

105 100

3,125

6) Decisión y Conclusión.

Como 3,125 > 1,96 rechazamos H0.

Concluimos que la evidencia aconseja rechazar, según la regla de

decisión adoptada, la hipótesis de que la media poblacional sea igual a

100.

Un último comentario sobre esta técnica de contraste. Entre los supuestos se

ha incluido la normalidad de la distribución en la población de la variable implicada.

Por lo que ya hemos estudiado, sabemos que aunque esto no fuera verdad la

distribución muestral de la media se aproxima a la normal a medida que se

incrementa el tamaño de la muestra empleada (Teorema Central del Límite). Es raro

que sepamos con certeza la forma de una distribución y en cambio no conozcamos

su media. Es más frecuente que desconozcamos ambos. Esta es la razón por la que

se suele recomendar, para aplicar este contraste, que la muestra sobre la que se

calcula la media sea de al menos n=30. De esta forma se podrá aplicar esta técnica

sin preocuparnos por la distribución de la variable de partida.

S n

Sn

n - 1

B. Contraste de hipótesis sobre la media, desconocida σ

Con mucha frecuencia nos encontraremos en una situación como la anterior

pero con la diferencia de que no conoceremos la varianza poblacional, σ2. Es decir,

queremos contrastar si la media poblacional es un cierto valor y podemos asumir la

normalidad de la población (o se trata de una muestra grande) y que la media se ha

obtenido en una m.a.s. Si la única diferencia con el escenario anterior es que no

conocemos la varianza poblacional (algo bastante razonable, dado que será raro que

no conozcamos µ y en cambio conozcamos σ) entonces podemos recurrir a un

estadístico similar al anterior, pero en el que en lugar de aparecer σ en el

denominador aparece su estimador S (la desviación típica de la muestra). La única

consecuencia de cambiar σ por S es que el Estadístico de Contraste ya no se

distribuye N(0,1), sino según la distribución t de student, siendo los grados de

libertad el tamaño de la muestra menos 1 (tn-1),

T X μ0 → tn-1

(Si lo que aparece en el denominador es el estimador sesgado de la desviación

típica, entonces en la raíz aparece (n-1). Es decir, representando por Sn y Sn-1 a los

estimadores sesgado e insesgado, respectivamente, las fórmulas serían,

T X μ0

y T

X μ0

aunque en ambos casos la distribución es la misma: tn-1. El esquema, muy

similar al del caso anterior, será el siguiente,

1) Hipótesis.

H0: µ = µ0

H1: µ ≠ µ0

Sn

n - 1

Sn-1

n

2) Supuestos.

- La población se distribuye N(µ,σ) o la muestra es suficientemente

grande como para asumir la normalidad basándonos en el TLC.

- La media muestral se ha obtenido sobre una m.a.s.

- Desconocemos σ.

3) Estadístico de Contraste.

T X μ0

o T

X

μ0

→ tn-1

4) Regla de Decisión.

Rechazar si T ≥ 1-α/2tn-1 ó T ≤ α/2tn-1

Sn

n - 1

S n

n-1

No rechazar si α/2tn-1 < T < 1-α/2tn-1

5) Cálculo.

6) Decisión y Conclusión.

Ejemplo. Supongamos que queremos contrastar la hipótesis de que la media

poblacional en una determinada variable, X, que se distribuye normalmente, es igual

a 80. Extraemos una m.a.s. de 81 observaciones y en ella obtenemos que

su media es 75,8 y su varianza ( S2 ) es igual a 236; establecemos un nivel de

significación (α) de 0,01.

1) Hipótesis.

H0: µ = 80

H1: µ ≠ 80

2) Supuestos.

- La población se distribuye N(µ, σ)

- Se trata de una m.a.s.

- Desconocemos σ.

3) Estadístico de Contraste.

T X

μ0

→ t80

Sn-1

n

15,36 81

4) Regla de decisión, con el nivel de significación adoptado (α=0,01),

Rechazar si T ≥ 2,639 ó T ≤ -2,639

No rechazar si -2,639 < T < 2,639

5) Cálculo.

T X

μ0

75,8

80

-2,461

6) Decisión y Conclusión.

Como el valor obtenido (-2,461) está entre ± 2,639 Mantenemos H0.

La evidencia aconseja no rechazar, según la regla de decisión

adoptada, la hipótesis de que la media poblacional sea igual a 80; la

evidencia observada es compatible con ella.

1 r 2 XY

C. Contraste de hipótesis sobre la correlación de Pearson

El caso que exponemos aquí es única y exclusivamente aquel en el que

queremos contrastar si la correlación de Pearson poblacional es 0. Los contrastes

sobre cualquier otro valor exigen otros elementos que se expondrán en la asignatura

de Análisis de Datos en Psicología II. No obstante, el contraste del valor 0 es, con

mucho, el más interesante y el que con mayor frecuencia se emplea.

Se trata de contrastar la independencia lineal entre dos variables; es decir, si

la correlación poblacional (ρ) es igual a 0. Para ello necesitamos especificar un

escenario en el que podamos definir un Estadístico de Contraste con una

distribución conocida con la que establecer la regla de decisión. El escenario

buscado es el que se resume en el siguiente esquema, en el que se llega a un

Estadístico de Contraste que bajo hipótesis nula verdadera se distribuye t de student

con n-2 grados de libertad (tn-2).

1) Hipótesis.

H0: ρ = 0

H1: ρ ≠ 0

2) Supuestos.

- Las dos variables a las que se refiere la correlación son normales (en

realidad los supuestos distribucionales son más complejos, pues

se debe asumir la homocedasticidad condicional; esto se

explicará en Análisis II).

- La correlación muestral, rXY, se ha obtenido sobre una m.a.s. de

pares de valores de X e Y.

3) Estadístico de Contraste.

T

rXY

→ tn-2

4) Regla de Decisión.

Rechazar si T ≥ 1-α/2tn-2 ó T ≤ α/2tn-2

No rechazar si α/2tn-2 < T < 1-α/2tn-2

e

5) Cálculo.

6) Decisión y Conclusión.

n - 2

1 r 2 XY

1 r 2 XY

Ejemplo. Supongamos que queremos contrastar si a nivel poblacional las variables

X e Y son linealmente independientes. Extraemos una m.a.s. de 62 observaciones y

en ella obtenemos una correlación de 0,28. Por estudios anteriores sabemos que

podemos asumir que se trata de variables normales; establecemos un nivel de

significación (α) de 0,05.

1) Hipótesis.

H0: ρ = 0

H1: ρ ≠ 0

2) Supuestos.

- Ambas variables se distribuye Normalmente en la población.

- Se trata de una m.a.s.

3) Estadístico de Contraste.

T

rXY

→ t60

4) Regla de Decisión.

Rechazar si T ≥ 2,000 ó T ≤ -2,000

No rechazar si -2,000 < T < 2,000

5) Cálculo.

T

rXY

n - 2

2,259

6) Decisión y Conclusión.

Como 2,259 no está entre ± 2,000, Rechazamos H0.

La evidencia aconseja rechazar, según la regla de decisión adoptada,

la hipótesis de que en la población estas variables sean linealmente

independientes; la evidencia observada no es compatible con ella.

n - 2

0,28 62 - 2

1 0,282

CONCLUSIÓN

Una vez expuesta la lógica de un Contraste de Hipótesis y tras haber definido los

términos y conceptos involucrados, hay que decir que esa lógica general se

concreta en una enorme cantidad de técnicas particulares.

Cada técnica ha sido desarrollada para ser empleada en un escenario específico,

es decir, a las hipótesis referidas a un determinado parámetro, con unos

determinados supuestos distribucionales y en unas circunstancias concretas.

BIBLIOGRAFÍA I. FUENTES BIBLIOGRAFICAS:

Herández Sampieri, Roberto. (2010). Metodología de la

Investigación (5ta ed.). McGRAW-HILL / INTERAMERICANA

EDITORES, S.A. DE C.V.

Salinas, José M. Análisis de Datos: Contraste de Hipótesis. Cap.

13.

II. FUENTES ELECTRÓNICAS:

CarmenX

https://www.uam.es/personal_pdi/psicologia/carmenx/Contraste_

Hipotesis.pdf

Uiversidad de Cantabria

http://ocw.unican.es/ciencias-de-la-salud/ciencias-psicosociales-

i/materiales/bloque-i/tema-1/1.1.3.2.3-diferencias-entre-los-

metodos

Universidad Complutense de Madrid

https://www.ucm.es/data/cont/docs/518-2013-11-13-tests.pdf

Wikipedia

https://es.wikipedia.org/wiki/Hip%C3%B3tesis_(m%C3%A9todo_

cient%C3%ADfico)

Centro de recursos para el aprendizaje

http://es.slideshare.net/craupru/monografia-apa?related=7