presentación de coeficiente de correlacion de pearson y spearman

12
Republica Bolivariana De Venezuela Ministerio Del Poder Popular Para La Educación Superior Instituto Universitario Politécnico “ Santiago Mariño” Escuela Ingeniería Civil Sede - Barcelona Bachiller: Ortiz Rosa CI: 20740076 Profesor: Pedro Beltrán Sección:CV

Upload: 20740076

Post on 16-Feb-2017

70 views

Category:

Engineering


3 download

TRANSCRIPT

Republica Bolivariana De Venezuela Ministerio Del Poder Popular Para La Educación Superior

Instituto Universitario Politécnico “ Santiago Mariño”Escuela Ingeniería Civil

Sede - Barcelona

Bachiller:Ortiz Rosa CI: 20740076

Profesor:Pedro BeltránSección:CV

Coeficiente De Correlación De PearsonEs un índice estadístico que mide la relación lineal entre dos variables entre dos cuantitativas. A diferencia de la covarianza , la correlación de Pearson es independiente de la escala de medida de las variables. El calculo del coeficiente de correlación lineal se realiza dividiendo la covarianza por el producto de las desviaciones estándar de ambas variables .

r= Sxy Sx.Sy

Permite predecir el valor de una variable dado un valor determinado de la otra variable .se trata de valorar la asociación entre dos variables cuantitativas estudiando el método conocido como correlación. Dicho calculo es el primer paso para determinar la relación entre las variables.

Nota: si dos variables son independientes estarán incorrelacionadas aunque el resultado reciproco no es necesariamente cierto.

Coeficiente De Correlación De Pearson

Si r > 0 hay correlación positiva: las dos variables se correlacionan en sentido directo. A valores altos de una le corresponden valores altos de la otra e igual con los valores bajos .cuanto mas próximo a +1 este el coeficiente de correlación mas patente será esta covariacion .

Coeficiente De Correlación De Pearson

Si r es < hay correlación negativa: las dos variables se correlacionan en sentido inverso. A valores altos de una de ellas le suelen corresponder valor bajos de la otra y viceversa .cuanto mas próximo a -1 este el coeficiente de correlación mas patente será esta covariacion extrema .

Usos De Coeficiente De Correlación De Pearson Identifica el dependiente variable que se probara entre dos observaciones derivadas independientemente. Uno de requisitos es que las dos variables que se comparan deben observarse o medirse de manera independiente para eliminar cualquier resultado sesgado.

Para cantidades grandes de información ,el calculo puede ser tedioso.Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación lineal entre las dos variables.

Reporta un valor de correlación cercano al 1 como indicador de que existe una correlación lineal positiva entre las dos variables .un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información.Reporta un valor de correlación cercano a -1 como indicador de que hay una relación lineal negativa entre las dos variables.

Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos particulares. El valor de correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con las variables que se comparan.

Determina la importancia de los resultados. Esto se logra con el uso del coeficiente de correlación, grados de libertad y una tabla de valores críticos del coeficiente de correlación. Los grados de libertad se calculan como el numero de las dos observaciones menos 2.

Usos De Enfoques De Pearson a Problemas Estadisticos

Las observaciones de cada variable se deben ordenar en rangos ,así como obtener las diferencias entre los rangos ,efectuar la sumatoria y elevar esta al cuadrado. Educación de algunas madres y calificación de desarrollo mental de los hijos.

Cálculos de los grados de libertad (gl).gl = numero de parejas -1= 8-1=7 El valor rs calculado se compara con los valores críticos de rs del coeficiente de correlación por rangos de spearman .el valor critico de rs con 7 grados de libertad ,para una probabilidad de 0.05 del nivel de significancia es de 0.714 , o sea ,mayor que el calculado.

Por lo tanto, este tiene una probabilidad mayor que 0,05. Decisión como el valor de probabilidad de rs de 0,69 es mayor que 0,05 se acepta Ho y se rechaza Ha.

Interpretación El coeficiente de correlación de Spearman de 0.69 es menor que los valores críticos de la tabla, pues a éstos corresponde la probabilidad de obtener esa magnitud, al nivel de confianza de 0.05 y 0.01, para 0.714 y 0.893. Esto significa que para aceptar Ha, se requiere tener un valor igual o más lato que 0.714. Por lo tanto se acepta Ho y se rechaza Ha, aun cuando, como se observa en la siguiente figura, existe una asociación relativa entre la educación formal de la madre y el desarrollo mental de sus hijos; sin embargo, ésta no es significativa.

Ventajas y Desventajas del coeficiente De Pearson

Ventajas

Cuando en el fenómeno estudiado las dos variables son

cuantitativas se usa el coeficiente de correlaciones de

Pearson. Es llamado así en homenaje a

Karl Pearson. Las dos variables son designadas por x e y.

Desventajas

El valor 0 representa falta de correlación.

Cuando las variables x e y son independientes ,el número se anula

y el coeficiente de correlación poblacional tiene el valor cero.

En cambio una correlación nula no implica la independencia de

variables.

Coeficiente De Correlación De Speaman

Es una medida de correlación entre dos variables aleatorias continuas. Este coeficiente es una medida de asociación lineal que utiliza los rangos, números de orden de cada grupo de sujetos y compara dichos rangos.La interpretación del coeficiente de spearman es igual que la del coeficiente de correlación de Pearson .oscila entre -1 y +1 , indicándonos asociaciones negativas o positivas respectivamente. 0 (cero) , significa no correlación pero no independencia.Se diferencia de la correlación de Pearson en que utiliza valores medidos de nivel de una escala ordinal. Si alguna de las variables está medida a nivel de escala de intervalo/razón deberá procederse antes de operar el estadístico a su conversión en forma ordinal.

Usos De coeficiente De Correlación De Spearman Para aplicar el coeficiente de correlación de spearman se requiere que las variables están medidas al menos en escala ordinal ,es decir, de forma que las puntuaciones que las representan pueden ser colocadas en dos series ordenadas .A veces , este coeficiente es denominados por la letra griega ps (rho) ,aunque cuando nos situamos en el contexto de la estadística descriptiva se emplea la notación rs.La formula de calculo para rs puede derivarse de la utilizada en el caso de rxy, bastaría de aplicar el coeficiente de correlación de Pearson a dos series de puntuaciones ordinales ,compuestas cada unas de ellas por los primeros números naturales .A partir de un conjunto d n puntuaciones ,la formula que permite el calculo de correlacion entre dos variables x e y , medidas al menos en escala ordinal es la siguiente :

Donde D es la distancia existentes entre los puestos que ocupan las puntuaciones correspondientes a un sujeto i, cuando estas puntuaciones han sido ordenadas para x y para y.

Ventajas y Desventajas de Coeficiente de ralacion de Spearman

Ventajas

No es afectada por los cambios en las unidades de medida.

Al ser una técnica no parámetra es libre de distribución probabilística.

Desventajas

Es recomendable usarlos cuando los datos presentan valores extremos ,ya que dichos valores afecta mucho el

coeficiente de correlación de Pearson o antes distribuciones no normales .

r no debe ser utilizad para decir algo sobre la relación entre causa y efecto.

Usos de enfoques de Spearman a problemas Estadisticos

Los datos brutos usados en este ejemplo se ven abajo.

El primer paso es ordenar los datos de la primera columna .se agregan dos columnas ‘orden (i)´ y ´orden (t)´.Para l orden i, se corresponderán con el numero de filas del cuadro, para 99, orden (i)=3ya que ocupa el tercer lugar ordenado de menor a mayor.Para el orden t , se debe hacer lo mismo pero ordenando por ‘horas de tv a la semana’, para no hacer otro cuadro la secuencia ordenada quedaría t= { 0,7,7,12,17,20,28,28,28,50}, para este caso, el orden seria para cada elemento, respectivamente: orden (t)={ 1,2,3,4,5,6,7,8,9,10}.Sin embargo, el valor de orden esta dado por el valor promedio de sus posiciones, así para : 7 aparece 2 veces ,sumando sus posiciones= (2+3)/2= 2.528 aparece 3 veces, sumando sus posiciones=(7+8)+9/3=8.50 aparece 1 vez ,sumando su posición= 10/1=10.

Bibliografía

http:/ es.Wikipedia.org/wiki/coeficiente_de_correlaci%C3%B3n_de_spearman

http:/ www.statisticssolutions.com/correlation-Pearson-Kendal-spearman/

http:/ datalab.morningstar.com/knowledgebase/aspx/article.aspx?ID=550

http:/ es.Wikipedia.org/wiki/charles_spearman