tratamiento estadístico a datos experimentales

50
TRATAMIENTO ESTADISTICO DE MUESTRAS FINITA

Upload: kevin

Post on 01-Nov-2015

13 views

Category:

Documents


0 download

DESCRIPTION

Tratamiento estadístico a datos experimentales obtenidos en el laboratorio de química analítica.

TRANSCRIPT

  • TRATAMIENTO ESTADISTICO DE MUESTRAS FINITAS

  • La correcta utilizacin de los mtodos estadsticos permite profundizar en el conocimiento de los fenmenos de la variabilidad de manera que, aunque el conocimiento obtenido sea imperfecto, permite asumir un riesgo conocido en la interpretacin o toma de decisiones a partir de los datos experimentales.

    La Estadstica puede ser aplicada a conjuntos pequeos de datos, especialmente a los obtenidos por medidas repetidas (rplicas). No mejora los datos en el sentido de que elimine los errores o incertidumbres, sino que los mejora en el sentido de que permite establecer cotas o intervalos de incertidumbre sobre ellos.

    El anlisis qumico y la estadstica

  • INTERVALO DE CONFIANZAEs el intervalo que se espera contenga el verdadero valor del parmetro poblacional.

    NIVEL DE CONFIANZAMedido por (1-) es la probabilidad de que el intervalo de confianza contenga al verdadero valor del parmetro poblacional.

    NIVEL DE SIGNIFICACIONMedido por indica el riesgo de que el intervalo de confianza no contenga el verdadero valor del parmetro poblacional.

    DEFINICIONES

  • LOS DATOS CUYA PRECISION Y EXACTITUD NO SE CONOCEN (O NO SE INFORMAN) SON INUTILES.

    LA EXACTITUD QUE ES LA CERCANIA DE UN VALOR MEDIDO AL VALOR VERDADERO, INCLUYE EL CONCEPTO DE SESGO.

    UN PROCESO DE MEDICIN DEBE SER NO SESGADO PARA PRODUCIR RESULTADOS EXACTOS.ANTES DE APLICAR EL ANLISIS ESTADISTICO A NUESTROS DATOS DEBEMOS TOMAR EN CUENTA QUE:

  • Dentro del trabajo de un laboratorio de anlisis no se puede, por lo general, llevar a cabo el estudio de la poblacin, sino nicamente de una muestra, representativa de la anterior.

    Por lo tanto, todos los parmetros estadsticos de la poblacin han de estimarse a partir de los parmetros de la muestra.

    La Estadstica permite abordar, con rigor cientfico, problemas surgidos de la variabilidad de los datos y obtener conclusiones acerca de la poblacin basndose en los datos experimentales procedentes de una muestra.El anlisis qumico y la estadstica

  • Los requisitos bsicos para aplicar mtodos estadsticos a los datos procedentes de una medida son :El sistema de medida sea estable. Las medidas individuales sean independientes unas de otras. Las medidas individuales sean aleatoriamente representativas de la poblacin.Esto significa que nuestro sistema est bajo control estadstico.Algunas definiciones...

  • Despus de llevar a cabo un anlisis de los datos el objetivo es podergeneralizar los resultados para conjuntos ms grandes de individuosas como poder sacar conclusiones a partir de los datos. La PROBABILIDAD permite calibrar el poder de nuestras conclusiones

  • Los datos que habitualmente se analizan provienen de un experimento aleatorio:ExperimentosNo aleatorios o deterministasAleatorios o estocsticosUn experimento aleatorio es aquel que bajo las mismas condiciones puede producir resultados diferentes pero con una distribucin regular de resultados para un nmero grande de repeticiones. Un experimento es determinista si bajo las mismas condiciones siempre conduce a un mismo resultado.Las variables aleatorias definen de forma numrica los resultados de un experimento aleatorio. Estas son aplicaciones que transforman los resultados de un experimento aleatorio en nmeros con el fin de poder realizar las operaciones ms usuales.

  • Antes de realizar cualquier inferencia estadstica es necesario identificar la distribucin de probabilidad de la variable aleatoria que se pretende analizar.Algunos instrumentos para ello son: Histograma, rango de la variable.Grficos de cajaPruebas de ajuste a una distribucin

  • Desviacin estndar:Recordemos que en una distribucin normal desconocemos y ( son nmeros infinitos)Esto implica que estos estimados estn sujetos a la incertidumbre, lo que tenemos en realidad es una especie de curva de distribucin confusa en la cual hay que basarse para cualquier prediccin de deseamos.A fin realizar predicciones en base a una muestra finita de una poblacin desconocida hacemos uso de la teora de Student y utilizaremos la t de Student para tal fin.

  • En inferencia estadstica uno de los instrumentos ms comunes son los intervalos de confianza para estimar el valor de un parmetro de la poblacin.

    Un intervalo de confianza del C% para un parmetro es un intervalo de valores calculado a partir de los datos de la muestra utilizando un mtodo que tiene una probabilidad C de que dicho intervalo contenga el verdadero valor del parmetro.

    La media muestral y la desviacin estndar son buenos estimadores puntuales de la media y la desviacin estndar de la poblacin. Dado que los datos son las observaciones de una variable aleatoria, estos estimadores son a la vez variables aleatorias. Por lo tanto tienen una determinada distribucin, que en el caso de la media es Normal.

  • Grficamente: para una normal tipificada, un intervalo de confianza del 95% se puede representar como:95%2.5%2.5%La probabilidad de que una variable normal tipificada tome valores en el intervalo [-1.96,1.96] es del 95%.

  • La t de Student como definicin del intervalo de confianza tiene siguiente expresin nRearreglando esta ecuacin podemos estimar el valor de

  • La distribucin de Student tiene las mismas propiedades de simetra que la normal tipificada.

  • Un qumico determin el porcentaje de hierro en un mineral y obtuvo los siguientes resultados Como trabajamos con la t de Student?Calcule el 95% de intervalo de confianza de la media sabiendo que la t = 3,1824 para un n = 4.Calcule el 99% de intervalo de confianza de la media sabiendo que la t = 5,8408 para un n = 4.

  • Resultados:15,30 0,16 con el 95% de I. 15,1415,46b) 15,30 0,29 con el 99% de I.C 15,0115,59Analicemos Porqu la t de student es menor para el intervalo de confianza de 95%Tiene esto alguna influencia en el resultado?Es razonable ya que con tan pocos datos a medida que aumenta el intervalo de confianza de la respuesta la incertidumbre que conlleva tiene que ser mayor.

  • ConclusinMientras ms pequea sea la muestra poblacional mayor ser la t de StudentA medida que aumenta el intervalo de confianza requerido con un muestreo pequeo mayor ser el nivel de confianza

  • Problema En un establecimiento dedicado a la elaboracin de alimentos balanceados para aves, se afirma que su producto aumenta el peso promedio de las aves en 30g diarios. En una muestra de 9 aves tomadas al azar, se obtuvo un aumento promedio de 35g con desviacin de 3,04 g. Estimar el intervalo de confianza del 95% para el verdadero aumento promedio

  • Problema,Se sembr cierta variedad de trigo en parcela de cierta localidad, se extrajo una muestra al azar de 20 parcelas y se midi el rendimiento. Se obtuvo un rendimiento de 58 kilogramos por parcela y una desviacin tpica de 8 kg por parcela. Estimar la varianza poblacional con un nivel de confianza del 95%, sabiendo que el rendimiento se distribuye normalmente

  • Un segundo bloque de instrumentos para la inferencia estadstica son las pruebas de hiptesis: Evalan la evidencia de una afirmacin sobre la poblacin.

    En estadstica una afirmacin sobre la poblacin se plantea en forma de hiptesis de trabajo. Las dos hiptesis complementarias se llaman:Hiptesis nula (H0)Hiptesis alternativa o de investigacin (H1)Las hiptesis hacen siempre referencia a los parmetros de la poblacin.PRUEBA DE SIGNIFICANCIA.Pruebas de Hiptesis

  • Error tipo II: Aceptar la hiptesis nula cuando es falsa.Estadstica de prueba: Un valor que se calcula con base en la informacin de la muestra y que se utiliza para determinar si se rechaza la hiptesis nula. Ej. La t de student calculadaValor crtico: Punto de divisin entre la regin en que se rechaza la hiptesis nula y la regin en la que no se rechaza. Ej. La t de student critica o tabuladaHiptesis Nula H0: Suposicin acerca de un parmetro de la poblacin.Hiptesis Alternativa H1 : una afirmacin que se acepta si los datos de la muestra proporcionan evidencia acerca de que la hiptesis nula es falsaNivel de Significancia: Probabilidad de rechazar la hiptesis nula cuando es verdaderaError de tipo I: Rechazar la hipteis nula cuando es verdadera.

  • Qu es una prueba de hiptesis?Prueba de hiptesis: Es un procedimientobasado en la evidencia de la muestra y en la teora de probabilidad para determinar si lahiptesis es un enunciado razonable por elcontrario debe ser rechazado

  • Que es una Hiptesis?Hiptesis: Es una suposicin acerca de un parmetro de la poblacin, que se desarrolla con el objeto de probar algo Ejemplo :El ingreso medio de un Ingeniero Agrnomo es de $3625.20% de las parcela de soya de esa regin estn afectadas por Roya.

  • COMO SE APLICA ?Establecimiento de hiptesis nula y alternativa.Seleccin de un nivel de significacin.Identificacin de la Estadstica de prueba.Formulacin de una regla de decisinTomar una muestra para llegar a una decisinDecisin: Rechazar o no rechazar

  • La prueba de hiptesis es un procedimiento que especifica:Para qu valores muestrales la decisin ser no rechazar la hiptesis nula.Para qu valores muestrales la hiptesis nula ser rechazada a favor de la alternativa.P-valor: probabilidad que, bajo H0 el estadstico de contraste tome un valor al menos tan alejado como el realmente obtenido. Cuanto ms pequeo sea el p-valor mayor es la evidencia en contra de H0.

  • En un contraste de hiptesis, debemos aceptar o rechazar una de las dos hiptesis planteadas.Deseamos que nuestra decisin sea correcta, pero a veces no lo ser. Hay dos tipos de decisiones incorrectas:

    Rechazar H0 cuando de hecho es cierta: error de tipo IAceptar H0 cuando realmente es cierta H1: error de tipo IIObservacin: el error tipo I = nivel de significacin =

  • PROCEDIMIENTO PARA APLICAR LA PRUEBA DE SIGNIFICANCIA CON LA t DE STUDENT.El enfoque estadstico es establecer una hiptesis nula o alternativaPor ejemplo: suponer que dos medidas son idnticas Luego aplicamos la prueba t para saber si la hiptesis nula es valida o no, con una cierta exactitud:1. Calcular un valor de t utilizando la siguiente frmula.

  • Para utilizar esta ecuacin OBLIGATORIAMENTE debemos suponer que las 1 y 2 son iguales ( toda suposicin involucra una incertidumbre nueva que se introduce.) 2. Obtener el valor de t de una tabla establecida, en un grado de libertad dado por (n1 + n2 2) y a un nivel de probabilidad deseado.

  • Anlisis:La hiptesis nula esta comprobada cuando:ttab > tcalEn este ejemplo la prueba de hiptesis consiste en poder determinar si existe una diferencia significativa entre dos valores obtenidos para una muestra por dos mtodos distintos.

  • Si la ttabla < tcalLa hiptesis nula es incorrecta y se tienen que estudiar cual es la razn que explique por que las medias de ambos anlisis son diferentes entre si.Para saber si podemos SUPONER que las desviaciones estndar son iguales debemos determinar la relacin de varianza, tambin llamada la prueba F Cuando las desviaciones estndar son diferentes el procedimiento es diferente y se aplica una ecuacin ms compleja para la determinacin de t.

  • Prueba FSiempre F tienen que ser > 1 por ende la varianza ms grande es colocada como numerador.1. Calcular la relacin de las varianzas2. Buscar valores de F tabulada y comparar.siFtab< FcalcExiste una diferencia significativa entre las varianzas y por ende entre las desviaciones estndares.

  • 1. Prueba F 2. Si Ftab > Fcalc3. Aplicar Prueba t de significancia con ecuacin sencilla4. Si ttab > tcal5. La prueba de hiptesis nula es correcta.Es decir las medias comparadas son iguales con una cierta probabilidad

  • Ejemplo:Una muestra de carbonato de sodio se analiz mediante dos mtodos diferentes, dando los siguientes resultados para el porcentaje de analito Es significativa la diferencia entre las desviaciones? Es significativa la diferencia entre las dos medias a un nivel de probabilidad del 95%Determinar si el anlisis es de una cola o dos colasAplicar prueba F para determinar que ecuacin de t a utilizarDeterminar la t calculada y compararla con el valor crtico correspondienteDeterminar si la hipotesis nula es aceptada o rechazadaConcluir a partir de los resultados anteriores.

  • Respuesta:2 > 1 buscamos en la columna n-1 para grande y en la fila n-1 pequea La diferencia entre las desviaciones estndar de los dos mtodos no es significativa y se puede aplicar la prueba t con la ecuacin sencillaComo ttab > tcal entonces la hiptesis nula es correcta y la diferencia no es significativamosca!!!! el hecho que las sean iguales, no implica que las medias lo sean.

  • Cuando las desviaciones son diferentesSi la prueba F determina que hay diferencia significativa en las desviaciones, entonces debemos utilizar la siguiente ecuacin para calcular el estadstico t:Y para calcular los grados de libertad de t debemos emplear:Este valor se redondea a un nmero entero

  • Concentracin de tiol (mM) en el lisado sanguineo de dos grupos de voluntarios, siendo el primer grupo normal y el segundo grupo Artritico reumatoideo (A.R). Determine si la concentracin de tiol es un anlisis vlido para diferenciar a un paciente A.R, con un nivel de significancia del 0,01Normal 1,841,92,1,92,1,92,1,85,1,91,2,07A.R.2,81,4,06,3,62,3,27,3,27,3,76Compruebe que: n1= 7; n2= 6x1= 3,465x2= 1,9211= 0,076 2= 0,440tcalc = 8,48Grados de libertad = 5,3 ~ 5t5tab= 4,0321 (P ()= 0,01)Con 0,01 nivel de significancia se rechaza la hiptesis nula. Es decir, existe suficiente evidencia al 99% de nivel de confianza que las medias son diferentes y por ende el anlisis ser valido para diferenciar a los pacientes con A.R

  • En estadstica una hiptesis es una aseveracin o afirmacin acerca de una propiedad de una poblacin.La prueba de hiptesis es un procedimiento para probar una aseveracin acerca de una propiedad de una poblacin Es importante tener en cuenta que si se acepta una hiptesis nula no quiere decir que se ha comprobado que es verdadera, solo implica que no se ha demostrado que sea falsa. Propiedades de la hiptesis nula.

  • CRITERIO PARA DESCARTAR UNA OBSERVACINComo decidir con fundamento estadstico si un resultado es descartable o no?

  • Si elegimos una diferencia muy pequea, tendremos errores tipo I o de primera clase. Esto implica que estaremos rechazando datos que son validos. Ej. Que rechacemos una hiptesis nula cuando debera de ser aceptadaSi por el contrario elegimos una diferencia muy grande, tendremos errores tipo II o de segunda clase. Esto implica que estaremos tomando en cuenta datos que son altamente errneos. Ej. Que aceptemos una hiptesis nula cuando debera de ser rechazada1.1. Debemos definir que tan grande debe ser la diferencia entre el valor sospechoso y los otros datos.

  • Hiptesis, errores y Decisiones

    Errores tipo I y tipo IIEstado verdadero de la naturalezaDECISON ESLa hiptesis nula es vlidaLa hiptesis nula no es vlidaDecidimos rechazar la hiptesis nulaError tipo IDecisin correctaNo rechazamos la hiptesis nulaDecisin CorrectaError tipo II

  • La Prueba Q ( Contraste de Dixon)Calcular el intervalo de los resultadosEncontrar la diferencia entre el resultado sospechosos y su vecino ms cercano.Dividir la diferencia obtenida en el paso 2 entre el intervalo del paso 1 para obtener el coeficiente de descarte Q.Consultar una tabla de valores Q. Si el Qcalc > Qtab el dato se puede descartar con un 90% de confianza que en realidad estuvo sujeto a algn factor que no actu sobre las otras mediciones.Cuando las muestras son muy pequeas la prueba Q puede generar errores tipo II. Sin embargo, es estadsticamente correcta y provee una excelente justificacin para descartar valores muy errneos.

  • Ejemplo:Cuatro resultados obtenidos para determinar la molaridad de una solucin fueron 0,1014, 0,1012, 0,1019 y 0,1016. Aplique la prueba Q para determinar si el resultado 0,1019 puede ser descartado.Resultados0,10140,10120,1016= 0,1014Desviaciones (ppm)0,02,02,0= 1,3

  • intervaloDiferencia con vecino ms cercanoQ = 0,43Es Qcalc> Qtab?: NO Por ende el dato no se descarta

  • Se obtuvieron los siguientes valores para la concentracin de nitrito (mg l-1) en una muestra de agua de rio:

    0.403, 0.410, 0.401, 0.380

    La ltima medida es sospechosa. debera ser rechazada?b)Si se aaden tres nuevas medidas a las dadas :

    0.400, 0.413 y 0.411, Se debera an mantener 0.380?

    Aplicar el contraste de Dixon y el contraste de Grubbs para resolver el problema.

  • Contraste de Grubbs Compara la desviacin entre el valor sospechoso y la media muestral, con la desviacin estndar de la muestra. Este contraste lo recomienda ISO preferentemente al de la prueba Q o de Dixon Para usar el contraste de Grubbs para un valor anmalo, es decir, para probar que H0: todas las medidas proceden de una misma poblacin, se calcula el estadstico G:Donde la se calcula incluyendo el valor sospechoso. El contraste supone una poblacin normalGcalc>Gtab se rechaza la hiptesis nula y por ende el valor

  • 1. Calcular la media y la desviacin promedio de los resultados buenos.2. Encontrar la desviacin del resultado sospechoso a partir de la media de los resultados buenos.3. Si la desviacin del resultado sospechoso es por lo menos 2.5 veces la desviacin promedio de los resultados buenos se descarta el resultado sospechoso. De lo contrario se conserva.La regla 2.5dMosca desviacin promedioEsta regla se puede aplicar con confianza cuando la muestra es grande de lo contrario genera errores tipo I

  • Utilizando los datos del ejemplo anterior determinar si el resultado 0,1019 es descartable aplicado la prueba 2,5dQu hacer?Por cual prueba nos decidimos?

  • Determinacin del tamao de la muestra(xo 0)/ (/n) = tConociendo la desviacin aceptada y t (tabuladas) a diferentes niveles de significancia podemos calcular x0 y el tamao de la muestra, siempre y cuando se conozca el nivel de calidad aceptada y el nivel de calidad de tolerancia 0 y 1

  • PROPAGACIN DE ERRORES

    **************************************************