Download - Diapositivas Clase Estadística
3 h/ Semanales. 3 Créditos
ESTADÍSTICA APLICADA AL
ANÁLISIS QUÍMICO
Cesar Alberto Arizabaleta Ibarbo
Universidad del Valle – Sede Yumbo
Febrero / Junio (2014)
2
ESTADISTICA EN QUIMICA ANALITICA
RESULTADOS CUANTITATIVOS Deben ser válidos
(estimación de errores)
•Precisos
•Exactos
ADQUISICION
DE DATOS
DISEÑO
EXPERIMENTAL ANALISIS
MANIPULACION
DE DATOS
DURANTE
DESPUES ANTES
3
CALIDAD CONFIABILIDAD
RESULTADO CONFIABLE
RESULTADO VALIDO
VALIDEZ: GRADO AL CUAL UNA
MEDICION (REALIZADA
MEDIANTE UN INSTRUMENTO
Y/O PROCEDIMIENTO
ANALITICO ESPECIFICOS)
PRODUCE EL RESULTADO
ESPERADO
4
CLASES DE ERRORES
Errores crasos
* Muy graves, abandonar el experimento
Errores aleatorios o indeterminados
* Producen una dispersión de los resultados individuales
a ambos lados de un valor medio
Errores sistemáticos o determinados
* Concordancia o proximidad al valor real, todos los
resultados son erróneos en el mismo sentido
(SESGO)
5
6
7
ERRORES ALEATORIOS
•Se relacionan con la precisión
•NUNCA se pueden eliminar
Reproducibilidad: Concordancia de los valores cuando
las mediciones individuales se realizan
en condiciones no repetitivas
•Ocasiones diferentes
•Soluciones diferentes
•Variabilidad ambiental
•Material de vidrio diferente
Repetibilidad: Concordancia de los valores cuando las
mediciones individuales se realizan en
condiciones repetitivas
8
ERRORES SISTEMÁTICOS
Se pueden eliminar con controles adecuados de la técnica
y el equipo
EXISTE ERROR SISTEMÁTICO?
Se debe de conocer el valor
verdadero
POCO PROBABLE
Fácil de cometer
errores sistemáticos
9
CAUSAS DE ERRORES SISTEMÁTICOS
1. Contaminación por el material usado y reactivos
utilizados
2. Lavado incompleto en análisis gravimétrico
3. Error del indicador en análisis volumétrico
4. Descalibración de equipos instrumentales (pH-
metros, termómetros, cronómetros, monocromadores
descalibrados, ect.
10
Los errores sistemáticos se pueden eliminar o minimizar
usando materiales de referencia y métodos estándar
Se puede evidenciar un error sistemático
analizando el analito por dos métodos no
relacionados
ERRORES SISTEMÁTICOS
SOLO ERRORES ALEATORIOS
11
ESTADÍSTICA
Herramienta utilizada para discriminar entre las partes
sistemática (determinada) y al azar (indeterminada) de
una señal
error = D + d Total Sistemática Al azar
Objetivo de una
medición
PARA SEPARAR LA PARTE SISTEMATICA DE UNA SEÑAL
ESPECIFICA, EL ANALISTA DEBERA TENER UN
CONOCIMIENTO PREVIO DE LAS POSIBLES FUENTES DE
ESA PARTE SISTEMATICA
LA ESTADISTICA ES UN COMPLEMENTO QUE LE AYUDA INDIRECTAMENTE EN DICHA SEPARACION
OBJETIVO DE UNA MEDICION:
DETERMINAR LA MAGNITUD DE LA PARTE
SISTEMATICA DE LA SEÑAL
12
SU PRESENCIA PUEDE SER DETECTADA MEDIANTE
PRUEBAS ESTADISTICAS SENCILLAS. DICHAS PRUEBAS,
SIN EMBARGO, NO PERMITEN IDENTIFICAR EL ORIGEN
DEL ERROR SISTEMATICO
LA MANERA MAS SIMPLE DE DETERMINAR LA PRESENCIA
DE ERROR SISTEMATICO ES CUANTIFICAR EL ANALITO EN
UN MATERIAL DE REFERENCIA (ESTANDAR)*
ERROR SISTEMATICO
13
* MATERIAL DE REFERENCIA:
CONTIENE UNO O MAS ANALITOS EN CONCENTRACION CONOCIDA CON
ALTAS EXACTITUD Y PRECISION
PUEDEN OBTENERSE EN
National Institute of Standards and Technology (NIST)
American Society for Testing and Materials (ASTM)
Química
Analítica
Análisis
Clásico
Volumetría
Gravimetría
Análisis
Instrum.
Óptica
Electroquímica
Separaciones
RMN
Química
Analítica
Análisis
Clásico
Estadística
Volumetría
Gravimetría
Análisis
Instrum.
Óptica
Electroquímica
Separaciones
RMN
¿Cuánto ANALITO hay en la MUESTRA?
Objeto de análisis
-pelo humano
-multivitamínico
-piel de rana
-agua residual
-fósil
-suelo marciano
-salmonella
- …
¿Cuánto ANALITO hay en la MUESTRA?
Objeto de análisis
-pelo humano
-multivitamínico
-piel de rana
-agua residual
-fósil
-suelo marciano
-salmonella
- …
Substancia que se desea cuantificar
-vitamina B1
-Pb
-TNT
-pesticida organofosforado
-sacarosa
-clorhidrato de cocaína
-colesterol
-…
¿Cuánto ANALITO hay en la MUESTRA?
Objeto de análisis
-pelo humano
-multivitamínico
-piel de rana
-agua residual
-fósil
-suelo marciano
-salmonella
- …
Substancia que se desea cuantificar
-vitamina B1
-Pb
-TNT
-pesticida organofosforado
-sacarosa
-clorhidrato de cocaína
-colesterol
-… CONCENTRACIÓN
MÉTODO ANALÍTICO
Muestreo
Almacenamiento Tratamiento
Medida
(propiedad fís.) Cálculo []p
Resultado
Muestreo
Recolección de la muestra a partir de un LOTE
(todo o unidades)
Debe garantizarse que dicha muestra sea
representativa
Almacenamiento
Utilización de recipientes y condiciones adecuados
para disponer la muestra recolectada
Debe evitarse que el analito sufra
dilución o concentración
Tratamiento
Se prepara la muestra para la determinación del (los)
analito (s). Para ello puede requerirse:
*Homogenización
*Medida exacta de VARIAS ALÍCUOTAS (mL, g)
*Disolución (digestión)
*Eliminación de interferencias
*Derivatización
*Preconcentración
Medida
(propiedad fís.)
Medición de la propiedad física que conserva
proporcionalidad con el analito:
* Volumétrica (mL)
* Gravimétrica (g)
* Óptica (mUA, η)
* Electroquímica (A, V, C, Ώ)
Cálculo []p
Utilización de soluciones estándar (patrones)
para obtener la concentración del analito en
La muestra tratada. Se utilizan procesos de:
* Estandarización
* Calibración
Resultado
Teniendo en cuenta la concentración parcial
obtenida y la secuencia del tratamiento, se
calcula la concentración del analito en la muestra
a partir de un DESARROLLO DIMENSIONAL.
Este valor de concentración debe ser reportado
con su respectiva incertidumbre
26
POBLACION Y MUESTRA
• POBLACIÓN
Colección completa de objetos que comparten una o
más características
Número infinito de resultados que, se puede obtener
con una infinita cantidad de muestra y en una infinita
cantidad de tiempo
• MUESTRA
Un subconjunto de una población
27
Leyes de la estadística
sólo para poblaciones
Leyes de la estadística
para muestras
La muestra debe ser representativa
de la población
ESTRICTAMENTE, LAS LEYES DE LA ESTADISTICA SE
APLICAN SOLO A POBLACIONES. CUANDO ESTAS LEYES
SE APLICAN A MUESTRAS DE DATOS DE LABORATORIO,
SE ASUME QUE LA MUESTRA ES REPRESENTATIVA DE LA
POBLACION
LA ESTADISTICA TIENE SUS BASES EN LA TEORIA DE
PROBABILIDADES (UNA TEORIA UTILIZADA PARA
EXPLICAR EVENTOS AL AZAR)
LA ESTADISTICA NO MANEJA “ABSOLUTOS”: SOLO PUEDE
DECIR SI UN EVENTO ES ESTADISTICAMENTE SIGNIFICATIVO O
ESTADISTICAMENTE INSIGNIFICANTE
PUNTOS IMPORTANTES
EN ESTADISTICA
28
29
MEDIA
POBLACIÓN:
MUESTRA:
n = NÚMERO DE MEDICIONES
xi = i-ÉSIMA MEDICIÓN DE x
n
xn
i
n
i
1
lim
n
x
x
n
i
i 1
30
31
DESVIACIÓN ESTÁNDAR
POBLACIÓN:
MUESTRA:
sn-1 en calculadora
n
xn
i
i
n
1
2)(
lim
s
1
)(1
2
n
xx
s
n
i
i
32
33
DESVIACIÓN ESTANDAR RELATIVA (RSD)
o
[COEFICIENTE DE VARIACIÓN (CV)]
x
sRSD
100% x
sRSD
VARIANZA
S2
ss
100% x
sRSD
34
GRADOS DE LIBERTAD Número de valores no restringidos
Ejemplo: • ESCOJA UN TOTAL DE 5 VALORES AL AZAR:
3 5 17 2 10
5 GRADOS DE LIBERTAD
• ESCOJA UN TOTAL DE 5 VALORES CON UN PROMEDIO DE 8:
3 5 17 2 13
4 GRADOS DE LIBERTAD
Para obtener un promedio de 8 después de escojer
los primeros 4 valores, el 13 y solamente el 13
puede ser el 5o valor
35
GRADOS DE LIBERTAD
• ESCOJA UN TOTAL DE 5 VALORES CON UN PROMEDIO DE 8 Y UNA DESVIACION ESTANDAR DE 6:
3 5 17 3.725 11.275
3 GRADOS DE LIBERTAD
Para obtener un promedio de 8 y una desviación estándar de
6, solamente los numeros 3.725 y 11.275 pueden ser el 4oy
el 5o valores, despues de escojer los primeros 3 numeros
EN GENERAL:
GL= n - m
Grados de libertad Número de
datos
Parámetros
estadísticos
calculados
36
Desviación
estándar
Medida de la dispersión de
una serie de medidas
respecto a un valor medio
Tablas de
frecuencias e
histogramas
Indica la forma de la
distribución alrededor de
un valor medio
Muestra de
gran tamaño
1. La media de la muestra es una
estimación de
2. La desviación estándar de la muestra es
una estimación de s
37
DISTRIBUCIÓN DE MEDIDAS REPETIDAS
En un laboratorio de control de calidad se
obtuvieron en los últimos 70 análisis datos del nivel
de tensoactivo en un Shampoo (%). Construya un
histograma.
10 17 9 17 18 20 16
7 17 19 13 15 14 13
12 13 15 14 13 10 14
11 15 14 11 15 15 16
9 18 15 12 14 13 14
13 14 16 15 16 15 15
14 15 15 16 13 12 16
10 16 14 13 16 14 15
6 15 13 16 15 16 16
12 14 16 15 16 13 15
38
TABLA DE FRECUENCIAS
% Ten. Frecuencia
6 1
7 1
9 2
10 3
11 2
12 4
13 10
14 11
15 16
16 13
17 3
18 2
19 1
20 1 0
2
4
6
8
10
12
14
16
6 7 8 9
10
11
12
13
14
15
16
17
18
19
20
% Tensoactivo
Fre
cu
en
cia
HISTOGRAMA
La distribución de las mediciones
es cercanamente simétrica con
respecto a la media
Al aumentar el número de datos la simetría se hace más aparente
39
LA DISTRIBUCION NORMAL (GAUSSIANA)
ss 2]2exp[ 22 xy
Distribuciones normales con la misma
media pero diferentes valores de la
desviación estándar
40
PROPIEDADES DE LA DISTRIBUCIÓN
NORMAL
Distribución normal
estandarizada
Z=(Xi-)/s
41
F(z), función de distribución acumulativa normal
estándar
42
EJEMPLO
Si las medidas repetidas de una valoración se distribuyen
de forma normal con media de 10.15 mL y desviación
estándar de 0.02 mL, encontrar la proporción de medidas
que caen entre 10.12 y 10.20 mL.
*Para 10.12 z= (10.12 – 10.15)/0.02= -1.5
F(-1.5)= 0.0668
*Para 10.20 z= (10.20 – 10.15)/0.02= 2.5
F(2.5)= 0.9938
Proporción de medidas 0.9938 – 0.0668 = 0.927
43
EJERCICIOS
1- El valor medio del peso de una marca de jabón
durante el año pasado fue de 0,297 kg, su
desviación estándar fue 0,024 kg. Calcule el
porcentaje de datos que está comprendido
debajo del límite de especificación de 0,274 kg.
2- Con los datos anteriores, calcule el porcentaje
de datos comprendidos arriba de 0,347 kg.
3- Se desea que el 12.1 % del voltaje de línea esté por
debajo de los 115 V, ¿cómo habrá que ajustar el
voltaje medio? La dispersión es de s=1.20 V.
44
DISTRIBUCIONES LOG-NORMAL
Distribución diferente a la normal al representar la
frecuencia frente a la concentración (u otra característica),
pero su frecuencia representada frente al logaritmo de la
concentración (u otra característica) proporciona una curva
de distribución normal.
Concentración del anticuerpo inmunoglobulina M en suero de individuos machos
45
DISTRIBUCIÓN MUESTRAL DE LA MEDIA
• La media de una serie de medidas proporciona una
estimación del valor verdadero, , (en ausencia de errores
sistemáticos ).
• Aun sin errores sistemáticos, las medidas individuales
varían por errores aleatorios y es poco probable que su
media corresponda en forma exacta al valor verdadero.
• Es más útil proporcionar un intervalo de valores donde
sea probable que se encuentre el valor verdadero.
El intervalo depende de:
•Precisión de las medidas individuales (s)
•Número de medidas de la muestra
46
DISTRIBUCIÓN MUESTRAL DE LA MEDIA
0,51 0,51 0,51 0,50 0,51 0,49 0,52 0,53 0,50 0,47
0,51 0,52 0,53 0,48 0,49 0,50 0,52 0,49 0,49 0,50
0,49 0,48 0,46 0,49 0,49 0,48 0,49 0,49 0,51 0,47
0,51 0,51 0,51 0,48 0,50 0,47 0,50 0,51 0,49 0,48
0,51 0,50 0,50 0,53 0,52 0,52 0,50 0,50 0,51 0,51
0,506 0,504 0,502 0,496 0,502 0,492 0,506 0,504 0,500 0,486
Medias de cinco valores con menor
dispersión respecto a todos los 50
datos originales
Su desviación estándar es el error
estándar de la media e.e.m.
e.e.m.= s/n
47
TEOREMA DEL LIMITE CENTRAL
Aun si la población original no es normalmente
distribuida, la distribución de las medias tiende a ser
más normalmente distribuida a medida que n aumenta
CONFIABILIDAD DE UN RESULTADO ANALÍTICO
Resultado analítico = x ± Intervalo de confianza
INTERVALO DE CONFIANZA: Rango dentro del cual se puede asumir razonablemente que
se encuentra el valor real a determinada probabilidad.
LÍMITES DE CONFIAZA Son los valores extremos de ese rango
48
DISTRIBUCIÓN MUESTRAL DE LA MEDIA
Intervalo donde se encuentra el
95% de las medias muestrales
49
En la práctica se dispone habitualmente de una muestra,
de media conocida, y se busca un intervalo para , el
valor verdadero
Si la muestra es grande, s se puede sustituir por s
50
LIMITES DE CONFIANZA
Para muestras grandes:
1.96 (95%)
z =
2.58 (99%)
* Si se conoce s se sustituye por s
Para muestras pequeñas:
t= f(GL, P)
GL: grados de libertad
P: probabilidad de que este
dentro del rango establecido
51
Ejercicio:
Se determinó la concentración de plomo en la sangre
de 50 niños de una escuela cerca de una carretera con
mucho tráfico. La media fue de 10.1 ng/mL y la
desviación estándar fue de 0.6 ng/mL.
a) Calcular el intervalo de confianza de la
concentración media de plomo en todos los niños de la
escuela a un nivel de confianza del 95 %.
b) ¿Cuál debería ser el tamaño de la muestra para
reducir el rango de confianza a 0.2 ng/mL (es decir,
±0.1 ng/mL)?
52
Los límites de confianza se pueden utilizar como
una prueba para detectar errores sistemáticos
Ejemplo:
Se utilizó una solución de 0.1 M de ácido para valorar
10 mL de una solución de NaOH de 0.1 M dando los
siguientes volúmenes de ácido:
9.88, 10.187, 10.23, 10.39, 10.25 mL
Calcular los límites de confianza de la media al 95 % y
utilícelos para decir si existe alguna evidencia de error
sistemático.
53
Límites de confianza de la media geométrica
de una distribución log-normal
Ejemplo:
El diámetro de las gotas en un aerosol presenta un
comportamiento log-normal. Los diámetros de 10 gotas de
un líquido presentan los siguientes valores en micrómetros:
3.43 2.56 1.34 1.13 3.56
2.01 2.23 2.78 1.12 1.65
Calcular el intervalo de confianza de la media geométrica al
95% suponiendo que los diámetros de las gotas se
distribuyen log-normal.
54
PROPAGACION DEL ERROR ALEATORIO
• Los errores aleatorios se compensan entre sí
• Cada paso de un procedimiento puede tener una
incertidumbre en su medida (error aleatorio)
• Al combinar las diferentes mediciones (sumas,
restas, multiplicaciones, etc.) para calcular una
cantidad final, el error aleatorio se propaga y
genera una desviación estándar final
x= a + b Si, (a ± 1) y (b ± 1) el error
aleatorio de x NO es ± 2
55
PROPAGACIÓN DEL ERROR ALEATORIO
Suma o resta:
p, q y r son variables
experimentales
sp,sq y sr sus
desviaciones estándar
Ejemplo:
Calcular el peso promedio y su desviación estándar de
los siguientes valores: 1.56, 1.68, 2.36 g, cada uno de
los pesos con una desviación estándar de 0.03.
56
PROPAGACIÓN DEL ERROR ALEATORIO
Multiplicación o división:
Desviación
estándar relativa
Ejemplo:
La carga eléctrica se calcula a partir de la expresión
Q=I.t, donde I es la corriente en amperios y t el tiempo
en segundos. Calcular la desviación estándar relativa de
la carga si las desviación estándar relativa de la
corriente es 3% y la del tiempo es 1.5%.
57
PROPAGACIÓN DEL ERROR ALEATORIO
Elevar a una potencia:
Desviación estándar relativa
Ejemplo:
El producto de solubilidad del sulfato de bario es 1.3 x 10-10,
con una desviación estándar de 0.1 x 10-10. Calcular la
desviación estándar de la solubilidad calculada del sulfato de
bario en agua.
58
PROPAGACIÓN DEL ERROR ALEATORIO
Logaritmo:
Ejemplo:
La ecuación de Nernst describe la relación entre el potencial y la
concentración del analito i expresada como su actividad ai :
Para n = 1, ¿cuál es el error relativo en E para una
incertidumbre en ai de 0.05 ?
E = Eº - (0.0592/n).log ai
59
PROPAGACIÓN DE ERRORES SISTEMÁTICOS
• El error sistemático tiene lugar en un sentido definido
y conocido.
Suma o resta:
Dx = Dp + Dq + Dr +…….
• Los errores sistemáticos pueden ser tanto positivos
como negativos y estos signos se deben de incluir en
el calculo de Dx
Multiplicación o división:
Dx/x = (Dp/p) + (Dq/q) + (Dr/r) +….
60
PRUEBAS O CONTRASTES DE SIGNIFICACIÓN
• Un procedimiento sistemático que nos permite decidir si
un conjunto de mediciones repetidas muestra evidencia
de error sistemático
• Prueba si son significativas las diferencias entre dos
resultados (cantidad medida o resultado y la cantidad
conocida o real), o se pueden justificar sólo por
variaciones aleatorias
• El proposito de una prueba de significación es sacar una
conclusión acerca de una población utilizando datos
provenientes de una muestra
• Se comprueba la veracidad de una hipótesis (hipótesis
nula), la cual plantea que un método NO se encuentra
sujeto a errores sistemáticos
61
PRUEBAS O CONTRASTES DE SIGNIFICACIÓN
• La estadística calcula la probabilidad o posibilidad de
que la diferencia observada entre la media muestral,
. ,y el valor verdadero, , se debe solamente a un
error aleatorio. x
A menor
probabilidad que
( -) ocurra por
azar
Menor probabilidad
que la hipótesis nula
sea verdadera x
62
PRUEBAS O CONTRASTES DE SIGNIFICACIÓN
Ejemplo:
En un método para determinar plomo en sangre por absorción
atómica se obtuvierón los siguientes valores para una
muestra estándar que contiene 38.9 ppb de plomo:
38.9 37.4 37.1
¿existe alguna evidencia de error sistemático?
la pregunta es si la diferencia entre el resultado y el valor real
es estadísticamente significativa, o si se debe a meras
variaciones fortuitas (al azar)
80.37x 964.0s
63
64
SOLUCIÓN DEL EJEMPLO:
PASO 1
Se plantea la hipótesis nula, Ho, de que no hay error
sistemático. Uno no sabe si esta declaración es cierta
o es falsa, pero será asumida cierta hasta que se
pruebe que es falsa
PASO 2
Prueba estadística que condensa la información de la
muestra en un simple número.
s
nxtcalc
98.1
964.0
39.388.37
calct
65
PASO 3
Comparación con valores críticos tabulados
tcrit = 4.3 (P = 95%, f = 2)
Si tcalc excede el valor crítico, la hipótesis nula se
rechaza
Los valores críticos pueden intepretarse como
valores que son improbables* que sean
excedidos por la prueba estadística (tcalc) si la
hipótesis nula es cierta
* A UN 95% DE CONFIANZA, LA PROBABILIDAD ES MENOR
DE 5% (ES DECIR, MENOS QUE 1 EN 20)
66
PASO 4
Decisión: se retiene la hipótesis nula
No hay evidencia de error sistemático
tcalc < tcrit
1.98 < 4.3
No significa que no hay error sistemático, sino
que no se ha podido probar su existencia
NOTA IMPORTANTISIMA
LA DECISION DE RETENER LA HIPOTESIS NULA NO
SIGNIFICA QUE SE HA DEMOSTRADO QUE ES CIERTA;
SIMPLEMENTE NO SE PUDO DEMOSTRAR QUE SEA
FALSA
67
LA HIPOTESIS NULA SE USA
EN LAS CORTES CRIMINALES
EL ACUSADO SE ASUME “NO CULPABLE” HASTA QUE
SE DEMUESTRE QUE ES CULPABLE
VEREDICTO “NO CULPABLE” EN CORTE CRIMINAL
LA EVIDENCIA (PRUEBAS DE SIGNIFICACION) INDICA QUE LA
HIPOTESIS NULA DEBE CONSERVARSE
CONCLUSION:
• NO SE HA DEMOSTRADO QUE EL ACUSADO ES INOCENTE...
• LO QUE SE HA DEMOSTRADO ES QUE EL ACUSADO ES NO
CULPABLE
68
COMPARACIÓN DE LAS MEDIAS DE DOS
MUESTRAS
Es una forma en la cual los resultados de un muevo
método analítico pueden comprobarse por
comparación de los resultados obtenidos utilizando un
segundo método (de referencia)
*Se debe conocer Método 1 Método 2
s1 s2
n1 n2
1
___
X 2
___
X
69
COMPARACIÓN DE LAS MEDIAS DE DOS
MUESTRAS (cont.)
CASO I
Si s1 y s2 NO son significativamente diferentes:
Hipótesis nula: Los dos métodos producen el mismo
resultado
21
21
calc
n
1
n
1s
xxt
Prueba estadística
Estimación conjunta de
la desviación estándar
21
2
22
2
112
ff
sfsfs
f1 grados de libertad método 1
f2 grados de libertad método 2
tcalc tiene (n1+n2-2) grados de libertad
70
COMPARACIÓN DE LAS MEDIAS DE DOS
MUESTRAS (cont.)
Ejemplo:
Se compararon dos métodos para la determinación de boro en
material vegetal
Método espectrofotométrico
(1)
Método fluorimétrico (2)
S1= 0.3 S2= 0.23
n1= 10 n2= 10
28.0X1 26.25X2
¿Estos dos métodos dan resultados cuyas medidas difieren
significativamente a un nivel de confianza del 95 %?
71
COMPARACIÓN DE LAS MEDIAS DE DOS
MUESTRAS (cont.)
Ejemplo:
Se compararon dos métodos para la determinación de cromo
en muestras de hierba de centeno:
Método (1) Método (2)
S1= 0.28 S2= 0.31
n1= 5 n2= 5
1.48mg/KgX 2.33mg/KgX
• ¿Estos dos métodos dan resultados cuyas medidas difieren
significativamente a un nivel de confianza del 95 %?
• Si la hipótesis nula fuera verdadera ¿la probabilidad de que
la diferencia de las medias se deba al azar será menor de 1
en 100?
72
COMPARACIÓN DE LAS MEDIAS DE DOS
MUESTRAS (cont.)
CASO II
Si s1 y s2 son significativamente diferentes:
Hipótesis nula: Los dos métodos producen el mismo
resultado
Prueba estadística
2
2
2
1
2
1
21
calc
n
s
n
s
xxt
2
1n
n
s
1n
n
s
n
s
n
s
f
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
Grados de libertad
Se redondea al entero más cercano
73
COMPARACIÓN DE LAS MEDIAS DE DOS
MUESTRAS (cont.)
Ejemplo:
La siguiente tabla proporciona la concentración de tiol en sangre de
dos grupos de voluntarios, el primer grupo es “normal” y el segundo
sufre de artritis reumatoide:
Normal Reumatoide
1.84 2.81
1.92 4.06
1.94 3.62
1.92 3.27
1.85 3.27
1.91 3.76
2.07
Concentracion de tiol (mM)
¿Son los resultados de estas dos
muestras significativamente
diferentes a una P=0.005?
74
Qué prueba t utilizar?
s1 = s2?
SI
NO
21 fff
2
2
2
1
2
1
21
n
s
n
s
xxtcalc
2
11 2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
n
n
s
n
n
s
n
s
n
s
f
21
21
11
nns
xxtcalc
21
2
22
2
112
ff
sfsfs
CASO I
CASO II
75
LA PRUEBA t POR PAREJAS
Circunstancias en las cuales es necesario o deseable
hacer una comparacion de medias por parejas
• Circunstancias en las cuales es necesario o deseable
hacer una comparación de medias por parejas
• Muestras de origenes diferentes y posiblemente con
concentraciones diferentes
• Muestras que se reciben en un período de tiempo largo (se
hace necesario eliminar efectos de condiciones
ambientales variables como temperatura, presión, etc.)
Se asume que cualquier error (sistemático o al azar) es
independiente de la concentración
76
LA PRUEBA t POR PAREJAS (cont)
Ejemplo:
La siguiente tabla proporciona la concentración de plomo
(mg/ml) por dos métodos diferentes para 4 muestras:
Muestra Método 1 Método 2
1 71 76
2 61 68
3 50 48
4 60 57
• Los dos métodos proporcionan valores para las
concentraciones medias de plomo que difieran
significativamente?
77
LA PRUEBA t POR PAREJAS (cont)
Solución al ejemplo:
• Se observa la diferencia entre cada par de resultados
dados por los dos métodos
• Hipótesis nula: No existen diferencias significativas
en las concentraciones dadas por los
dos métodos
• Se debe de probar si la media de las diferencias
difiere significativamente de cero
Muestras Diferencias
1 -5
2 -7
3 2
4 3
1.75Xd 4.99sd
Medias de las
diferencias
Desviación
estándar de las
diferencias
78
LA PRUEBA t POR PAREJAS (cont)
Solución al ejemplo:
d Valor real de las diferencias
d=0
ns
Xn
s
μXt
d
d
d
dd
c a l c
Prueba estadística
Tiene (n-1)
grados de
libertad
0.7044.99
1.75t c a l c
tcrit=3.18 (P=0.05, f=3)
tcalc < tcrit
Se acepta la
hipótesis nula
79
LA PRUEBA t POR PAREJAS (cont)
Ejemplo:
Se analiza la concentración de paracetamol (% p/p) en
pastillas por dos métodos diferentes. Se analizaron diez
patillas de diez lotes diferentes para ver si diferían los
resultados obtenidos por los dos métodos.
Lote Método UV Método IR
1 84.63 83.15
2 84.38 83.72
3 84.08 83.84
4 84.41 84.20
5 83.82 83.92
6 38.55 84.16
7 83.92 84.02
8 83.69 83.60
9 84.06 84.13
10 84.03 84.24
• Mediante una prueba t por
parejas contrastar si los dos
métodos producen resultados
significativamente diferentes
80
LAS PRUEBAS DE UNA Y DOS COLAS
DOS COLAS (bilateral)
Diferencia de dos medias
en cualquier dirección, no
se tiene en cuenta el
signo de la diferencia
UNA COLA (unilateral)
Se tiene una idea
preconcebida sobre el
signo de la diferencia
o,μX μX
Se conoce su signo
No se tiene una
idea preconcebida
del signo de la
diferencia
81
LAS PRUEBAS DE UNA Y DOS COLAS (cont.)
DOS COLAS (bilateral) UNA COLA (unilateral)
+ _
A un n dado y
una determinada
probabilidad, se
determina tcrit
5% 0.05
+
Incremento
o
_
Decremento
82
UNA COLA (unilateral)
La probabilidad es la mitad de
la probabilidad en una bilateral
0.05 x 2 = 0.10
El tcrit se determina en la columna P = 0.10
Ejemplo:
Se sospecha que una valoración acido-base tiene un error de
indicador significativo y tiende a dar resultados con un error
sistemático positivo (sesgo positivo). Para comprobarlo, se utiliza
una disolución de ácido exactamente 0.1 M para valorar 25.00 mL
de otra disolución de una base, exactamente 0.1 M con los
siguientes resultados (mL):
25.06 25.18 24.87 25.51 25.34 25.412
• Probar la existencia de sesgo positivo en estos resultados.
83
EL CONTRASTE F PARA LA COMPARACIÓN DE
DESVIACIONES ESTÁNDAR
Las pruebas anteriores (t) comparan medias y detectan
errores sistemáticos
La prueba F compara desviaciones estándar, o sea los
errores aleatorios de dos conjuntos de datos
USOS:
1. Probar si el método A es más preciso que el método B
(prueba de una cola). Se tiene una idea predeterminada
que un método es MÁS preciso que el otro.
2. Probar si los métodos A y B difieren en su precisión
(prueba de dos colas). No se tiene idea preconcebida de
cual es más preciso.
antes de una prueba t
84
EL CONTRASTE F PARA LA COMPARACIÓN DE
DESVIACIONES ESTÁNDAR (cont.)
• El contraste F considera la razón de las dos varianzas
muestrales:
2
2
2
1
cal
s
sF F siempre debe ser 1
• Se asume que las poblaciones de donde se toman las
muestras son normales
H0 : Las desviaciones estándar de las poblaciones no
difieren significativamente (la relación de varianzas
es próxima a la unidad)
85
Método (1) Método (2)
S1= 0.28 S2= 0.31
n1= 5 n2= 5
1.48mg/KgX 2.33mg/KgX
EL CONTRASTE F PARA LA COMPARACIÓN DE
DESVIACIONES ESTÁNDAR (cont.)
Ejemplo:
Se compararon dos métodos para la determinación de cromo en
muestras de hierba de centeno:
Las variazas de ambos métodos
son significativamente iguales?
Ejemplo:
Se compara un método propuesto para la determinación de la
demanda de oxígeno (ppm) en aguas con un método estándar.
Método estándar (1): media: 72 s1=3.31 n=8
Método propuesto (2): media: 72 s2=1.51 n=8
¿Es más preciso el método propuesto que el método estándar?
86
87
CONTRASTE DE DIXON (Contraste Q)
• Es una prueba con la cual se contrastan estadísticamente
datos anómalos para determinar si se rechazan o no (para
muestras pequeñas, de 3 a 7 datos).
Ho: Todas las medidas provienen de la misma población
(resultado sospechoso - resultado más próximo)
rango de resultados Qcalc=
• Si Qcalc > Qcrit , el resultado sospechoso puede descartarse
Valores críticos de Q (P=0.05), contraste de dos colas
Tamaño de muestra Valor crítico
4 0.831
5 0.717
6 0.621
7 0.570
88
CONTRASTE DE DIXON (Contraste Q) (cont.)
Ejemplo:
1. Se obtuvieron los siguientes valores para la concentración
de nitrito (ppm) en una muestra de agua de río:
¿Debería rechazarse la última medida sospechosa?
2. A los datos anteriores se adicionaron otras tres nuevas
medidas,
¿Se debería aún mantener el valor 0.380?
0.403 0.410 0.401 0.380
0.403 0.41 0.401 0.380 0.400 0.413 0.411
89
CONTRASTE DE GRUBBS (Contraste G)
Ho: Todas las medidas provienen de la misma población
• También usado para datos anómalos
Gcalc= valor sospechoso - s x
Ejemplo:
Aplicar el contraste de Grubbs
a los datos del último ejemplo
90
Ejercicios:
Datos A Datos B
1.84 2.81
1.92 4.06
1.94 3.62
1.92 3.27
1.85 3.27
1.91 3.76
2.07
1. Realizar los contrastes Q y G para el valor
2.07 de los datos A y el valor 2.81 de los
datos B, ¿son datos anómalos?
2. Demostrar que las varianzas de los dos
grupos de datos difieren significativamente.
3. Los siguientes datos proporcionan la recuperación de bromuro
adicionado a muestras con contenido vegetal, medido mediante un
método de cromatografía gas-líquido. La cantidad de bromuro potásico
añadido a cada vegetal fue la misma.
Tomate 777 790 759 790 770 758 764 g/g
Pepino 782 773 778 765 789 797 782 g/g
a) Pruebe si la recuperación en los vegetales tiene varianzas que difieran
significativamente.
b) Pruebe si las tasas de recuperación media difieren significativamente.
91
CALIBRACION
EN ANALISIS INSTRUMENTAL
CURVA DE CALIBRACION:
GRAFICAS DE SEÑAL ANALITICA vs CANTIDAD DE ANALITO
(USUALMENTE CONCENTRACION)
PROCEDIMIENTO GENERAL:
Se prepara una serie de muestras (n>3) en las cuales se conoce la concentración del analito (muestras estándares)
Se mide en el instrumento la propiedad de interés (señal
analítica) para cada muestra estándar bajo las mismas
condiciones que se utilizaran en las muestras “desconocidas”
Se grafica la curva de calibración, siempre con la respuesta
instrumental sobre el eje vertical (y) y las concentraciones
estándares sobre el horizontal (x)
92
CURVAS DE CALIBRACION
IMPLEMENTACION
La concentración de la muestra desconocida se
obtiene por interpolación
En general, es esencial que los estándares cubran el
rango completo de concentración requerido por las
muestras
Siempre se incluye un “blanco”
(un “blanco procedimental”)
93
CURVA DE CALIBRACIÓN
Muestra
desconocida
Puntos de
calibración
94
CALIBRACIÓN Se asume que:
Los errores aleatorios en el experimento de calibración
ocurren solamente en los valores y
(recordar que la curva de calibración se construye con la
respuesta analítica sobre las y y las concentraciones
estándares sobre las x)
La magnitud del error aleatorio en y es independiente de la
concentración del analito
El error aleatorio en y sigue una distribución normal
95
PREGUNTAS ESTADISTICAS A RESOLVER EN UNA
CURVA DE CALIBRACIÓN
La curva de calibracion es lineal? si no lo es, cuál es la forma
(ecuación) de la curva?
Teniendo en cuenta que cada uno de los puntos de la gráfica
está sometido a error aleatorio, cuál es la mejor línea recta
(o curva) a través de estos puntos?
Asumiendo que la gráfica es en verdad lineal, cuáles son los
errores aleatorios estimados y los límites de confianza de la
pendiente y el intercepto de la línea recta?
96
PREGUNTAS ESTADISTICAS A RESOLVER EN UNA
CURVA DE CALIBRACIÓN
Cuando se utiliza la curva de calibración en una muestra
desconocida, cuál es el error aleatorio y los límites de
confianza de la concentración encontrada?
Cuál es el límite de detección del método? Es decir, cuál
es la mínima concentración del analito que se puede
detectar con un nivel predeterminado de confianza?
Mediante la comparación estadística de curvas regulares de
calibración con curvas de adición de estándar, establecer si
se presentan efectos de matriz. (Estudio estadístico de dos
resultados).
97
Contiene todos los reactivos y solventes utilizados con la
muestra (sin analito adicionado deliberadamente)
Ser sometido a la misma secuencia de procedimientos
analíticos que a la muestra
La señal del blanco está sujeta a las mismas variaciones
(error aleatorio) que los estándares y muestras
Es indispensable en cualquier análisis químico
La señal instrumental proveniente del blanco es a menudo
diferente de cero
PREPARACIÓN BLANCO
98
COEFICIENTE DE CORRELACIÓN
• Es una medida de la asociación lineal entre dos variables
Dada una serie de parejas de datos:
(x1,y1), (x2,y2), … (xi,yi), … (xn,yn)
El coeficiente de correlacion, r, esta dado por:
yyxx
xy
SS
Sr
99
COEFICIENTE DE CORRELACIÓN
Donde:
n
1i iixy)y)(yx(xS
2
ixx)x(xS
2
iyy)y(yS
Suma de los cuadrados
de las desviaciones de
cada media
x : La media de todos los valores de x
y : La media de todos los valores de y
(x,y) : El centroíde de todos los puntos
r2*100 : Porcentaje de ajuste de los datos a la línea de regresión
100
CALCULO DE r
9989.028.418*112
2.216r
6742 x
1.1377.91 y
EJEMPLO. Se examina una serie de soluciones estándar de
fluoresceína en un fluorímetro, con los siguientes resultados
de intensidad de fluorescencia, I.F.(en unidades arbitrarias)
I.F.: 2.1 5.0 9.0 12.6 17.3 21.0 24.7
Conc., pg/mL: 0 2 4 6 8 10 12
101
ACERCA DE LOS VALORES DE r
• A menudo, una curva que no luce muy lineal produce
valores muy altos de r
• Un valor alto de r podría ser interpretado erroneamente
como una relación lineal
• La curva de calibración debe graficarse siempre
• Es importante reportar r con el número adecuado de cifras
significativas
102
VALORES DEL COEFICIENTE DE CORRELACIÓN r
-1 < r < +1
CURVAS ANALITICAS: r > 0.99 (Al menos dos nueves)
103
INTERPRETACIONES ERRONEAS DEL
COEFICIENTE DE CORRELACION r
Esta curva es suave,
como para generar un
valor de r bastante alto
(la calibración siempre
debe graficarse)
Un r igual a cero no
siempre significa que no
hay relación entre x y y
104
PRUEBA t PARA EVALUAR r
En caso de un valor bajo de r:
• Es significativo de verdad?
Ho: no hay correlación entre x y y
2calc
r1
2nrt
• tcrit Para (n-2) grados de libertad, prueba t de dos colas
• SI tcalc > tcrit, se rechaza Ho
105
ECUACIÓN DE LA CURVA LINEAL
• Hay una fuerte relación lineal entre la señal analítica (y) y
la concentración (x)
• “La mejor” línea que pasa por los puntos de la curva de
calibración:
y = a + bx
Pendiente
xx
xy
S
Sb
Intercepto
xbya
• La ecuación sólo es válida cuando r es por lo menos
0.99 y hay evidencia visual de linealidad
106
Ejemplo de línea de regresión:
Se examina una serie de soluciones estándar de fluoresceína
en un fluorímetro, con los siguientes resultados de intensidad
de fluorescencia (I.F.) (unidades arbitrarias)
I. F. : 2.1 5.0 9.0 12.6 17.3 21.0 24.7
CONC. pg/mL: 0 2 4 6 8 10 12
Sxx Syy Sxy
107
Ejemplo de línea de regresión (cont.):
6x
1.13y
93.1112
2.216
xx
xy
S
Sb
52.16*93.11.13 xbya
9989.0yyxx
xy
SS
Sr
52.193.1 xy
centroíde
108
Residuos de y en una regresión
Residuo = Valor medido – valor predicho
iy iy ibxa
109
Desviación estándar de los residuos o desviación
estándar de la regresión
iii yyResiduo ˆ
xxyyiiSbSyySCR 22)ˆ( Suma de
cuadrados
residual xxyy
SbSSCR 2
Desviación
estándar
residual 22
2
n
SbS
n
SCRS xxyy
r
Desviación
estándar de
la regresión
o
La línea de regresión debe tener la mínima SCR
(mínimos cuadrados)
110
Errores en la pendiente (b) y el intercepto (a) de
la línea de regresión
Desviación
estándar de
la pendiente xx
Rb
S
Ss
• Intervalo de confianza: btsb
Desviación
estándar del
intercepto xx
RaS
x
nSs
2
1
• Intervalo de confianza: atsa
f: (n-2)
f: (n-2)
111
4672.05
112*93.128.418
2
22
n
SbSS
xxyy
R
04415.0112
4672.0
xx
Rb
S
Ss
1 1.09 3.10 4 4 1 5.0*5 7.29 3.1 b
tsb
318.0112
6
7
14672.0
1 22
xx
RaS
x
nSs
8 1.05 2.13 1 8 3.0*5 7.25 2.1 a
tsa
7n
6x
Del ejemplo anterior:
112
Cálculo de la concentración de una muestra
desconocida
b
ayx
0
0
bxay
00bxay
yo es el valor experimental de y a partir del cual se determina xo
xx
Rx
Sb
yy
nmb
Ss
1112
0
0
• Intervalo de confianza: 00 xtsx f: (n-2)
• m es el número de lecturas para obtener y0
113
Del ejemplo anterior:
72.093.1
52.19.20
0
b
ayx
Para un y0=2.9
284.0112
1
93.1
1.139.2
7
1
1
1
93.1
4672.02
0
xS
Intervalo de confianza de x0= 0.72 2.53*0.284
= 0.72 0.73
• Si m fuera 3 0.72 0.53
Para un y0=13.5 (cerca del centroíde) 6.21 0.53
Para un y0=23.0 (lejos del centroíde) 11.13 0.53
114
Forma general de los límites de confianza en una
recta de regresión
115
UN EXPERIMENTO DE CALIBRACION
DE MAYOR TAMAÑO
valor de t ancho intervalo
n para (n-2) GdL de conf ianza 95%
3 12,71 14.68(SR/b)
6 2,78 3.00(SR/b)
12 2,23 2.32(SR/b)
24 2,07 2.12(SR/b)
48 2,01 2.03(SR/b)
1,96 1.96(SR/b)
n=3 6
12
24
48
CONCENTRACION
ESTIMADA
SR/b -10 +10
INTERVALO DE CONFIANZA vs TAMAÑO DEL EXPERIMENTO
116
Determinación del rango lineal en una regresión
Regresión con r
cercano a 1
Puntos desviados
de la regresión
117
Determinación del rango lineal en una regresión
• El coeficiente de correlación no es un buen parámetro para
establecer rangos lineales en una curva de calibración
(puede interpretarse erróneamente)
• Un método más eficiente es mediante el análisis de los
residuos (yi – ŷi)
• Los residuos deberían estar distribuidos normalmente en
torno al valor cero, si no es cierto esto, entonces se debe
sospechar que la recta de regresión ajustada no es la
correcta
• (yi – ŷi) debe ser cero (teniendo en cuenta errores de
redondeo) y estar distribuido simétricamente en torno a cero
118
Determinación del rango lineal en una regresión
CONC. INTENS.
g/mL FLUOR.
0 0.1
2 8.0
4 15.7
6 24.2
8 31.5
10 33.0
Ejemplo
Determinar el rango lineal en la siguiente curva
Intercepto = 1.357
Pendiente = 3.479
r = 0.9878
119
n a b r R E S I D U O S
6 1.357 3.479 0.9878 -1.257 -0.314 0.429 1.971 2.314 -3.143
5 0.100 3.950 0.9998 0.000 0.000 -0.200 0.400 -0.200
4 0.000 4.000 0.9998 0.100 0.000 -0.300 0.200
Ejemplo (cont.)
120
USO DE REGRESION LINEAL PARA
COMPARAR DOS METODOS ANALITICOS
PARTE DE LA VALIDACION DE UN NUEVO METODO:
IDENTIFICAR ERROR(ES) SISTEMATICO(S)
¿Produce el nuevo método resultados significativamente más
altos o más bajos que un procedimiento bien establecido?
Si cada muestra conduce a un resultado idéntico por
ambos métodos, a = 0 b = 1 r = 1
• Utilice una serie de muestras analizadas por ambos métodos
• Calcular : la pendiente (b), el intercepto (a) y el coeficiente
de correlacion* (r)
121
REGRESION PARA COMPARAR DOS METODOS
ANALITICOS
Los resultados del método más preciso se presentan en el eje
x (puede utilizarse la prueba F para comparar la precisión de
los dos métodos)
Debe incluirse un número razonable de puntos (n > 10) para
construir la gráfica de comparación (recordar que se pierden
dos grados de libertad al efectuar los cálculos)
Los puntos (parejas de datos de concentración) deben cubrir el rango de interés con un distanciamiento uniforme
122
REGRESION LINEAL PARA COMPARAR
DOS METODOS ANALITICOS
a - perfecto acuerdo entre
los dos métodos
b - Los dos métodos difieren
en una cantidad fija (error
absoluto)
c - Los métodos difieren en una
cantidad que aumenta con la
concentración (error relativo)
d - Evidencia de errores absoluto
y relativo
123
REGRESION LINEAL PARA COMPARAR
DOS METODOS ANALITICOS
Ejemplo
Se determinó el nivel de plomo en diez muestras de jugo de frutas
mediante un nuevo método potenciométrico y los resultados se
compararon con aquellos obtenidos mediante absorción atómica con
horno de gráfito. Se obtuvieron los siguientes datos (todos en mg/l):
MUESTRA 1 2 3 4 5 6 7 8 9 10
RESULTADO AAS 35 75 75 80 125 205 205 215 240 350
RESULTADO MET. POT. 35 70 80 80 120 200 220 200 250 330
En la práctica, si los intervalos de confianza para el intercepto y la
pendiente incluyen los valores “ideales” de 0 y 1 respectivamente,
se habrá demostrado, más alla de una duda razonable, que no hay
evidencia de errores fijo y relativo
124
Ejemplo (cont.)
87.3a 963.0b 9945.0r 56.10RS
64.6as 0357.0bs )8(31.2 ft
34.1587.3 a
083.0963.0 b
(Incluye el cero)
(Incluye el uno)
El intercepto y la pendiente
calculados NO difieren
significativamente de los valores
ideales 0 y 1 respectivamente
125
Ejemplo comparación de métodos:
Comparar los resultados obtenidos para el análisis de ácido fítico
en 20 muestras por dos métodos analíticos (fluorimétrico, CF y
fotométrico, EF). Las concentraciones en mg/L. Los resultados del
método EF presentan mayor precisión.
126
LIMITACIONES DE LA LINEA DE REGRESION
“NO PONDERADA”
Una línea de regresión no solo asume que el error aleatorio en los valores del eje x es cero, sino también que el error aleatorio en los valores de y es constante (homocedasticidad)
Todos los puntos de la recta tienen igual ponderación cuando se calculan la pendiente y el intercepto de la línea de regresión
A menudo dichas asunciones no son válidas en la práctica
Con mucha frecuencia es la desviación estándar relativa de
la señal instrumental la que es aproximadamente constante dentro de un rango de concentración
A pesar de estas objeciones, las líneas de regresión no ponderadas
proporcionan información útil en muchos casos
127
ESTÁ LA PRECISION DEL METODO RELACIONADA
CON LA CONCENTRACION?
Precisión absoluta constante
tetanconss y
Precisión
relativa
constante
tetanconsy
sy
128
PONDERACION DE ERRORES EN UN
CÁLCULO DE REGRESIÓN
• Los errores en los diferentes puntos de la gráfica se representan
mediante “barras de error” (límites de 1s) que se alargan a
medida que la concentración aumenta
• Se debe dar una mayor ponderación a aquellos puntos donde las
barras de error son más cortas: es más importante que la recta
calculada pase más cerca de estos puntos
129
LÍNEAS DE REGRESIÓN “PONDERADAS”
Se utilizan cuando el error aleatorio en la respuesta instrumental
es una función (aproximadamente lineal) de la concentración del
analito
Los cálculos involucrados son sólo ligeramente más complicados
que aquellos de la regresión no ponderada
Se requiere información adicional de la precisión de la señal a los
diferentes niveles de concentración o, al menos, una formulación
de suposiciones adicionales acerca de tal precisión (por esta razón
las curvas ponderadas son menos utilizadas)
Las líneas de regresión ponderada se usan exclusivamente en la
calibración de instrumentos (no para comparar dos métodos
analíticos)
130
LÍNEAS DE REGRESIÓN PONDERADA
Parejas de datos: (x1,y1), (x2,y2), … (xi,yi), … (xn,yn)
Desviaciones estándar (en y) s1 s2 si sn
Ponderaciones w1 w2 wi wn
A cada punto se asigna una ponderación, wi, inversamente
proporcional a la varianza correspondiente, si2
2
1
i
is
w
21
2
in
ii
s
sw
nwi
131
LÍNEAS DE REGRESIÓN PONDERADA
(ECUACIONES)
• Centro de gravedad ponderado (xw, yw) :
ii
i
ii
w xwnw
xwx
1
ii
i
ii
w ywnw
ywy
1
wxx
wxy
w
S
Sb
wwwxbya
Pendiente
Intercepto
wwiiiwxy
yxnyxwS
22
wiiwxxxnxwS
22
wiiwyyynywS
132
Ejemplo de regresión ponderada:
Calcular las rectas de regresión ponderadas y no ponderadas para
los siguientes datos de calibración. Calcular también para cada
recta la concentración de la muestras de ensayo con absorbancias
de 0.100 y 0.600
• Regresión no ponderada:
Pendiente: 0.0725
Ordenada: 0.0133
Concentraciones:
* Para 0.100 : 1.20 ppm (1.20 0.65)
* Para 0.600 : 8.09 ppm (8.09 0.63)
Intervalo de confianza
133
Ejemplo de regresión ponderada (cont.):
• Regresión ponderada:
yw = 0.1558/6 = 0.0260 xw = 1.372/6 = 0.229
aw = 0.0091 bw = 0.0738
Concentraciones:
* Para 0.100 : 1.23 ppm (1.23 ? )
* Para 0.600 : 8.01 ppm (8.01 ? )
Intervalo de confianza
134
Ejemplo de regresión ponderada (cont.):
• La regresión ponderada produce datos (pendiente, intercepto y
concentraciones de muestras) muy parecidos a los obtenidos a
partir del método de regresión no ponderada
• La estimación de los límites de confianza de las concentraciones
con la regresión ponderada produce resultados mucho más reales
wxx
wwRx
Sb
yy
nwb
SS
w 2
2
0
0
)(110
y0 señal analítica de la muestra
2
2
n
SbSS
wxxwyy
wRdonde,
Concentraciones:
* Para 0.100 : 1.23 ppm (1.23 0.12 )
* Para 0.600 : 8.01 ppm (8.01 0.72 )
Intervalo de confianza
135
LÍMITES DE CONFIANZA PARA UNA CONCENTRACIÓN
CALCULADA MEDIANTE UNA REGRESIÓN LINEAL
PONDERADA
Mucho más cercano al
origen que el centroide
no ponderado
136
LIMITE DE DETECCION
LA MINIMA CONCENTRACION DEL ANALITO QUE UNO
PUEDE DETECTAR POR EL METODO CON UN CIERTO
NIVEL DE CONFIANZA
EN OTRAS PALABRAS…
LA CONCENTRACION MINIMA DE ANALITO QUE PRODUCE
UNA SEÑAL QUE ES SIGNIFICATIVAMENTE DIFERENTE DEL
BLANCO
DEFINICION DE LA IUPAC:
LA CONCENTRACION DEL ANALITO QUE PRODUCE UNA SEÑAL
IGUAL A LA DEL BLANCO MAS k VECES LA DESVIACION
ESTANDAR DEL BLANCO
i.e.: LA CONCENTRACION CD PARA LA CUAL
BBD ksyy
137
COMO SE DETERMINA CD
BBD ksyy DE LA DEFINICION DE LA IUPAC
DE LA ECUACION DE REGRESION DD bCay
DBB bCaksy
ASUMIENDO TAMBIEN QUE
ayB
DB bCks
b
skC B
D
ASUMIENDO QUE
RB Ss
b
SkC R
D
OJO:
CADA PUNTO DE LA CURVA DE CALIBRACION
(INCLUYENDO EL BLANCO) TIENE UNA VARIACION
(NORMALMENTE DISTRIBUIDA) SOBRE EL EJE y QUE
PUEDE ESTIMARSE CON LA DESVIACION ESTANDAR DE
LOS RESIDUOS SR
138
LIMITE DE DETECCION
DOS PROBLEMAS
I.- UNO NO QUIERE RECLAMAR LA PRESENCIA DEL ANALITO CUANDO EN REALIDAD ESTA AUSENTE
PERO IGUALMENTE…
II.- UNO NO DESEA REPORTAR QUE EL ANALITO ESTA AUSENTE CUANDO EN VERDAD ESTA PRESENTE
DEBE MINIMIZARSE LA POSIBILIDAD DE CADA UNO DE
ESTOS ERRORES UTILIZANDO UNA DEFINICION APROPIADA
DE LA CONCENTRACION LIMITE
139
“EFECTOS DE MATRIZ”
DISMINUCION O AUMENTO DE LA SEÑAL ANALITICA
DEBIDO A LA PRESENCIA DE OTROS COMPONENTES EN LA
MUESTRA
METODO “REGULAR” DE CALIBRACION:
EL INSTRUMENTO SE CALIBRA CON SOLUCIONES ESTANDAR QUE
CONTIENEN SOLO EL ANALITO .
EL METODO ES ACEPTABLE SOLAMENTE SI ESTA SOLUCION DEL ANALITO
PRODUCE LA MISMA SEÑAL INSTRUMENTAL QUE SOLUCIONES DE LA
MUESTRA QUE CONTENGA LA MISMA CONCENTRACION DEL ANALITO
CUANDO SE UTILIZAN SOLUCIONES “PURAS” DEL ANALITO PARA
ESTABLECER LA GRAFICA DE CALIBRACION, SE ASUME QUE NO HAY
“EFECTOS DE MATRIZ”
CON FRECUENCIA, TAL ASUNCION NO ES ACEPTABLE EN MUCHAS AREAS
DE ANALISIS
140
EL PROBLEMA DE
“EFECTOS DE MATRIZ”
POSIBLES SOLUCIONES:
• PREPARAR ESTANDARES DE CALIBRACION QUE SEAN
IDENTICOS A LA MUESTRA PROBLEMA EN TODO ASPECTO
EXCEPTO EN LA CONCENTRACION DEL ANALITO (METODO DE
ESTANDAR CON “AJUSTE DE MATRIZ”).
ESTA ESTRATEGIA RARA VEZ RESULTA PRACTICABLE
• PREPARAR ESTANDARES DE CALIBRACION QUE CONTENGAN
LA PROPIA MUESTRA EN UNA PROPORCION FIJA Y
CONOCIDA
(METODO DE “ADICIONES (DE) ESTANDAR”)
141
METODO DE ADICION DE ESTANDAR
* IMPLEMENTACION *
SE TOMAN VOLUMENES IGUALES DE SOLUCION
PROBLEMA
TODAS SALVO UNA SON “TRATADAS” (“DOPADAS”) POR
SEPARADO MEDIANTE LA ADICION DE CANTIDADES
CONOCIDAS E INCREMENTALES DEL ANALITO
TODAS SE DILUYEN AL MISMO VOLUMEN
SE MIDE LA SEÑAL INSTRUMENTAL PRODUCIDA POR
CADA UNA DE ESTAS SOLUCIONES
COMO DE COSTUMBRE, LA SEÑAL SE PRESENTA EN EL
EJE y, MIENTRAS QUE EN EL EJE x SE PRESENTA LA
CANTIDAD DE ANALITO AÑADIDA
142
METODO DE ADICION DE ESTANDAR
* CURVA Y CALCULOS *
b
axE
xx
Rx
Sb
y
nb
Ss
E 2
2
1
143
METODO DE ADICION DE ESTANDAR
* DESVENTAJAS *
REQUIERE CANTIDADES DE MUESTRA MAS
GRANDES QUE EL METODO “REGULAR” DE
CALIBRACION
ESTADISTICAMENTE, SU PRINCIPAL
DESVENTAJA CONSISTE EN SER UN METODO
DE EXTRAPOLACION, POR LO TANTO
MENOS PRECISO QUE LAS TECNICAS DE
INTERPOLACION
144
CALIBRACION vs ADICION DE ESTANDAR
• UNO NO DEBE “EMBARCARSE” EN EL ESFUERZO EXTRA DE
LAS ADICIONES DE ESTANDAR A MENOS QUE SE TENGA
EVIDENCIA SOLIDA DE LA PRESENCIA DE EFECTOS DE MATRIZ
• LA AUSENCIA DE EFECTOS DE MATRIZ CONLLEVA A
PENDIENTES (SENSIBILIDADES INSTRUMENTALES)
ESTADISTICAMENTE IGUALES POR AMBOS METODOS
• CUALQUIER DIFERENCIA ENTRE LOS DOS METODOS PUEDE
CHEQUEARSE MEDIANTE UNA PRUEBA DE SIGNIFICACION:
Ho: LAS VERDADERAS PENDIENTES DE LAS DOS LINEAS NO
SON DIFERENTES ( )
H1: LAS PENDIENTES VERDADERAS DE LAS DOS LINEAS SON
DIFERENTES
21
21
11
xxxx
R
calc
SSS
bbt
21
2
22
2
11
ff
SfSfS RR
R
211 nf 222 nftcrit PARA (f1+f2) GRADOS DE LIBERTAD
21 NO
21
145
VALIDACIÓN DE MÉTODOS ANALÍTICOS
Procedimiento por el cual se establece si un método analítico
cumple los requerimientos necesarios para ser considerado
aceptable para determinado propósito. Tales requerimientos
son los siguientes:
• Especificidad – selectividad:
Se refiere a que el método este libre de interferencias, el métodos
debe distinguir entre el analito y otros componentes que puedan
generar un aumento o disminución en la señal analítica
instrumental, generando efectos de matriz.
Se puede determinar la presencia de efectos de matriz mediante
comparación estadística de curvas regulares de calibración y
curvas de adición de estándar
146
• Precisión del instrumento:
Grado de concordancia entre medidas replicadas (al menos seis)
sobre una sola muestra
100% x
sRSD
• Precisión del método:
Grado de concordancia entre medidas obtenidas en múltiples
muestreos de muestras homogéneas
Repetibilidad: Concordancia entre medidas obtenidas en
condiciones repetitivas: la misma muestra, igual operador, mismas
soluciones, el mismo día, el mismo material de vidrio, etc.
Reproducibilidad: Concordancia entre medidas obtenidas en
condiciones no repetitivas: diferentes muestras, operadores,
soluciones, días, materiales de vidrio, etc.
Parámetro para expresar
la precisión
147
• Exactitud del método:
Concordancia de los resultados obtenidos por el método respecto
al valor real
Con material certificado: Es una muestra que contiene una
cantidad de analito conocida (valor real). El resultado obtenido
con el método se compara con el valor real mediante un
contraste de significancia.
Con analito estándar adicionado a la muestra problema:
Primero se determina el nivel de analito en la muestra.
Posteriormente se analiza otra muestra a la cual se le ha
adicionado una cantidad conocida de analito. El resultado
obtenido de la muestra dopada debe de contener la cantidad de
analito original en la muestra más la cantidad de analito
estándar adicionado. La exactitud se reporta como porcentaje de
recuperación del analito estándar adicionado. Se realiza un
contraste entre la cantidad recuperada y la cantidad adicionada.
148
• Límite de detección del método:
Menor concentración de analito que puede ser detectada por el
método. La señal a este nivel debe ser la del blanco más tres
veces la desviación estándar del blanco.
ym=yb + 3sb L.D.=3Sr/b
• Límite de cuantificación del método:
La señal a este nivel debe ser la del blanco más diez veces la
desviación estándar del blanco.
ym=yb + 10sb L.C.=10Sr/b
• Rango:
Intervalo entre la mayor y menor concentración de analito en el
cual el método es válido. Debe estar entre el 70% y 130% de la
concentración esperada.
149
• Linealidad:
La habilidad de un método para obtener resultados que son
directamente proporcionales a la concentración sobre un rango
específico.
• Robustez:
Es la capacidad de un método para soportar pequeños cambios en
las condiciones operativas. Tales cambios pueden ocurrir en días
diferentes, entre diferentes operadores, entre diferentes
instrumentos, temperaturas ambientales diferentes, pH´s
diferentes , etc. Se debe demostrar que el método produce
resultados comparables, aún con esos pequeños cambios. La
robustez se deriva de un análisis estadístico de los datos
obtenidos.
150
• Comparación de métodos:
Comparación del método a validar con otro método reconocido
(estándar) para determinar si nuestro método presenta algún tipo
de error sistemático.
Con una muestra representativa:
• Analizar con cada método la muestra (cinco veces)
• Hacer una prueba F con los resultados de ambos métodos
para determinar si la varianza es igual/diferente
• Realizar una prueba t con las medias de ambos métodos
para ver si los datos son estadísticamente equivalentes.
Con varias muestras de diversa concentración mediante
un análisis de regresión