bases estadisticas para el muestreo de plagas y...

62
BASES ESTADISTICAS PARA EL MUESTREO DE PLAGAS Y MODELOS MATEMATICOS UTILIZADOS EN EPIDEMIOLOGIA M.C. LUIS EMILIO CASTILLO MARQUEZ UNIVERSIDAD AUTONOMA CHAPINGO DEPARTAMENTO DE PARASITOLOGIA AGRICOLA AREA DE ESTADISTICA Y APOYO

Upload: phamnhi

Post on 03-Oct-2018

221 views

Category:

Documents


1 download

TRANSCRIPT

BASES ESTADISTICAS PARAEL MUESTREO DE PLAGAS YMODELOS MATEMATICOS

UTILIZADOS EN EPIDEMIOLOGIA

M.C. LUIS EMILIO CASTILLO MARQUEZ

UNIVERSIDAD AUTONOMA CHAPINGODEPARTAMENTO DE PARASITOLOGIA AGRICOLA

AREA DE ESTADISTICA Y APOYO

Debido a la naturaleza de las poblaciones de organismos plaga es necesario recurrir al uso de herramientas estadísticas como el muestreo, con el fin de poder caracterizar

a las poblaciones e

intentar modelar

matemáticamente su comportamiento para realizar predicciones.

El muestreo estadístico

se define como la rama de la estadística que a partir de una fracción de la población (muestra) permite estimar parámetros con el fin de caracterizarla y realizar inferencia.

Aunque hoy en día existen técnicas estadísticas y matemáticas que relacionan un gran numero de variables y permiten realizar análisis mas exhaustivos y complejos de las plagas y enfermedades, es necesario realizar correctamente el proceso de muestreo, ya que la información derivada de este servirá

de base para análisis

sencillos o complejos.

Contar con información de mala calidad lleva a realizar análisis y conclusiones también de mala calidad.

DEFINICIONES BASICAS DE MUESTREO

Población. Conjunto de individuos u objetos con características comunes. La delimitación física de la población la establece el investigador según su interés experimental y su experiencia.

El total de hectáreas de cultivo de tomate en el Estado de Morelos.

El total de huertas de manzana en Cuauhtemoc, Chihuahua.

El total de árboles en una huerta de durazno.

Producción.

% de daño

Numero de mazorcas por planta

Numero de granos por vaina

Variable. Una característica de interés experimental inherente a la población, y cuya medición es posible.

Parámetro. Un valor cuantificable que permite describir a una población.

Media

Mediana

Varianza

Desviación estándar

Unidad de muestreo.

Área física mínima, sobre la cual se tomará información, y que integrara la muestra según el tamaño que se

haya determinado.

Unidad de muestreo

Unidad de muestreo

Unidad de muestreo

Unidad de muestreo

Unidad de muestreo

Unidad de muestreo

Marco de muestreo. Total de unidades de muestreo en que esta dividida la población. Se representa por N.

Si se tiene como población un total de 1000 árboles y se toma como unidad de muestreo a 1 árbol, entonces el marco de muestreo estará

constituido por 1000 unidades de

muestreo. N=1000

Tamaño de muestra. Numero de unidades de muestreo que integran la muestra. Se representa por n.

Si se decide tomar una muestra de tamaño 130, significa que de las 1000 unidades de muestreo (árboles) se elegirán al azar 130. n=130

Si se tiene como población un total de 1000 árboles y se toma como unidad de muestreo a un conjunto de 10 árboles, entonces el marco de muestreo estará

constituido por 100

unidades de muestreo. N = 100

Si se decide tomar una muestra de tamaño 6, significa que de las 100 unidades de muestreo (conjuntos de 10 árboles) se elegirán al azar 6. n=6

Existen diversos factores que influyen sobre la calidad de los datos colectados en un proceso de muestreo:

El tamaño de la unidad de muestreo●

La biología de la plaga

La hora y los factores climáticos al momento de la toma de muestra●

La parte de la planta que se examina

Tradicionalmente, en estudios para el manejo de plagas y enfermedades se emplean como unidades de muestreo

cuadros de

terreno (cuadrantes) de dimensiones variadas, transectos (líneas de recorrido con puntos de muestreo) cuando se trata de cultivos hortícolas, o árboles cuando se trata de cultivos frutícolas.

Para cuadrantes

Teóricamente si el área bajo estudio es relativamente homogénea,entre más pequeñas sean las unidades de muestreo los datos derivados de la muestra reflejarán con mayor precisión a las variables de interes. Cuando el área bajo estudio no es homogénea implica que el tamaño de muestra a tomar debe ser grande.

Teóricamente si el área bajo estudio es grande, es necesario tomar unidades de muestreo de gran tamaño, pero entre mas heterogénea sea el área bajo estudio los datos de la muestra no reflejarán el comportamiento real de las variables de interes.

¿Como determinar el tamaño óptimo del cuadrante a utilizar?

Se utiliza la comparación de la

media

y la varianza

de los datos obtenidos en varios cuadrantes de un tamaño determinado

Tamaño de la unidad de muestreo (m2)

Varianza/media

Optimo

Optimo

La longitud de cada segmento de recorrido puede variar de acuerdo al tamaño del área a recorrer y la precisión deseada.

Transecto

Conocer la biología del organismo plaga es de gran ayuda en el muestreo para obtener información de calidad.

La temperatura, la humedad y otras variables climáticas influyen sobre la presencia y ausencia de organismos plaga.

La parte de la planta que se examina

Superior

Media

Inferior

DIFERENTES TIPOS DE METODOS DE MUESTREO ESTADISTICO

Muestreo aleatorio simple●

Muestreo cualitativo

Muestreo estratificado●

Muestreo sistematico

Muestreo aleatorio simple. Todas las unidades de muestreo tienen la misma oportunidad de ser incluidas en la muestra. Las unidades de muestreo son

homogéneas.

N = 54 n = 8

La selección de las unidades de muestreo que integraran la muestra se realiza mediante el uso de una tabla de números aleatorios

El inconveniente principal radica en que entre más grande sea el marco de muestreo (N) , más difícil será

utilizar la tabla.

Este método de muestreo es mas fácil de utilizar cuando el marco de muestreo es pequeño.

Identificar las unidades de muestreo que integran la muestra es otro procedimiento tedioso.

sy ny

n 12

i2 2

i 1

n

=−

−=∑

Y Ny=

yy

n

ii 1

n

= =∑

Media

Varianza

Total

(z ) var(y)1 /2−αy +/-Límites para el error de estimación de la media

var(y)(N n)sNn

2

=−

Varianza de la media

nNs

Nd

zs

2

1 /2

2

2

≥⎡

⎣⎢

⎦⎥ +

−α

Tamaño de muestra optimo

¿Por qué

calcular los límites para el error de estimación ?

Velocidad = Distancia / Tiempo

Si se esta en China y se recorre un kilómetro en una hora, entonces nuestra velocidad es de 1 Km/h

Si se esta en Tejupilco

y se recorre un kilómetro en una hora, entonces nuestra velocidad es de 1 Km/h

Velocidad = Distancia / Tiempo FORMULA

Estimador: Ecuación asociada a un componente estadístico, la cual pretende determinar el valor aproximado de un parámetro, pero al ser ocupada en repetidas ocasiones, sobre datos de un mismo conjunto homogéneo, los resultados pueden coincidir o variar no drásticamente.

yy

n

ii 1

n

= =∑ 2

3

2.5

3

3.2

2.6

3

2.8 2.6 3 2.9 3.1

3.2 2.9 3.1 2.5 2.8 2.8

n = 4 3 2.6 2.5 2.8

Media = 2.833

n = 4 2.5 2.9 3.1 2.6

n = 4 2 2.6 3 2.9 Media = 2.625

Media = 2.725

Media = 2.775

Al utilizar un estimador puntual

no siempre se obtiene el valor verdadero del parámetro.

Es necesario utilizar un estimador por intervalo, el cual indica los valores entre los cuales se encuentra el verdadero valor del

parámetro (LI, LS).

Un estimador puntual

es aquel que genera un solo dato al estimar al parámetro.

Muestreo cualitativo. Se utiliza cuando las unidades de muestreo son homogéneas, y se quiere estimar un porcentaje o proporción.

Se registra la presencia o ausencia de una característica de interés

No se cuantifica la intensidad de la característica de interés, solo si esta presente o ausente.

Es por esto que solo es posible, al usar este método de muestreo, estimar proporciones o porcentajes.

Se registra si el tubérculo esta enfermo (1) o si esta sano

(0)

No interesa que tan dañado estén los tubérculos, solo si están sanos o enfermos.

p = 1 o 100%

12 plantas de col

6 de las 12 plantas son atacadas

6 de las 12 plantas de col fueron atacadas.

Se tiene un porcentaje de ataque del 50.

Aunque algunas plantas son atacadas con mayor intensidad solo interesa registrar si son atacadas o no.

pR

n

ii 1

n

= =∑

(z ) var(p)1 /2−α

pq(N n)N(n 1)

−−

p +/-

Var(p)=

nNpq

Nd

zpq

1 /2

2≥⎡

⎣⎢

⎦⎥ +

−α

Proporción

Límites para el error de estimación

Varianza de la proporción

Tamaño de muestra óptimo

Muestreo estratificado. Se utiliza cuando se presenta variabilidad en las unidades de muestreo en que se divide a una población.

Las unidades de muestreo que son parecidas entre sí

se agrupan en estratos, los cuales son diferentes unos con otros.

Se desea estimar la presencia de una enfermedad fungosa en la zona agrícola

Estrato I

Estrato II

yU y

NES

i ii 1

L

= =∑

Y NyES ES=

(z ) var(y )1 /2 ES−αyES

[ ]var(y )

U var(y )

NES

i2

ii=1

L

2=∑

+/-

Media estratificada

Total estratificado

Límites para el error de estimación

Varianza de la media estratificada

( )n

U sw

Nd

zU s

i2i2

ii=1

L

2

1 /2

2

i i2

i 1

L≥

⎝⎜

⎠⎟

⎣⎢

⎦⎥ +

∑− =α

( )

( )n

U s

Nd

zU s

i ii=1

L 2

2

1 /2

2

i i2

i 1

L≥

⎣⎢

⎦⎥

⎣⎢

⎦⎥ +

∑− =α

Tamaño de muestra óptimo bajo asignación General

( )U s

U s

i i

i ii 1

L

=∑

wi

=

Tamaño de muestra óptimo bajo asignación Neyman

( )

( )n

N U s

Nd

zU s

i i2

i=1

L

2

1 /2

2

i i2

i 1

L≥

⎣⎢

⎦⎥

⎣⎢

⎦⎥ +

∑− =α

UNiwi

=

Tamaño de muestra óptimo bajo muestreo proporcional

Se recomienda utilizar asignación general cuando se conoce las características de los estratos y uno puede decidir el valor de las wi

o cuando se quiere dar la misma importancia a todos los estratos, aquí

w1

= w2

= …. = wL

.

Se recomienda utilizar asignación Neyman cuando la varianzas de los estratos sean muy diferentes. Las formulas correspondientes ponderan la variabilidad interna de los estratos.

Se recomienda utilizar asignación proporcional cuando el tamaño de los estratos sean muy diferentes. Las formulas correspondientes ponderan el tamaño de cada estrato.

Al obtener el tamaño de muestra óptimo

con el muestreo estratificado es necesario dividirlo entre el total de estratos definidos para

el

estudio, para saber cuantas unidades de muestreo formaran la muestra en cada estrato.Si se definen 4 estratos, si n

= 20 (con la formula de tamaño de

muestra óptimo) y si se tiene:

w1

= 0.12

w2

= 0.20

w3 = 0.40

w4

= 0.28

Entonces ni

= n (wi

)

n1

= (20)(0.12) = 2.4 3

n2

= (20)(0.20) = 4 4

n3

= (20)(0.40) = 8 8

n4

= (20)(0.28) = 5.6 6

Muestro sistemático. Es similar, en las condiciones de uso y en las formulas utilizadas, al muestreo aleatorio simple, lo que cambia sustancialmente es la forma de tomar

la muestra.

Suponga que se tiene un marco de muestreo (N) de 108 árboles de manzano y se quiere tomar una muestra n = 15.Emplear el muestreo aleatorio simple implica el uso de la tabla de números aleatorios para determinar las unidades de muestreo que integraran la muestra, después identificar las unidades de muestreo en el campo, lo anterior sería un proceso muy tedioso.Utilizando el muestreo sistemático se calcula:

k ≤

N/n

108/ 15

7.2 k = 7

Se tomará

una

muestra sistemática de 1 en 7.

K=7

n = 15

Tiempo para realizar actividades con Excel ®

PROCEDIMIENTOS DE MUESTREO

Son los aparatos o herramientas que en algunas ocasiones son utilizadas como auxiliar para tomar la muestra.

( )s(y) n

100%⎛

⎝⎜

⎠⎟

( )sy100%

⎛⎝⎜

⎞⎠⎟

( )(y) n(C)(s)

100%⎡

⎣⎢

⎦⎥

C.V.=

V.R. =

P.R.N. =

Coeficiente de variación

Variación relativa

Precisión relativa neta

DISPOSICION ESPACIAL DE ORGANISMOS

Regular Aleatoria Contagio

Existen dos formas comunes de determinar la disposición espacial de organismos plaga:

1).-

Relación σ2

vs

μ

2).-

Prueba de bondad de ajuste. Prueba ji-cuadrado.

Si σ2

= μ

, entonces la disposición espacial es de tipo aleatoria

Si σ2

> μ

, entonces la disposición espacial es de tipo contagio

Si σ2

< μ

, entonces la disposición espacial es de tipo regular

PRUEBA DE BONDAD DE AJUSTE

PRUEBA JI-CUADRADO

Ho : Los datos se ajustan a la distribución w

vs

Ha : Los datos no se ajustan a la distribución w

(O E )E

i i2

ii 1

K −

=∑J =

Se rechaza Ho si J >

Ei

= N (Pi

)

χα2 ( )v

ex!

x−λ λ

[ ]P(x 1)k (x 1)

x(T)−

+ −⎡⎣⎢

⎤⎦⎥

xs x

2

2 −x

mk m+

mk

1k

+⎛⎝⎜

⎞⎠⎟−

λ

= np

P(X) = X= 0, 1, 2 , …….., ∞

Distribución Poisson

. Disposición espacial aleatoria

P(0) =

Distribución Binomial

Negativa. Disposición espacial de contagio

P(X) =

m = k = T =

X= 0, 1, 2 , …….., ∞

Tiempo para realizar actividades en Excel ®

y simde

®

FUNDAMENTOS ESTADÍSTICOS PARA ESTUDIOS DE EPIDEMIOLOGÍA

Una epidemia puede ser definida como un incremento de la enfermedad en el tiempo.

La curva de progreso de la enfermedad

es una gráfica de proporción de la enfermedad contra el tiempo.

La determinación o cuantificación de el progreso de la enfermedad es deseable por numerosas razones incluyendo:

1).-

Evaluación de estrategias de control.

2).-

Predicción de futuros niveles de la enfermedad.

3).-

Verificación de modelos de simulación de enfermedades de planta y predicción.

Monitorear: Huésped Medioambiente Patógeno Manejo

Modelos para determinar la proporción de enfermedad a través del tiempo:

Exponencial

Logístico

Monomolecular

Gompertz

Bertalanffy-Richards

N N et 0rt=Modelo exponencial

NK

1 et a rt=+ −Modelo logístico

Área bajo la curva.

Se tiene que ajustar el modelo seleccionado según el patrón que presenten los datos al realizar la gráfica.

A partir del modelo ajustado se utiliza la formula de Simpson para determinar el área bajo la curva

( )= + + + + + +Δx

y y y y y yn34 2 4 20 1 2 3 4 ........Área

Δx = incremento

n = Numero de segmentos deseados (debe ser par)

Máximo

Se deriva al modelo ajustado, con respecto a la variable que representa al tiempo.

Se encuentran la raíz de la derivada del modelo

Se determina el máximo del modelo ajustado

Tiempo (días)

% de daño

10 3

20 5

30 20

40 45

50 85

60 95

70 100

80 100

t % % esperado10 3 1.05120 5 4.52030 20 17.44240 45 48.68750 85 81.42860 95 95.90670 100 99.89380 100 100.83

=+ −

10111 6 05 0 1494

.. .e tN

K1 et a rt=+ −

= (80 –

10) / 8 = 8.75

( )= + + + + + +Δx

y y y y y yn34 2 4 20 1 2 3 4 ........Área

[ ]8 753

1051 4 4 52 2 17 442 10083.

. ( . ) ( . ) ..... .+ + + +=

= 3172.9

Δx

El calculo de área bajo la curva sirve para comparar, mediante la técnica de análisis de varianza, si el progreso de una enfermedad es el mismo para diferentes variedades de un cultivo.

Por su atención gracias