diseños con medidas repetidas

Upload: jennycitas-esquivel

Post on 04-Apr-2018

228 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    1/19

    Introduccion al diseno de experimentos

    Luis Cayuela

    Junio de 2010

    EcoLab, Centro Andaluz de Medio Ambiente, Universidad de Granada Junta

    de Andaluca, Avenida del Mediterraneo s/n, E-18006, Granada. E-mail:[email protected].

    88

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    2/19

    Introduccion al diseno de experimentos (version 1.0)

    Publicado por: Luis Cayuela

    Se autoriza a cualquier persona a utilizar, copiar, distribuir y modificar estaobra con las siguientes condiciones: (1) que se reconozca la autora de la misma;(2) que no se utilice con fines comerciales; y (3) que si se altera la obra original,

    el trabajo resultante sea distribuido bajo una licencia similar a esta.

    Para cualquier comentario o sugerencia por favor remitirse al autor de la obra.

    89

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    3/19

    Indice

    1. Diseno factorial 91

    2. Diseno por bloques 92

    2.1. Supuestos estadsticos . . . . . . . . . . . . . . . . . . . . . . . . 93

    3. ANOVA de medidas repetidas 93

    3.1. Ventajas del ANOVA de medidas repetidas . . . . . . . . . . . . 95

    3.2. Inconvenientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

    3.3. Supuestos estadsticos . . . . . . . . . . . . . . . . . . . . . . . . 96

    3.4. Diseno por bloques o medidas repetidas? . . . . . . . . . . . . . 96

    4. Split-plot 97

    4.1. Supuestos estadsticos . . . . . . . . . . . . . . . . . . . . . . . . 99

    5. ANOVA anidado o jerarquizado 99

    5.1. Psuedorreplicacion . . . . . . . . . . . . . . . . . . . . . . . . . . 101

    6. Modelos mixtos 103

    6.1. Efectos fijos o aleatorios? . . . . . . . . . . . . . . . . . . . . . . 105

    6.2. Modelos mixtos una alternativa para representar y analizar otrosdisenos de experimentos? . . . . . . . . . . . . . . . . . . . . . . 105

    6.3. Cuatro preguntas que hay que hacerse sobre el diseno de experi-mentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

    7. Ejercicios 106

    90

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    4/19

    Luis Cayuela Introduccion al diseno de experimentos

    1. Diseno factorial

    El diseno factorial, como estructura de investigacion, es la combinacion de doso mas disenos simples (o unifactoriales). El diseno factorial requiere lamanipulacion simultanea de dos o mas variables independientes (llamadosfactores), en un mismo experimento. Este tipo de disenos se analizan pormedio del analisis de la varianza (ANOVA, del ingles Analysis of Variance).Estos modelos han de cumplir los siguientes requisitos:

    1. Asumen muestras independientes (los efectos se miden entre-sujetos);

    2. Tienen todos los niveles de un factor representados en los niveles de losotros factores (cruzados);

    3. Representan efectos fijos, es decir, que han sido pre-definidos por elexperimentador.

    Ejemplo 1: se quiere ver como dos factores, luz y agua, afectan al crecimientode una planta. Cada uno de estos factores tiene dos niveles (alto, bajo).Un diseno factorial completo con dos niveles se disenara de tal maneraque tuvieramos sujetos independientes muestreados bajo todas lascombinaciones posibles de cada uno de los dos niveles de luz y agua,como muestra la siguiente figura. Como los niveles de estos dos factoreshan sido definidos a priori y constituyen los unicos niveles que nosinteresan en este estudio, representan efectos fijos.

    Una representacion esquematica de este diseno vendra dada de la siguienteforma:

    91

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    5/19

    Luis Cayuela Introduccion al diseno de experimentos

    En ocasiones, estos requisitos no se cumplen, por lo que es necesario utilizarotros disenos de experimentos alternativos como:

    1. Diseno por bloques;

    2. ANOVA de medidas repetidas (factores dentro de sujetos);

    3. Split-plot (factores entre y dentro de sujetos);

    4. ANOVA anidado o jerarquizado (los niveles de un factor no secruzan con todos los niveles del otro u otros factores);

    5. Modelos mixtos (efectos fijos y efectos aleatorios).

    2. Diseno por bloques

    Al estudiar la influencia de un factor sobre una variable cuantitativa esfrecuente que aparezcan otras variables o factores que tambien influyen y quedeben ser controladas. A estas variables se las denomina variables bloque, y

    se caracterizan por:

    1. No son el motivo del estudio sino que aparecen de forma natural yobligada en el mismo.

    2. Tradicionalmente se asuma que no tienen interaccion con el factorprincipal, aunque hoy en da este supuesto ya no tiene por que hacerse.

    Ejemplo 2: Sobre el ejemplo anterior, imaginemos que parte de las plantasque estamos creciendo en condiciones experimentales se encuentran enun invernadero en Guadalajara y otra parte en un invernadero en

    92

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    6/19

    Luis Cayuela Introduccion al diseno de experimentos

    Toledo. Podemos pensar que la situacion geografica (clima general,

    naturaleza del sustrato en donde hacemos crecer las plantas, etc) puedeinfluir sobre la variable respuesta. Como esta variable no es de interespara el estudio pero queremos controlar como afecta a la variabilidad dela variable respuesta, la introducimos como un bloque en el analisis.

    Recordemos que:

    El modelo se dice que es de bloques aleatorizados completos cuandoen cada bloque se presentan todos los posibles tratamientos (o unmultiplo de ese numero) y dentro de cada bloque se asignan lostratamientos de forma aleatoria.

    En ocasiones no se pueden asignar todos los tratamientos sobre cadabloque, de modo que se tienen los disenos por bloques aleatorizadosincompletos.

    2.1. Supuestos estadsticos

    En principio los mismos supuestos que cualquier modelo lineal, es decir:normalidad, homocedasticidad, linealidad e independencia de los residuos(entre otras cosas, para eso incluimos un factor en el analisis). Recordemos quelos supuestos del modelo siempre se comprueban sobre los residuos.

    3. ANOVA de medidas repetidas

    Este diseno se aplica cuando todos los niveles del factor se aplican a losmismos sujetos. La variabilidad que existe entre los niveles del factor se mide

    93

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    7/19

    Luis Cayuela Introduccion al diseno de experimentos

    dentro de los sujetos y no entre sujetos.

    El diseno mas sencillo de medidas repetidas consiste en medir dos variables (ej.dieta A y dieta B) en una misma muestra de sujetos. Los datos de este disenose analizaran con lo que se conoce como la prueba T para muestrasrelacionadas. Pero los disenos de medidas repetidas pueden tener mas de dosvariables (esto es, niveles del factor, en el ejemplo anterior el factor sera tipode dieta y los niveles A, B, C, ..., F).

    Ejemplo 3: Imaginemos una investigacion disenada para conocer el efecto decuatro tipos de dietas sobre el engorde de los cerdos. Podemos optar porseleccionar tantos grupos de sujetos como dietas disponibles (cuatro) ysometer a cada grupo a un unico tipo de dieta. De esta maneratendremos un diseno con un factor (tipo de dieta, con cuatro niveles) y

    tantos grupos de sujetos como niveles del factor (cuatro). Para analizarlos datos de este diseno podemos utilizar un ANOVA de un factorcompletamente aleatorizado.

    En lugar de esto, podemos seleccionar un unico grupo de sujetos ysometerles de manera secuencial (dejando un intervalo de tiempo entre la

    aplicacion de una dieta y otra) a los cuatros tipos de dietas distintas. Eneste caso seguiremos teniendo un diseno de un factor (tipo de dieta, concuatro niveles), pero un solo grupo de sujetos que hacemos pasar por lascuatro condiciones definidas por los niveles del factor (tendremos a todoslos sujetos sometidos a todas las dietas). Para analizar los datos de estediseno podemos utilizar un ANOVA de medidas repetidas.

    94

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    8/19

    Luis Cayuela Introduccion al diseno de experimentos

    Ejemplo 4: Se quiere ver el efecto de 3 tratamientos de depuraci on de aguasresiduales distintos sobre la produccion de vertidos contaminantes al

    cauce de un ro. Se prueban los tres tratamientos de manera consecutivaen 12 fabricas distintas y despues de implementar cada uno de lostratamientos de miden la produccion de vertidos contaminantes.

    Ejemplo 5: En un estudio agrcola, se quiere ver el efecto de distintosfertilizantes (A, B, C, D) sobre la produccion de patatas. Se toman 20parcelas y cada una se subdivide en cuatro partes iguales y se aplica acada sub-parcela un fertilizante distinto.

    3.1. Ventajas del ANOVA de medidas repetidas

    Requieren menos sujetos que un diseno totalmente aleatorizado.

    Se controla la variabilidad debida a la diferencia entre sujetos.

    3.2. Inconvenientes

    Efecto de arrastre (carry-over effects) ocurre cuando se administrauna condicion antes de que haya terminado el efecto de otraadministrada previamente.

    Efecto del aprendizaje por la practica ocurre cuando las respuestas delos sujetos pueden mejorar con la repeticion (los ultimos tratamientos

    95

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    9/19

    Luis Cayuela Introduccion al diseno de experimentos

    parecen mas efectivos que los primeros). Por ello es conveniente

    aleatorizar los tratamientos dentro de cada sujeto, como en el ejemplo 3.

    3.3. Supuestos estadsticos

    Los mismos que para cualquier modelo lineal (normalidad, homocedasticidad,linealidad e independencia), pero ademas hay una nueva hipotesis que es lahipotesis de esfericidad. Esta hipotesis hace referencia a que los niveles delfactor tienen que estar igualmente correlacionados dos a dos. Si la respuesta deun individuo a uno de los tratamientos es muy distinta a la del resto de losindividuos muestreados, esta diferencia debera mantenerse en todos lostratamientos. La prueba de esfericidad de Mauchly comprueba la hipotesisnula de que las correlaciones entre los pares de niveles del factor son iguales.

    Esto es equivalente a decir que no hay interaccion entre los sujetos (comobloque) y el factor.

    3.4. Diseno por bloques o medidas repetidas?

    Como podemos observar, hay una similitud muy grande entre el ANOVA demedidas repetidas y el ANOVA por bloques... es tanta la similitud quepodemos decir que en realidad es lo mismo desde un punto de vistaconceptual, aunque ya veremos que asumir un diseno por bloques aleatorizadoso un diseno de medidas repetidas puede implicar un analisis de los datosligeramente diferente.

    96

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    10/19

    Luis Cayuela Introduccion al diseno de experimentos

    Bloques Medidas repetidas

    Generalmente en un contexto masespacial, en donde una serie demuestras estan agrupadas dentro,por ejemplo, de una misma regiongeografica (ver ejemplos 2 y 5).

    Se produce con mayor frecuencia(pero no exclusivamente) en uncontexto temporal, con individuos alos que se aplica distintostratamientos (niveles del factor deinteres) en el tiempo (ver ejemplos 3y 4).

    El bloque es una caracterstica delas unidades experimentales quepodemos posteriormente incorporaral diseno experimental.

    En el ANOVA de medidas repetidasla aleatorizacion total de lasmuestras es una restriccion delpropio diseno experimental y nouna caracterstica o condicion de lasunidades experimentales.

    En el diseno por bloques, cadabloque puede contener replicas deuno o varios de los niveles del factor.

    En el diseno de medidas repetidascada sujeto experimenta todos o almenos varios de los niveles delfactor, pero -salvo raras ocasiones-no hay posibilidad de replicas.

    Los bloques afectan a un conjuntode individuos que, de alguna forma,sustentan algun grado dedependencia.

    Los disenos de medidas repetidashacen referencia a sujetosindependientes entre s, pero queexperimentan cada uno de ellos losdistintos niveles del facto. A veces,la dificultad puede estribar endefinir lo que es un sujeto

    muestral.

    Todas estas diferencias, mas bien sutiles, nos complican mas que nos ayudan.As pues es mejor que intentemos ver las similitudes y no las diferencias entreestos dos tipos de disenos experimentales. Desde esta perspectiva podemosconsiderar el bloque como equivalente a la restriccion de la aleatorizacion delos niveles del factor estudiado dentro de individuos en el ANOVA demedidas repetidas y vice-versa. Lo importante aqu es que la variabilidaddentro de este factor (bloque o individuo) es intra-sujeto. Cuando tenemosvariabilidad entre sujetos la variabilidad del factor estudiado (por ejemplo tipode dieta) se puede confundir con respuestas diferenciales de los individuos a losdistintos niveles del factor. Por ejemplo, cerdos de mayor complexion puedenengordar menos con una dieta mas calorica, o cerdos machos y hembras

    pueden responder de distinta manera a los distintos tipos de dieta. Cuando lavariabilidad es intra-sujetos significa que toda esta variabilidad atribuible alas diferencias existentes entre distintos individuos se elimina, ya que estamoscomprobando los efectos de los distintos niveles del factor de interes dentro decada sujeto.

    4. Split-plot

    Ahora que ya hemos visto el concepto de factor intra-sujetos en el contextodel ANOVA por bloques aleatorizados o el ANOVA de medidas repetidas,

    97

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    11/19

    Luis Cayuela Introduccion al diseno de experimentos

    estamos en disposicion de entender mucho mas facilmente el diseno de tipo

    split-plot. El diseno de tipo split-plot se aplica cuando tenemos un factorintra-sujetos (como en el modelo de medidas repetidas) y un factorinter-sujetos (como en el ANOVA factorial aleatorizado). Son por tantomodelos que combinan dos tipos de factores (por su naturaleza inter- ointra-sujetos).

    Los disenos de tipo split-plot se originaron en el campo de la agronoma, peroocurren frecuentemente en otros ambitos. Como su nombre indica, las parcelasexperimentales son divididas en varias subparcelas. La parcela es sometida aun unico nivel de uno de los factores (efecto entre-sujetos) mientas que losniveles del otro factor son aplicados a cada una de las subparcelas (efectointra-sujetos). Este tipo de disenos surgen como consecuencia generalmente derestricciones impuestas en las condiciones de experimentacion, lo que impide

    una completa aleatorizacion del diseno.

    Ejemplo 6: Queremos investigar el efecto de tres frecuencias de riego (diario,cada dos das, cada tres das) y cuatro variedades de semilla (A, B, C, D)sobre la produccion de alfalfa. Bajo un diseno totalmente aleatorizadotendramos que seleccionar parcelas de cultivo independientes entre s ysometerlas a todas las posibles combinaciones de los dos factores riego xvariedad. Es decir que tendramos que asignar parcelas a un mnimo de 3x 4 = 12 grupos y, para tener replicas dentro de cada grupo y poder verel efecto de la interaccion entre estos dos factores necesitaramos almenos 24 parcelas de cultivo. En experimentacion agrcola esto suponeuna limitante muy importante. Una opcion sera subdividir cada parcelade cultivo en doce subparcelas y aplicar en cada una de ellas una

    combinacion de los niveles de los dos factores investigados. De estamanera con 6 parcelas tendramos un total de 6 x 12 = 72 muestras, esos, no independientes entre s. Una manera de analizar estos datos serapor medio de un anova factorial completo con un bloque (parcela, con 6niveles) o un anova factorial completo de medidas repetidas, en donde elriego y la variedad seran dos factores intra-sujetos.

    Ahora imaginemos que no podemos imponer distintos tipos de riegodentro de cada parcela. Una opcion sera subdividir cada parcela encuatro subparcelas y aplicar en cada una de ellas una variedad desemilla. Y podramos aplicar cada tipo de riego a dos parcelas distintas.Tendramos ahora 6 x 4 = 24 muestras, no independientes entre s, pero

    98

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    12/19

    Luis Cayuela Introduccion al diseno de experimentos

    con un grado menor de independencia que en el caso anterior ya que hay

    un factor, que es el riego, cuyo efecto se mide entre sujetos.

    Ejemplo 7: En un estudio de produccion animal, se trata de ver la influenciade 4 tipos de dietas distintas sobre el engorde de los cerdos. Para ello sesometen 30 cerdos a cada uno de los 4 tratamientos durante un ciertoperiodo de tiempo. Los individuos sometidos a los distintos tratamientospertenecen a 3 razas distintas de cerdos

    Diseno split-plot:- Factor intra-sujetos = Dieta (I = 4).- Factor inter-sujetos = Raza porcina (J = 3).

    Ejemplo 8: En un estudio agrcola, se quiere ver el efecto de distintosfertilizantes (A, B, C, D) y distintos tipos de suelos (arcillosos vs.calcareos) sobre la produccion de patatas. Se toman 10 parcelas en suelosarcillosos y 10 parcelas en suelos calcareos, y cada una se subdivide encuatro partes iguales y se aplica a cada sub-parcela un fertilizantedistinto.

    Diseno split-plot:- Factor intra-sujetos = Fertilizante (I = 4).- Factor inter-sujetos = Tipo de suelo (J = 2).

    4.1. Supuestos estadsticos

    Los mismos que para el diseno de medidas repetidas, teniendo en cuenta que elsupuesto de esfericidad hace referencia solamente a los niveles del factorintra-sujetos.

    5. ANOVA anidado o jerarquizado

    Hasta ahora todos los disenos de experimentos que hemos visto son cruzados(crossed). Los disenos cruzados son aquellos en donde existen todas lascombinaciones posibles de los niveles de los factores (ver Ejemplo 1). A veces

    99

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    13/19

    Luis Cayuela Introduccion al diseno de experimentos

    puede ocurrir que En algunos disenos puede ocurrir que tengamos algunos

    niveles de un factor combinados con unos niveles determinados de otro factor,sin que exista una representacion de todas las posibles combinaciones de losniveles de los factores

    Ejemplo 9: Se investiga el efecto del riego (riego, no riego) y cuatrovariedades de semilla (A, B, C, D) sobre el porcentaje de germinacion deuna especie lenosa utilizada en la restauracion de taludes.

    El factor anidado es, por lo general, un factor aleatorio (ver seccion 6).

    Ejemplo 10: Se quiere estudiar el efecto de una droga en hombres y mujeres.Se toman 8 individuos (4 hombres y 4 mujeres). A 2 hombres y a 2mujeres se les suministra la droga, y al resto se les da un placebo. Setoma a cada individuo tres muestras de sangre y se mide laconcentracion de la droga en sangre.

    - Factor 1 = droga (control, droga)- Factor 2 = sexo (hombre, mujer)

    Estos dos factores son cruzados, porque tenemos una representacion detodos los niveles del factor 2 (sexo) en todos los niveles del factor 1

    (droga). Si solo hubieramos tomado una muestra de cada individuo,tendramos muestras independientes entre s y por tanto un disenoANOVA de dos factores completamente aleatorizado. Pero... tenemostres muestras de cada individuo Cada individuo debe ser tratado, portanto, como un factor anidado dentro de cada una de las combinacionesde los niveles cruzados. El factor individuo es aleatorio, porquerepresenta una muestra de la poblacion (n = 20) de todos los posiblestratamientos.

    100

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    14/19

    Luis Cayuela Introduccion al diseno de experimentos

    5.1. Psuedorreplicacion

    La pseudorreplicacion ocurre cuando analizas los datos como si tuvieras masgrados de libertad de los que realmente tienes. Hay dos tipos depseudorreplicacion: (1) temporal, que implica re-muestreos de los mismosindividuos1; y (2) espacial, que implica que las muestras han sido tomadas enpuntos proximos entre s. La pseudorreplicacion supone un problema graveporque uno de los supuestos mas importantes de los analisis estadsticosestandar es la independencia de los errores. La pseudorreplicacion temporal

    tendra errores no independientes porque las peculiaridades de los individuosremuestreados quedaran reflejadas en todas las medidas tomadas sobre ellos(es decir, las muestras procedentes de los mismos individuos estarancorrelacionadas unas con otras). Las muestras tomadas en puntos pr oximosentre s tendran errores no independientes porque las peculiaridades de lalocalidad seran comunes a todas las muestras (por ejemplo, si varias muestrasproceden de una zona con suelos muy fertiles, los valores de crecimiento enplantas seran todos muy altos y parecidos entre s).

    La pseudorreplicacion es, por lo general, bastante facil de distinguir. Lapregunta que hay que hacerse es la siguiente: Cu antos grados de libertad paralos errores tiene el experimento realmente? Si un experimento de campo parecetener muchos grados de libertad, es posible que este pseudorreplicado.

    Tomemos un ejemplo procedente del control de plagas de insectos en plantas.Tenemos 20 parcelas, 10 fumigadas y 10 no fumigadas. Dentro de cada parcelahay 50 plantas. Cada planta es medida 5 veces para asegurar que la medici onesta bien hecha. Este experimento genera 20x50x5 = 5000 valores. Hay dostratamientos (fumigado, no fumigado), as que debe de haber un grado delibertad para el factor y 4998 grados de libertad para el termino error.Contemos ahora las replicas (es decir, muestras independientes queexperimentan el mismo nivel o combinaciones de los niveles de los factores)

    1Cuando existe pseudorreplicacion los individuos remuestreados representan un unico ni-

    vel del factor. No confundir por tanto con los disenos de medidas repetidas, en donde cada

    individuo experimenta distintos niveles del factor.

    101

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    15/19

    Luis Cayuela Introduccion al diseno de experimentos

    que hay en este experimento. Los remuestreos hechos sobre las mismas plantas

    (las cinco muestras por planta) no son replicas. Las 50 plantas individualesmedidas dentro de cada parcela tampoco son replicas ya que es muy probableque las condiciones de cada parcela sean unicas y afecten por igual a cadagrupo de 50 plantas muestreadas dentro de ellas independientemente de laaplicacion o no de la fumigacion. Hay 10 parcelas fumigadas y 10 no fumigadasy cada parcela va a proporcionar un unico valor no independiente de lavariable respuesta (por ejemplo, la proporcion del area de las hojas comida porlos insectos). Por tanto, habra 9 grados de libertad dentro de cada nivel delfactor, y 9x2=18 grados de libertad para el termino error en el experimento ensu conjunto. No es difcil encontrar ejemplos de pseudorreplicacion parecidos aeste en la literatura cientfica. El problema es que, si no se identificacorrectamente la existencia de pseudorreplicacion, podemos acabar sacandoconclusiones equvocas sobre la significacion de los resultados (con 4998 grados

    de libertad para el termino error, es casi imposible no detectar algunadiferencia estadsticamente significativa).

    Hay varias cosas que se pueden hacer cuando tus datos estanpseudorreplicados:

    Promediar la pseudorreplicacion y llevar a cabo tu analisis estadsticocon las medias;

    Hacer un analisis separado para cada periodo de tiempo en el caso de lapseudorreplicacion temporal;

    Utilizar un analisis de series temporales o modelos mixtos.

    Ejemplo 11: Se toman tres muestras de agua de tres pozos distintos. Concada muestra se hacen dos determinaciones del contenido de fluoratos enel agua (miligramos/litro de agua). Se quiere ver si hay diferencias en loscontenidos de fluorato entre los tres pozos.

    - Factor 1 = localidad (A, B, C).- Factor 2 (anidado en F1) = muestra (1, .., 9).

    102

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    16/19

    Luis Cayuela Introduccion al diseno de experimentos

    Ejemplo 12. Se quiere ver el efecto de la luz artificial sobre la producci on de

    distintas especies de cereal. Se toman 4 invernaderos: 2 con luz natural, y2 con luz artificial. En cada uno de los 4 invernaderos se plantan lasmismas 3 especies de cereal. En cada invernadero se toman 5 muestrasde cada especie y se calcula la productividad (kg/ha).

    - Factor 1 = luz (2 niveles).- Factor 2 (anidado en F1) = invernadero (cuatro niveles).- Factor 3 = especie (tres niveles).

    6. Modelos mixtos

    Son una expansion de los modelos lineales generales que permite la inclusionde variabilidad correlacionada y no constante. Los modelos mixtosproporcionan, por tanto, la flexibilidad necesaria para modelar no solo lasmedias, sino tambien las varianzas y covarianzas de los datos. Los modelosmixtos son llamados as porque incluyen dos tipos de factores:

    1. Factores fijos. Son todos aquellos factores cuyos niveles han sidodefinidos a priori. Las conclusiones que saquemos de nuestro estudio no

    pueden, por tanto, extrapolarse a otros niveles del factor que no hayansido incluidos en el modelo. Afectan solo a la media de y.

    2. Factores aleatorios. Son todos aquellos factores cuyos nivelesrepresentan una muestra aleatoria de todos los posibles niveles del factor.Las conclusiones que saquemos de nuestro estudio se refieren a todos losposibles nivels del factor, aunque no esten recogidos de forma explcitaen el experimento. Afectan solo a la varianza de y.

    A veces una variable explicativa representa una agrupacion en el espacio otiempo. Este tipo de disenos contradice los supuestos basicos de los modelos

    103

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    17/19

    Luis Cayuela Introduccion al diseno de experimentos

    estadsticos estandar: la independencia de los errores. Los modelos mixtos

    tienen en cuenta esta no-independencia de los errores al modelar la estructurade la covarianza introducida por el agrupamiento de los datos. Una de lasgrandes ventajas de los modelos mixtos es que economizan grados de libertadtpicamnete utilizados por los niveles del factor. En vez de estimar una mediapara cada uno de los niveles del factor, el modelo de efectos aleatorios estimala distribucion de las medias (normalmente como la desviacion estandar de lasdiferencias de las medias de cada uno de los niveles del factor alrededor de lagran media). Los modelos mixtos son particularmente utiles en los casos endonde hay pseudorreplicacion temporal (medidas repetidas) o espacial (disenosanidados o experimentos de tipo split-plot). En definitiva, los modelos mixtosnos van a permitir, por un lado, no desperciar grados de libertad en laestimacion de los parametros de cada uno de los niveles del factor deagrupacion y, por otro, hacer uso de todas las mediciones que hemos realizado.

    Un efecto aleatorio debera ser considerado como que proviene de unapoblacion de posibles efectos: la existencia de esta poblacion de posiblesefectos es un supuesto extra que debemos de considerar en el caso de losmodelos mixtos. As pues es mas propio hablar de predicion de efectosaleatorios que de estimacion de efectos aleatorios. Estimamos los efectos fijos apartir de los datos, pero hacemos predicciones sobre la poblaci on de la cualproceden nuestros efectos aleatorios. Los efectos fijos son constantesdesconocidas que estimamos a partir de los datos. Los efectos aleatoriosgobiernan la estructura de varianza-covarianza de la variable respuesta. Losefectos fijos son a menudo tratamientos experimentales que fueron aplicadosbajo nuestra direccion, y los efectos aleatorios son variables que se distinguenpor el hecho de que no nos interesan desde el punto de vista de los parametros

    sino de la varianza que explican.

    Otra diferencia importante entre efectos fijos y aleatorios es que los efectosfijos tienen niveles del factor informativos, mientras que los efectos aleatoriostienen niveles del factor que no son informativos. La diferencia se ve mejorcon un ejemplo. En los mamferos la variable categorica sexo tiene dos niveles:macho y hembra. Para cualquier individuo que encuentres, el saber que es, porejemplo, hembra, implica una gran cantidad de informacion sobre el individuo,y esta informacion se desprende de la experiencia recogida de muchos otrosindividuos hembra. Una hembra tendra una serie de atributos (asociados conel hecho de ser hembra) sin importar la poblaci on a la que pertenezca elindividuo en cuestion. Tomemos ahora una variable categorica como genotipo.Si tenemos dos genotipos en una poblacion podramos etiquetarlos A y B. Sitomamos dos genotipos de otra poblacion diferente podramos etiquetarlosigualmente A y B. En este caso, la etiqueta A no recoge ninguna informacionde referencia sobre el genotipo en cuestion, salvo que es probable que seadiferente al genotipo B. En el caso del sexo, el nivel del factor (macho ohembra) es informativo. Sexo es por tanto un factor fijo. En el caso delgenotipo, el nivel del factor (A o B) no es informativo: genotipo es, por tanto,un factor aleatorio. Los efectos aleatorios tienen niveles del factor que sonextraidos de una poblacion mayor (potencialmente muy grande) en los cualeslos individuos pueden diferir en su respuesta de muchas maneras, pero endonde nosotros no sabemos exactamente como o por que difieren.

    104

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    18/19

    Luis Cayuela Introduccion al diseno de experimentos

    6.1. Efectos fijos o aleatorios?

    Es difcil decidir si utilizar una variable explicativa categorica como efectosfijos o aleatorios. A continuacion se dan algunas claves que nos pueden ayudara decidir:

    Estoy interesado en el tamano del efecto? Si la respuesta es s, entoncesfactor fijo.

    Es razonable asumir que los niveles del factor provienen de unapoblacion de niveles? Si la respuesta es s, entonces factor aleatorio.

    Hay suficientes niveles del factor a partir de los cuales estimar lavarianza de los efectos de la poblacion? Si la respuesta es no, entonces

    factor fijo. Zuur et al. (2007) estiman que al menos 5 niveles del factorson necesarios para poder considerar un factor como aleatorio, aunque espreferible que haya mas de 10 niveles para esto. En cualquier caso si solohay 2 o 3 niveles siempre se ha de tratar un factor como fijo.

    Son los niveles del factor informativos? Si la respuesta es s, entoncesfactor fijo.

    Son los niveles del factor simplemente etiquetas numericas? Si larespuesta es s, entonces generalmente factor aleatorio.

    6.2. Modelos mixtos una alternativa para representar y

    analizar otros disenos de experimentos?Los modelos mixtos ofrecen una alternativa (pero no la unica) para larepresentacion y analisis de los disenos de experimentos mas alla de los disenosfactoriales completamente aleatorizados, es decir, para todos los otros disenosvistos en este curso, incluyendo el diseno por bloques aleatorizados, los disenosde medidas repetidas, los split-plot y los disenos anidados o jerarquizados.Cualquier factor cuya respuesta se mida dentro de los sujetos (como en el casode los disenos de medidas repetidas o el split-plot y la mayora de los disenosanidados van a estar representados de alguna manera por un factor deagrupacion cuyos efectos son aleatorios. En la siguiente sesion se vera comoanalizar este tipo de disenos utilizando modelos mixtos.

    6.3. Cuatro preguntas que hay que hacerse sobre eldiseno de experimentos

    105

  • 7/30/2019 diseos con MEDIDAS REPETIDAS

    19/19

    Luis Cayuela Introduccion al diseno de experimentos

    7. Ejercicios1. Se quiere ver como el efecto de la exposicion (solana, umbra, rambla) y

    la localidad (Tarbena, Crevillente) afectan al tamano de las hojas (encm2) de encina. Para ello se disena un experimento en donde seseleccionan aleatoriamente 24 individuos en tres zonas de solana, umbray rambla respectivamente dentro de cada una de las dos localidades deestudio. A cada individuo se le miden 20 hojas para evitar datos quepudieran ser atpicos. Como es la naturaleza de cada uno de losfactores?

    2. En un experimento agrcolA se quiere investigar como la produccion deun determinado cultivo depende de tres variables: irrigacion (con dosniveles: regado o no); densidad de siembra (con tres niveles: baja, mediay alta); y fertilizacion (con tres niveles: baja, media y alta). El disenoexperimental se plantea de la siguiente manera: se eligen cuatro parcelasagrcolas independientes entre s. Dichas parcelas son subidividas en dosy a cada una de ellas se le aplica aleatoriamente uno de los dostratamientos de irrigacion. Cada una de estas subparcelas es a su vezdividida en tres partes y se aplica a cada una de ellas de maneraaleatoria uno de los tres niveles de densidad de siembra. Por ultimo, acada una de estas subparcelas mas pequenas se las divide en tres y seaplica a cada una de ellas uno de los tres niveles de fertilizacion.Cuantos factores hay y cual es la naturaleza de cada uno de ellos?

    3. En un experimento se quiere ver como el tipo de habitat (bosque,matorral, pastizal) y distintos escenarios de cambio climatico (control,aumento de la lluvia, disminucion de la lluvia) pueden afectar diferentesrespuestas en varias especies tpicamente mediterraneas. Para ello seselecciona una zona de bosque, una de matorral y una de pastizal, todasproximas entre s. En cada una de ellas se instalan 8 parcelas de 2 x 2 m.Cada parcela es subdividida en 9 subparcelas y se simulan en tres decada 9 uno de los tres escenarios de cambio clim atico. Se plantan semillasde las plantas objeto de estudio y se miden las respuestas al cabo de untiempo (porcentaje de germinacion, crecimiento, produccion de biomasalenosa, etc). Cuantos factores tenemos en este estudio y como son?

    106