problemes anova

Download Problemes anova

Post on 16-Apr-2017

50 views

Category:

Education

0 download

Embed Size (px)

TRANSCRIPT

  • Pgina 1

    Problemes de bioestadstica (ANOVA) EJEMPLO 1: DISEO DE UN FACTOR En un experimento, se compara la expresin de un gen (medida en concentracin de proteina) en tres mutantes (A,B,C). Los datos obtenidos en 9 cultivos de cada mutante son:

    A 12.2 13.4 11.3 13.0 11.1 11.3 12.2 13.3 11.1

    B 12.3 14.2 11.4 12.4 11.6 13.2 13.1 14.1 15.0

    C 12.3 14.6 11.9 12.1 11.0 13.0 12.2 11.4 14.0

    De acuerdo con estos datos se pide: (1) Definir un data.frame para estos datos:

    De acuerdo con esto, tendremos:

  • Pgina 2

    (2) Determinar si la expresin de esta protena es distinta en los mutantes estudiados. Podemos explorar la distribucin de la concentracin de protena en las muestras de cada mutante:

    Parece que el mutante B expresa algo ms de protena. Podemos explorar las medias de expresin para cada mutante:

  • Pgina 3

    Los IC de las medias son muy amplios ya que tenemos pocas observaciones. La media de la muestra del mutante B es algo ms alta, pero, probablemente, no sea significativamente distinta de los otros mutantes. Para evaluar esta conclusin, analizaremos los datos utilizando ANOVA (un factor con tres niveles):

    Comprobamos que el efecto del tipo de mutante no determina medias distintas en el nivel de expresin de esta protena (p=0.23). Podemos estimar las medias de cada mutante:

    De acuerdo con este resultado: 5.124.01.12;03.1393.01.12;1.12 ABA .

  • Pgina 4

    Podemos obtener directamente este resultado, ajustando un modelo sin interseccin:

    Los IC de las medias estimadas es:

    Este resultado es distinto de los IC que obtendramos en cada mutante analizado individualmente:

  • Pgina 5

    (3) Comparaciones mltiples Finalmente, obtendremos los IC para las diferencias de las medias de expresin de cada mutante:

    Estos intervalos son distintos de los que obtendramos comparando dos a dos los mutantes. Por ejemplo, La diferencia B-A obtenida individualmente sera:

    Podemos expresar grficamente los IC de las diferencias obtenidas a partir del anlisis de la varianza:

  • Pgina 6

    (4) Conclusiones Aunque la descriptiva de los datos sugiere que el mutante B tiene unos niveles medios de expresin ms elevados, los resultados del ANOVA indican que las diferencias no son significativas (p=0.23). Los IC de las medias por mutante y de las diferencias de medias entre mutantes sugieren que sera conveniente aumentar los tamaos muestrales para obtener una mejor estimacin. Con todo, los intervalos obtenidos sugieren que, caso de existir, las diferencias entre mutantes no sern muy elevadas. EJEMPLO 2: DISEO DE DOS FACTORES En un experimento, se evala el efecto del pH y la temperatura en el rendimiento de un proceso. Los datos son:

  • Pgina 7

  • Pgina 8

    (1) Caracterizar la respuesta segn el pH Podemos calcular las medias y su IC segn el pH:

    (2) Rendimiento segn la temperatura

  • Pgina 9

    (3) Efecto del pH y la temperatura en el rendimiento medio

    (4) Ajuste del modelo Podemos evaluar el efecto de los dos factores, pH y temperatura, ajustando el modelo lineal:

    ijkijjiijky

    En funcin de estos resultados, concluimos que tanto el pH (p=7.43e-08) como la temperatura (p=1.52e-05) tienen efectos significativos. La interaccin tambin es significativa (p=0.021).

  • Pgina 10

    (5) Estimacin de los efectos Podemos estimar los efectos mediante:

    R no proporciona la estimacin de los coeficientes del modelo. La interpretacin de los resultados de R es algo complicada. El primer nivel de cada factor no aparece y se encuentra agrupado en el trmino de interseccin. A continuacin, aparecen los valores que hay que aadir a la interseccin para obtener la medias de los niveles del primer factor (pH) para el primer nivel del segundo (30 grados). A continuacin, los valores que hay que aadir para obtener las medias para cada nivel del segundo factor. Finalmente las interacciones. En este caso concreto, tenemos:

    pH () Temp () ij

    Basico 30 24.961111 96.24

    Neutro 30 24.524.962112 101.48

    Acido 30 54.524.963113 101.78

    Basico 35 64.424.961221 100.88

    Neutro 35 80.464.424.524.962222 101.32

    Acido 35 46.264.454.524.963223 103.66

    Basico 40 74.424.961331 100.98

    Neutro 40 70.374.424.524.962332 102.52

    Acido 40 44.074.454.524.963333 106.96

  • Pgina 11

    (6) Comparaciones dos a dos El mtodo de Tukey permite comparar las medias dos a dos y obtener los IC de las diferencias. Estos resultados, como en el caso de un factor, no son los mismos que obtendramos calculandos los IC de la diferencia de medias individualmente para cada par de casos. El mtodo de Tukey es el que debe utilizarse si estamos interesados en los IC simultneos de todos los casos. Como el modelo se ha ajustado como un modelo lineal, debemos hacer:

  • Pgina 12

    Podemos ver los intervalos para el pH:

    Comprobamos que el pH bsico es el que proporciona un rendimiento medio menor. El cido proporciona un rendimiento mejor que el neutro. Por lo tanto, podemos concluir que el rendimiento se incrementa en el sentido bsico

  • Pgina 13

    PROBLEMAS ENUNCIADO Se ha diseado un experimento para determinar el efecto de la temperatura en el rendimiento de una fermentacin. Se han probado cuatro temperaturas: 30, 35, 40 y 45oC. El resultado del anlisis de los datos obtenidos es:

  • Pgina 14

    PREGUNTA 1 De acuerdo con estos resultados:

    1) El efecto de la temperatura es significativo (p=1.011e-08). 2) Los IC de los efectos no permiten concluir que existan diferencias significativas. 3) El efecto de la temperatura no es significativo. 4) El rendimiento aumenta con la temperatura (p=1.011e-08).

    PREGUNTA 2 Siguiendo con los mismos resultados, podemos afirmar que:

    1) El rendimiento a 30 y 35oC es similar. 2) El rendimiento a 30 y 45oC es similar. 3) El mayor rendimiento se obtiene a los 35 oC. 4) El menor rendimiento se obtiene a los 35 oC.

    PREGUNTA 3 Siguiendo con los mismos resultados, qu rendimiento medio se obtiene a los 35 oC?:

    1) 0.8743 2) 25.8892-0.8743 3) 25.8892+0.8743 4) El mismo que con 40 oC.

    FIN DE LAS PREGUNTAS DEL ENUNCIADO ANTERIOR PREGUNTA 4 Considera un experimento con tres tratamientos (A,B,C) en grupos independientes.

    A 10 15 18 11 12 15 16 11

    B 11 12 14 9 14 15 8 12 11

    C 9 12 10 10 9 12 11 11

    Evala si los tratamientos tienen un efecto significativo.

    Qu tratamiento es ms efectivo?

    Cul es la diferencia entre los resultados del tratamiento A y C? PREGUNTA 5 En la base de datos chickwts de R se dispone de los datos de peso de pollos criados con distintos alimentos. Se pide:

    Evaluar si los distintos alimentos tienen un efecto sobre el peso final de los pollos.

    Determinar qu tratamiento es ms efectivo.

    Estimar la diferencia de peso que se espera obtener si se alimentan con soybean o con casein.

  • Pgina 15

    PREGUNTA 6 En la base de datos PlantGrowth de R se dispone de los datos de produccin de plantas en tres condiciones experimentales. Se pide:

    Evaluar el efecto de los tratamientos.

    Estimar la diferencia de produccin de los dos tratamientos respecto al control.

    Una comparacin de los IC de produccin estimados para cada tratamiento mediante el ANOVA comparndolos con los IC que se obtienen para las medias de cada tratamiento.

    PREGUNTA 7 La base de datos ozone (library DAAG) contiene datos del nivel de ozono por meses en distintos aos. Tomado como datos el nivel medio anual, se pide evaluar si se observa una variacin en dichos valores a lo largo de los aos. Para ello, agrupa los datos en dcadas y determina si se observa una variacin significativa entre dcadas. Cuando se observa una variacin ms importante? PREGUNTA 8 En un experimento se evala el efecto de la temperatura (25,30,35,37oC) y del pH (7.4, 7.8) en el rendimiento de un proceso. El anlisis de los resultados proporciona la tabla siguiente:

    De acuerdo con esto:

    1) El rendimiento medio no vara con la temperatura y el pH. 2) El pH no tiene un efecto significativo sobre el rendimiento. 3) La interaccin no es significativa. 4) El rendimiento aumenta con la temperatura.

    PREGUNTA 9 En un experimento se evala el efecto de la temperatura (25,30,35,37oC) y del pH (7.4, 7.8) en el rendimiento de un proceso. El anlisis de los resultados proporciona la tabla siguiente:

  • Pgina 16

    De acuerdo con esto:

    1) El rendimiento medio no vara con la temperatura y el pH. 2) El pH tiene un efecto significativo sobre el rendimiento. 3) La interaccin es significativa. 4) El rendimiento aumenta con la temperatura.

    PREGUNTA 10 En un experimento se evala el efecto de la temperatura (25,30,35,37oC) y del pH (7.4, 7.8) en el rendimiento de un proceso. El anlisis de los resultados proporciona la tabla siguiente:

    El rendimiento medio esperado del proceso a pH 7.8 y 35oC sera:

    1) 76.04 + 5.44 2) 76.04 + 5.44 - 3.06 4.24 3) 76.04 + 5.44 - 4.24 4) 76.04 - 3.06 - 4.24

    PREGUNTA 11

    Source: {Nigam, A.K. and Gupta V.K., 1979, Handbook on Analysis of Agricultural

    experiments, First Edition, I.A.S.R.I. Publication, New Delhi, pp16-20}.

    A feeding trial with 3 feeds namely (i) Pasture(control), (ii) Pasture and Concentrates

    and (iii) Pasture, Concentrates and Minerals was conducted at the Yellachihalli Sheep

    Farm, Mysore, to study their effect on wool yield of Sheep. For this purpose twenty-five

    ewe lambs were allotted at random to each of the three treatments and the three

    tre