deriva genética, tamanho efetivo populacional e teoria...

40
Deriva genética, tamanho efetivo populacional e teoria neutra Instituto de Biociências USP Diogo Meyer Ridley, 6.5, 6.6, 6.7, 7.1, 7.2 7.3 (não cubro quadro 7.1 e 7.2)

Upload: dotuyen

Post on 17-Dec-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Deriva genética, tamanho efetivo populacional e teoria neutra

Instituto de Biociências USP

Diogo Meyer

Ridley, 6.5, 6.6, 6.7, 7.1, 7.2 7.3 (não cubro quadro 7.1 e 7.2)

2

Deriva para o cenário 3

3

0

0.1

0.2

0.3

0.4

0.5

0.6

1 2 3 4 5 6 7 8 9 10 11 12

Freq

uênc

ia

Gerações

Média freq. alélicas

Média cen. I

Média cen. IV

Média cen. III

Média cen. II

Frequências alélicas (Noturno)

4

0

0.05

0.1

0.15

0.2

0.25

0.3

1 2 3 4 5 6 7 8 9 10 11 12

Variâ

ncia

Gerações

Variância freq. alélicas

Variância cen. I

Variância cen. IV

Variância cen. III

Variância cen. II

Variância de frequências alélicas (Noturno)

5

0

0.1

0.2

0.3

0.4

0.5

0.6

1 2 3 4 5 6 7 8 9 10 11 12

Méd

ia H

eter

ozig

ose

Gerações

Média taxa Heterozigose

H cen. I

H cen. IV

H cen. III

H cen. II

Taxa de heterozigose

60

0.1

0.2

0.3

0.4

0.5

0.6

1 2 3 4 5 6 7 8 9 10 11 12

Het

eroz

igos

e(H

)

Gerações

H observada v.s. H esperada

H. cen. I (N=4)

H. cen. III (N=8)

Linha Teo. N=8

Linha Teo. N=4

Taxa de heterozigose

Conceitos sobre deriva genética

- Aumenta variância entre populações

- Diminui diversidade dentro de populações

- processos são mais rápidos em populações pequenas

Probabilidade de fixação de um alelo

http://www.biology.arizona.edu/evolution/act/drift/frame.html

•Probabilidade de fixação de cada alelo: 1/2N

•Probabilidade de fixação de classe de alelos com i cópias: i/2N

•Fórmula geral para aumento de identidade (por descendência(:

Bases Evolutivas da Variação Genética Humana

________________________________________________________ !

! 5!

1.2.1 Tempo e tamanho populacional na evolução da diversidade O modelo demográfico mais simples e mais usado para descrever o comportamento ideal de linhagens numa população finita é o modelo de Wright-Fisher (W-F). Embora a maioria dos alunos já conheça os pressupostos deste modelo - pelo menos da disciplina de Genética Populacional e Filogeografia - não é claro que tenham a noção exacta de que os principais conceitos da genética de populações estão vinculados a modelos concretos de comportamento demográfico (Ewens, 2004; p. 35-38). Por isso, começo por fazer uma breve revisão do modelo W-F baseada, entre outras, na definição dada em Hein et al. (2005 p. 13-14). A figura 4 mostra um exemplo da evolução da identidade por descendência no modelo W-F, em que se procura relacionar intuitivamente as noções de oscilação de frequências (deriva genética), fixação de linhagens e coalescência num ancestral comum. Esta intuição é aproveitada para abordar a evolução da probabilidade identidade por descendência, F, com a dedução da expressão

Ft =1! (1!12N)t [1]

em que Ft é a probabilidade média de identidade por descendência na geração t contada a partir da geração de referência, e N é o número de indivíduos da população (Hartl e Clark 2007, p. 116-117, por exemplo). A probabilidade média de amostrar ao acaso na geração t duas linhagens que não provenham do mesmo ancestral na geração de referência é 1- Ft.

Figura 4: (a) Exemplo de extinção e fixação de linhagens, no modelo W-F. As cores distinguem linhagens sem relação genealógica conhecida na geração de referência (Gen 0); (b) Trajectória da linhagem fixada; (c) Oscilação das frequências das diferentes linhagens. As imagens do painel (a) foram obtidas com o simulador do programa Hands On Genetics (http://www.handsongenetics.com).

(a) (b)

(c)

0!0.2!0.4!0.6!0.8!1!

Fre

quên

cia

Tempo (gerações)

9

Bases Evolutivas da Variação Genética Humana

________________________________________________________ !!

! 6!

A figura 5 apresenta alguns exemplos da evolução de F que mostram como no modelo W-F o tempo e o tamanho populacional são os únicos factores que condicionam a probabilidade de identidade/diferença por descendência. Os exemplos mostram como, no limite, todas as linhagens descenderão de um único ancestral, sendo a rapidez com que esse limite é atingido inversamente proporcional ao tamanho da população. Como as 2N linhagens da geração de referência têm igual probabilidade de se fixar, a probabilidade de fixação de uma dada linhagem é 1/2N; ou seja, a sua frequência naquela geração (figura 4). De forma geral, a probabilidade de fixação de uma linhagem observada em qualquer geração é a sua frequência nessa geração (Kimura, 1962; cf. Li, 1997; p. 47-48). A influência do tamanho de uma população na evolução da sua diversidade genética é também ilustrada pela expressão que prevê o tempo médio que uma linhagem leva a fixar-se no caso de não se extinguir (tempo condicional de fixação; Kimura e Ohta (1969)):

t fix =!4N(1! p)ln(1! p)

p[2]

em que p é a frequência da linhagem que acabará por fixar-se (cf. Hamilton, 2009; p. 72-73). Para uma linhagem com frequência 1/2N – a frequência de cada uma das linhagens de uma geração de referência– o tempo médio de fixação condicionado à não extinção é de aproximadamente 4N gerações. Embora a demonstração da expressão [2] esteja fora do âmbito da disciplina, para que os alunos tenham a intuição da relação entre tfix e N, proponho um exercício de simulação descrito em apêndice (Exercício x, Apêndice z). Outro aspecto sublinhado na relação [2], é a equivalência entre tfix quando p=1/2N e o tempo de coalescência (TMRCA, time to the most recent common ancestor); isto é, o tempo que é necessário recuar para encontrar o ancestral comum de um conjunto de linhagens, quando se adopta a perspectiva de tempo reverso da teoria do coalescente (Templeton, 2006; p. 140-141). Esta equivalência ilustra bem a relação entre abordagens com diferentes sentidos do fluxo do tempo.

!"

!#$"

!#%"

!#&"

!#'"

!#("

!#)"

!#*"

!#+"

!#,"

$"

$" (!" ,," $'+"

Pro

babi

lidad

e de

iden

tida

de p

or d

esce

ndên

cia

Tempo (gerações)

N=20

N=50

N=100

N=200

Figura 5: Aumento da probabilidade de identidade por descendência, no modelo W-F, em populações com diferentes tamanhos (N)

Jorge Rocha� 1/2/13 5:50 PMComment [1]: Ver!Fig!4.4,!p.81!Takahata!&!Klein!

Probabilidade de identidade

Bases Evolutivas da Variação Genética Humana

________________________________________________________ !

! 5!

1.2.1 Tempo e tamanho populacional na evolução da diversidade O modelo demográfico mais simples e mais usado para descrever o comportamento ideal de linhagens numa população finita é o modelo de Wright-Fisher (W-F). Embora a maioria dos alunos já conheça os pressupostos deste modelo - pelo menos da disciplina de Genética Populacional e Filogeografia - não é claro que tenham a noção exacta de que os principais conceitos da genética de populações estão vinculados a modelos concretos de comportamento demográfico (Ewens, 2004; p. 35-38). Por isso, começo por fazer uma breve revisão do modelo W-F baseada, entre outras, na definição dada em Hein et al. (2005 p. 13-14). A figura 4 mostra um exemplo da evolução da identidade por descendência no modelo W-F, em que se procura relacionar intuitivamente as noções de oscilação de frequências (deriva genética), fixação de linhagens e coalescência num ancestral comum. Esta intuição é aproveitada para abordar a evolução da probabilidade identidade por descendência, F, com a dedução da expressão

Ft =1! (1!12N)t [1]

em que Ft é a probabilidade média de identidade por descendência na geração t contada a partir da geração de referência, e N é o número de indivíduos da população (Hartl e Clark 2007, p. 116-117, por exemplo). A probabilidade média de amostrar ao acaso na geração t duas linhagens que não provenham do mesmo ancestral na geração de referência é 1- Ft.

Figura 4: (a) Exemplo de extinção e fixação de linhagens, no modelo W-F. As cores distinguem linhagens sem relação genealógica conhecida na geração de referência (Gen 0); (b) Trajectória da linhagem fixada; (c) Oscilação das frequências das diferentes linhagens. As imagens do painel (a) foram obtidas com o simulador do programa Hands On Genetics (http://www.handsongenetics.com).

(a) (b)

(c)

0!0.2!0.4!0.6!0.8!1!

Fre

quên

cia

Tempo (gerações)

A deriva é um processo bem documentado:

Variação genética em humanos

A deriva é um processo bem documentado:

Variação genética em humanos

Prugnolle et al., 2005

12

Variância entre frequências alélicas

0

0.05

0.1

0.15

0.2

0.25

1 2 3 4 5 6 7 8 9 10 11 12

Variâ

ncia

Gerações

Variância freq. Alélicas

Variância cen. I

Variância cen. IV

Variância cen. III

Variância cen. II

Deriva aumenta variância entre populações

160 J. L. Mountain and others Nuclear DNA polymorphisms and human evolution

New Guinean & Australian

Pacific Islander Southeast Asian

2 { = Northeast Asian Arctic Northeast Asian

-1 4 Amerindian European non-European Caucasoid African

I I , I . 0.20 0.15 0.10 0.05 0.00 genetic distance

Figure 1. Condensed version of a genetic tree for 42 aboriginal populations (see Cavalli-Sforza et al. 1988). Each of the nine populations represents many samples. The tree was constructed according to the average linkage algorithm (Sokal et al. 1958) from FST genetic distances (Reynolds et al. 1983) based on frequencies of 120 alleles associated with 44 classical markers (blood group, HLA, and protein polymor- phisms). Numbers indicate nodes comparable with those of figure 4a.

Africa, and spread from there throughout the rest of the world. The second split separates southeast Asians and Pacific Islanders from northeast Asians, Cauca- soids, and Amerindians, suggesting two main migra- tions into Asia. This tree was compared to a classifica- tion of languages; a test of significance demonstrated that there is a highly significant correlation between genetic and linguistic evolution (Cavalli-Sforza et al. 1992).

(b) Comparison with archaeological data

Major separations in this tree can be compared to dates of human migrations, estimated from archaeo- logical data (see Cavilli-Sforza et al. (1988) and figure 2). Anatomically modern humans are assumed to have migrated from Africa roughly 100 ka ago (Brauer 1989; Clark 1989; Stringer 1990). Expansion

250 African vs. non-African

X 200,

iZ 150 I Amerind vs.

. ~ Northeast Asian - Southeast Asian vs. t 100 1Australian & New Guinean

X~ ,, Caucasoid vs. Northeast 50 ,,w' Asian & Amerind

0 ._. 0 20 40 60 80 100

time/ ka Figure 2. Graphical comparison of genetic distances and dates of early intercontinental migrations of anatomically modern humans, estimated from archaeological data. Gene- tic distances are those suggested by the tree of figure 1, x 103. Standard errors for these distances were obtained from 100 bootstraps of the genetic distances (Efron 1982). Dates are given in ka. The date for migration to the Americas is given as a range (15-35 ka BP). The dashed line passes through both the origin and the weighted average of thc three points other than that representing migration into America.

from southeast Asia to Australia and New Guinea is assumed to have taken place approximately 55 ka ago (Roberts et al. 1990), and migration of modern humans into Europe is assumed to have taken place about 43 ka ago (Straus 1989). The ratio of genetic distance (G) to time (T, in years) for these three events is roughly constant (G/ T= 2.07 + 0.15). While no time scale is provided by the genetic tree, consis- tency between the archaeological and genetic data lends support to the hypothesis that the genetic tree corresponds roughly to the evolution of human popu- lations over the last 100 ka.

The time of the first migration of modern humans to the Americas remains controversial; although esti- mates range from 15 ka to 35 ka before present (BP).

(Fagan 1987), these genetic data support a date at the upper end of that range (figure 2). The more detailed set of nuclear genetic data agree with the three major migrations suggested by Greenberg (Cavalli-Sforza et al. 1993). MtDNA restriction site data have recently confirmed two of the major migrations leading to the peopling of the Americas (Torroni et al. 1992).

3. DNA MARKERS: COMPARISONS OF HUMAN POPULATIONS

Over the past ten years new methods for detecting genetic differences have been developed. These detect variation at the DNA sequence level, whether or not this variation is expressed at the peptide or protein level. One such method involves the comparison of lengths of DNA fragments; individuals may differ from one to another in the lengths of specific frag- ments. Thousands of these restriction fragment length polymorphisms (RFLPS) are currently available for testing. A second method involves a technique called the polymerase chain reaction (PCR). While sequence data such as those analysed for mitochondria can be obtained for nuclear genes, nuclear sequence data are more difficult to interpret at the intraspecific level because, unlike mtDNA, nuclear DNA undergoes frequent recombination. The resulting gene tree is therefore more complex, being reticulated (Hudson 1991). Instead, allele frequencies for DNA polymor- phisms are usually employed to measure genetic variation across human populations.

(a) Data for eight populations

Previously we described a study of 100 DNA poly- morphisms in five aboriginal populations (Bowcock et al. 1991a). Although based on a small number of population samples, the analysis improved on earlier studies of classical markers because a larger number of genetic markers were analysed: it has been shown that the number of independent markers is extremely important in obtaining accurate estimates of genetic distances arid in tree reconstruction (Astolfi & Cavalli-Sforza 1981; Nei 1987) . The populations considered were Pygmies of the Central African Republic (C.A.R.) and of Zaire, Melanesians of the Bougainville Islands, Chinese, and northern Eauro- peans. This study is currently being extended to

'lvil. T'rans. R. Soc. Lond. B (1992)

This content downloaded from 143.107.247.27 on Mon, 22 Sep 2014 08:46:32 AMAll use subject to JSTOR Terms and Conditions

Aumento da variância entre populações

humanas

Mountain et al., 1991

A deriva é um processo bem documentado:

Evidências experimentais

Buri, 1956

•107 populações (garrafas) de drosophila •16 indivíduos em cada •Alelo bw75 visível, início p = 0.5

A deriva é um processo bem documentado:

Evidências experimentais

Loss of heterozygosity• Heterozygote frequency = 2 pq

– Alternatively 2p(1-p)– At a maximum when p = 0.5

• Buri Drosophila experiment• 107 lines of 8 females 8 males• Start p = q = 0.5• Qualitative: heterozygosity

decrease• Quantitative: for population with

size 16, heterozygosity shouldfollow dashed line; insteadfollowed solid gray line - theprediction for n = 9

Declínio de H observado

Declínio de H para N=9

Declínio de H para N=16

Geração

Taxa

de

hete

rozi

gose

(H)

Tamanho Populacional Efetivo (Ne)

Definição: Tamanho de uma população idealizada (Wright-Fisher) que perde variação na mesma taxa que a população sob estudo

Porque Ne pode ser diferente de N? - períodos de tamanho pequeno

- variância na reprodução - assimetria na razão sexual dos sexos

17

Tamanho de roedores ao longo do tempo (bank voles e )

Myodes

Apedemus

Tamanho Populacional Efetivo (Ne)

1. Variação em tamanho populacional ao longo do tempo ex. 5 gerações com tamanho que varia:por exemplo, supondo que há 5 gerações com mudanças de tamanho calcula-

se o Ne usando:

1Ne

= 15

⇣1N1

+ 1N2

+ 1N3

+ 1N4

+ 1N5

Para uma população que tem

• 9 gerações com tamanho 1000

• 1 geração com tamanho 10

1Ne

= 910

11000 + 9

10110

Ne = ( 910

11000 + 9

10110 )

�1 = 91.4

Outro caso envolvem assimetria no número de machos e fêmeas de uma

população

Ne =4NmNf

Nf+Nm

Po

1

3.6 Testes da teoria neutra

• H proporcional a N

• k igual a u, logo relógio molecular

• seleção principalmente purificadora

1Ne

= 910

11000 + 1

10110

4

19

Tamanho Populacional Efetivo (Ne)

por exemplo, supondo que há 5 gerações com mudanças de tamanho calcula-

se o Ne usando:

1Ne

= 1N1

+ 1N2

+ 1N3

+ 1N4

+ 1N5

Para uma população que 9 gerações com tamanho 1000 e 1 geração com

tamanho 10 o Ne é

1Ne

= 910

11000 + 9

10110

Ne = ( 910

11000 + 9

10110 )

�1 = 91.4

Outro caso envolvem assimetria no número de machos e fêmeas de uma

população

Ne =4NmNf

Nf+Nm

Po

1

2. Variação na razão sexual

Tamanho Populacional Efetivo (Ne)

por exemplo, supondo que há 5 gerações com mudanças de tamanho calcula-

se o Ne usando:

1Ne

= 1N1

+ 1N2

+ 1N3

+ 1N4

+ 1N5

Para uma população que 9 gerações com tamanho 1000 e 1 geração com

tamanho 10 o Ne é

1Ne

= 910

11000 + 9

10110

Ne = ( 910

11000 + 9

10110 )

�1 = 91.4

Outro caso envolvem assimetria no número de machos e fêmeas de uma

população

Ne =4NmNf

Nf+Nm

Po

1

2. Variação na razão sexual

! Em elefantes marinhos, nas Ilhas Falkland, encontrou-se: 550 fêmeas e 75 machos. O tamanho da população é de 625 indivíduos.

! Usando marcadores genéticos Fabiani et al. (2004) viram que só 28% dos machos reproduziram ao longo de duas estações reprodutivas (21 machos reproduzem)

Nm

= 21, Nf = 550

A taxa de perda de diversidade genética depende do tamanho efetivo

populacional

NM = 21, NF = 550

Ne = 4NMNF / (NM + NF )

Ne = 4NMNF / (NM + NF ) ~ 81

22

O modelo Wright-Fisher com mutação

Parâmetro do modelo evolutivo

Pressuposto

Tamanho da população Finito

Forma de cruzamento Aleatório

Sobrevivência dos genótipos Igual para todos (i.e., sem seleção)

Introdução de novos alelos (mutação e migração)

Mutação ocorre com taxa µ por geração

24

Tipos de mutações

- vantajosa: aumenta chances de reprodução e sobrevivência

- deletéria: reduz chances de reprodução e sobrevivência

- neutra: não altera chances de reprodução e sobrevivência

25

Teoria neutra e de seleção

Teoria de seleção

Teoria neutra

Deletérias

Vantajosas

Neutras

Removidas Sofrem deriva Se fixam

Teoria Neutra

- Deriva pode explicar evolução?

- Teoria neutra propõe que sim: a grande maioria da variação dentro de

espécies e a grande maioria das diferenças entre

espécies

resultam de deriva genética

Motoo Kimiura 1924-1994

“Precisamos reconhecer a grande importância da deriva genética aleatória, resultante do tamanho finito de populações, na formação da estrutura biológica de populações. A importância da deriva tem sido desvalorizada na última década. Essa atitude tem sido influenciada pela opinião de que quase nenhuma mutação é neutra, e também que o número de indivíduos que formam uma espécie é geralmente tão grande que a amostragem aleatória de gametas teria efeito ínfimo no curso da evolução”.

(Kimura, 1968, Nature).

Motoo Kimiura 1924-1994

Teoria neutra

Se evolução resulta só de mutação e de deriva perguntamos:

- Quanta variação haverá numa população?

- Quantas diferenças haverá entre espécies?

µ

Crow e Kimura, 1964

1/2N

Variação intrapopulacional sob neutralidade

Interação de mutação e deriva

H pode ser estimado a partir de dados

Podemos testar a hipótese neutra: - N previsto faz sentido?

Equilíbrio entre mutação e deriva.

0 2000 4000 6000 8000 10000

0.0

0.2

0.4

0.6

0.8

Population size (N)

Het

eroz

ygos

ity (H

)

Interação de mutação e deriva

Taxa

de

Het

eroz

igos

e (H

)

Tamanho populacional (N)

Taxa de evolução molecular

Humano vs Camundongo - Ancestral comum: 80 milhoẽs da anos atrás - Proteína com 100 amino-ácidos e 16 diferenças

0,1 mudanças por proteína milhão de anos

1 mudança por amino-ácido por milhão de anos

(16/100)/160 milhões = 1 x 10-6

mudança/aminoácido/ano

As diferenças entre espécies surgem da variação populacional

alelo A

alelo a

Tempo

As diferenças entre espécies surgem da variação populacional

alelo A

alelo a

Tempo

As diferenças entre espécies surgem da variação populacional

alelo A

alelo a

Tempo

Teste da teoria neutra

• µ = 10-6 mutações por ano (1 a cada 106 anos) • logo k= 10-6 substituições por ano (1 a cada 106 anos)

• Separação há 20 milhões de anos: 40 substituições

• Separação há 40 milhões de anos: 80 substituições

Teste da teoria neutra 1: taxa de evolução

• Previsão da teoria neutra:

κ = μ

0 2000 4000 6000 8000 10000

0.0

0.2

0.4

0.6

0.8

Population size (N)

Het

eroz

ygos

ity (H

)

Interação de mutação e deriva

Taxa

de

Het

eroz

igos

e

Tamanho populacional

Teste da teoria neutra 2: variabilidade populacional

• Previsão da teoria neutra:

Conceitos chave sobre teoria neutra

• Teoria neutra: evolução por deriva genética

• Teoria neutra requer seleção negativa (ou purificadora)

• Previsões da teoria neutra:

– Diversidade (H) proporcional ao tamanho populacional

– divergência entre espécies proporcional ao tempo de separação

40