cours 1. un peu d’histoire : le développement d’une ... · linné (xviiie): recherches ‘à...

46
1 Cours 1. Un peu d’histoire : le développement d’une théorie de l’évolution (PG : 5.1) Avant Darwin : une évolution ? Des « théories » hors du domaine scientifique : ‘un créateur a ordonné l’univers’ => théorie infalsifiable (pas de mise à l’épreuve possible par l’expérimentation). Dans l’Antiquité (Grèce / VIe siècle avant JC) : des mythes troublants d’intuition (créatures vivantes faites d’eau et animaux descendant tous des poissons ; organes unis au hasard ds des combinaisons dont seules quelques-unes sont aptes à la survie), mais surtout une recherche des lois naturelles qui régissent le monde => Socrate : examen critique des hypothèses et des jugements. Ensuite, les chrétiens, s’appuyant sur la philosophie de Platon (pas d’observation car une essence éternelle : l’Idée non représentable par une matérialisation temporaire, qui n’en est qu’une simple indication => la variation n’a pas de sens car le monde est constitué d’un nombre limité d’essences fixes) et d’Aristote (observation sans expérimentation => organes fabriqués ds un but précis (l’individu doit voir donc l’œil existe) : finalisme , même si l’importance du hasard l’a effleuré), établissent la notion d’espèces immuables, avec une échelle de valeurs qui fait de l’être humain le lien entre animaux et anges => créationnisme. - le Créateur est à l’origine des espèces : toutes sont disjointes et chacune, créée une seule fois (fixisme), est définie par un type => classification typologique - une preuve irréfutable contre l’évolution : la Terre n’a que 5000 ans Descartes (XVIIe): rien que des mécaniques sauf l’homme, qui a une âme. Introduction de l’exemple de l’horloge : on s’intéresse au mécanisme, indépendamment du pourquoi, du qui (est l’horloger) et dans quel but => début des véritables études scientifiques en biologie. 2 Linné (XVIIIe): recherches ‘à la plus grande gloire de Dieu’ mais son fixisme est ébranlé par le constat de l’apparition d’un mutant de Linaria vulgaris (=> hybridation d’espèces ancestrales). Puis un cadre religieux exacerbé au début du XIXe en Angleterre : idéalisme + théologie => théologie naturelle : - une montre ne peut pas être un objet du hasard, une créature vivante, bien plus complexe et parfaite, encore moins (abbé Paley ‘Argument from design’) : l’adaptation comme preuve de l’existence de Dieu ? - Et l’œil dans tout cela ? Dès le milieu du XVIIIe, proposition par les matérialistes (pré-transformistes : Diderot, Goethe) de l’idée de génération spontanée à partir du non-vivant et surtout, Buffon ose émettre l’idée que les espèces d’un même genre pourraient provenir du Figure 1. Stades de l’évolution de l’œil chez divers mollusques actuels - Œil et sélection naturelle simulée sur 400000 générations (in Ridley M., 1996)

Upload: dokien

Post on 12-Sep-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

1

Cours 1. Un peu d’histoire : le développement d’une théorie de

l’évolution (PG : 5.1)

Avant Darwin : une évolution ?

Des « théories » hors du domaine scientifique : ‘un créateur a ordonné l’univers’ =>

théorie infalsifiable (pas de mise à l’épreuve possible par l’expérimentation).

Dans l’Antiquité (Grèce / VIe siècle avant JC) : des mythes troublants d’intuition

(créatures vivantes faites d’eau et animaux descendant tous des poissons ; organes unis

au hasard ds des combinaisons dont seules quelques-unes sont aptes à la survie), mais

surtout une recherche des lois naturelles qui régissent le monde => Socrate : examen

critique des hypothèses et des jugements.

Ensuite, les chrétiens, s’appuyant sur la philosophie de Platon (pas d’observation car

une essence éternelle : l’Idée non représentable par une matérialisation temporaire,

qui n’en est qu’une simple indication => la variation n’a pas de sens car le monde est

constitué d’un nombre limité d’essences fixes) et d’Aristote (observation sans

expérimentation => organes fabriqués ds un but précis (l’individu doit voir donc l’œil

existe) : finalisme, même si l’importance du hasard l’a effleuré), établissent la notion

d’espèces immuables, avec une échelle de valeurs qui fait de l’être humain le lien entre

animaux et anges => créationnisme.

- le Créateur est à l’origine des espèces : toutes sont disjointes et chacune, créée

une seule fois (fixisme), est définie par un type => classification typologique

- une preuve irréfutable contre l’évolution : la Terre n’a que 5000 ans

Descartes (XVIIe): rien que des mécaniques sauf l’homme, qui a une âme.

Introduction de l’exemple de l’horloge : on s’intéresse au mécanisme,

indépendamment du pourquoi, du qui (est l’horloger) et dans quel but => début des

véritables études scientifiques en biologie.

2

Linné (XVIIIe): recherches ‘à la plus grande gloire de Dieu’ mais son fixisme est

ébranlé par le constat de l’apparition d’un mutant de Linaria vulgaris (=> hybridation

d’espèces ancestrales).

Puis un cadre religieux exacerbé au début du XIXe en Angleterre : idéalisme +

théologie => théologie naturelle :

- une montre ne peut pas être un objet du hasard, une créature vivante, bien plus

complexe et parfaite, encore moins (abbé Paley ‘Argument from design’) :

l’adaptation comme preuve de l’existence de Dieu ?

- Et l’œil dans tout cela ?

Dès le milieu du XVIIIe, proposition par les matérialistes (pré-transformistes :

Diderot, Goethe) de l’idée de génération spontanée à partir du non-vivant et surtout,

Buffon ose émettre l’idée que les espèces d’un même genre pourraient provenir du

Figure 1. Stades de l’évolution de l’œil chez divers mollusques actuels - Œil et sélection naturelle simulée sur 400000 générations (in Ridley M., 1996)

3

même « moule intérieur », autrement dit seraient issues d’un même ancêtre (sauvage /

espèces domestiques) et auraient divergé (se seraient transformées) sous l’influence de

conditions environnementales (climat).

1809 : ‘Philosophie zoologique’ (JB de Lamarck) : du fait transformiste au

transformisme :

- une espèce, en se transformant sous l’influence d’une pression

environnementale disparaît au profit d’une nouvelle espèce => lignées

continues et infinies : les besoins d’un être vivant déterminent son mode de

développement, et ses besoins sont eux-même déterminés par le milieu dans

lequel il vit ;

- hérédité des caractères acquis avec accumulation des modifications au fil du

temps (cf. le cou des girafes) qui concerne tous les individus de l’espèce ;

(in Brondex F., 2001)

4

- peu d’impact en son temps car aucune expérimentation et ridiculisée par

Cuvier, anatomiste hors pair et fixiste qui imaginait mal comment la

complexité et les intrications associées à la construction d’un organisme

pouvaient s’accommoder d’une quelconque altération => cataclysmisme :

catastrophes géologiques (espèces perdues) suivies de créations successives par

Dieu.

Pendant Darwin : qui d’autre pour quel avenir ?

L’importance des travaux de Mendel (1865), qui permit de réfuter la théorie de

l’hérédité ‘par mélange’ ne fut pas réalisée à son époque. Ce n’est qu’à partir de 1900

que la redécouverte de ses lois régissant la transmission du matériel héréditaire devait

donner lieu au développement d’une nouvelle science : la génétique.

Darwin (1859) : « L’Origine des espèces » Il reprit l’hypothèse de Lamarck mais

proposa un mécanisme pour la transformation graduelle des espèces : la sélection

naturelle qui sélectionne certaines variations individuelles au sein d’une population en

favorisant la survie et la reproduction des individus porteurs provoque un écart au

type.

Fils de médecin, Darwin est passionné par l’histoire naturelle mais, la

profession de naturaliste n’existant pas, il commence des études de médecine puis

devient pasteur. Il adhère totalement aux concepts de la théologie naturelle. Le passage

de cette vision fixiste des espèces à l’idée d’un vivant qui évolue fait suite au voyage

autour du monde qu’il réalise à bord du « Beagle ». Les observations qu’il y fait, celles

notamment sur les pinsons (en fait des moqueurs (Géospizidés)) des Galapagos, sont à

l’origine du résumé de sa théorie de l’évolution publiée à la hâte en 1859, sachant que

AR Wallace avait formalisé les mêmes intuitions sur la SN.

2 thèmes principaux :

- toutes les espèces, actuelles ou passées, descendent d’une ou de quelques

formes vivantes originales : pas de créations répétées par un pouvoir surnaturel

ou par génération spontanée ; accumulation de petites variations (cf

domestication => sélection artificielle sur les pigeons / chiens) ;

5

- théorie de la sélection naturelle : 4 propositions (5 théories selon E. Mayr :

évolution en tant que telle, ascendance commune, gradualisme, évolution des

pops vers l’espèce, sélection naturelle) fondées sur la variabilité et l’apparition

de caractères nouveaux, sont à la base des mécanismes de l’évolution qu’il

propose :

1. il existe une variabilité, des différences, au sein des populations naturelles,

entre les individus d’une même espèce. Celle-ci est transmissible des

parents aux enfants.

2. les ressources du milieu sont limitées par rapport à la tendance à

l’accroissement de l’effectif de la population => compétition (cf. lecture

de l’économiste Malthus) : stabilité des effectifs � destruction d’une

partie des descendants).

3. avantage lié à certaines variations : individus porteurs plus efficaces dans

la compétition ; ils survivent et se reproduisent mieux.

4. la sélection naturelle effectue un tri entre les individus. Ceux qui portent

des variations favorables laissent plus de descendants, portant eux-mêmes

cette modification. Ainsi, les individus porteurs de ce caractère sont de

plus en plus nombreux dans la population.

6

Après Darwin : les anti- et les pro- 1 idée maîtresse, anti-matérialiste : les êtres vivants ont en charge leur propre

évolution, sont actifs, et pas seulement les victimes consentantes des pressions

sélectives.

Sur le continent (en bonne position : la France) : biologistes expérimentaux

remarquables (physio, embryo) pas prêts à accepter quelque chose d’aussi vague…

- Néolamarckisme

Pas mal de scientifiques de la fin du XIXe relancent l’idée d’une hérédité des

caractères acquis (confusion avec plasticité de développement). Attaqués par

Weismann (1834-1914), qui propose l’idée d’un ‘germ plasm’ intouchable, isolé du

soma, lequel transmet ce germe de génération en génération (cf expérience des queues

de souris coupées) : Néodarwinisme = non-hérédité des caractères acquis + sélection

naturelle (le Darwinisme réduit à sa plus simple expression).

- Orthogénèse

Surtout des paléontologistes, influencés par les tendances perçues ds les fossiles :

évolution en ‘ligne droite’, ds une direction prédéterminée sans l’aide de la sélection.

Certains n’hésitent pas à prédire que des taxons vont droit ds le mur (tendances non

adaptées => extinction), d’autres parlent de ‘sénilité raciale’ (une période florissante

puis un déclin inéluctable => élan d’Irlande avec ses bois qui n’en finissaient pas de

grandir). Ces théories disparurent dès la démonstration de Simpson dans la ‘théorie

synthétique de l’évolution’.

- Mutationisme

Théories fondées sur la génétique mendélienne, que Darwin ignorait et qui, par

conséquent, avait tendance à mettre en avant la variation continue (cf. école

biométrique fondée par le cousin Galton => hérédité estimée grâce à une mesure de

similarité entre parents-enfants : régression vers la moyenne (ce qui pose problème

quant à l’efficacité de la SN) ou encore ‘vers la médiocrité’ sic ; il défendra

l’eugénisme = sélection artificielle dans le but d’améliorer l’espèce humaine, avec sa

7

transposition sociale qu’est le darwinisme social) => gros conflit entre biométriciens

(University College London) et tenants d’une variation discrète : les Mendéliens

(Bateson / Cambridge), qui soutiennent que la variation continue n’a pas de support

génétique, donc aucun rôle ds l’évolution.

De Vries (1848-1935), botaniste redécouvreur du papier de Mendel : il crée le mot

mutation pour des variants spontanés se différenciant substantiellement des parents =>

nouvelles espèces : théorie mutationniste de l’évolution (les nouvelles espèces

apparaissent brusquement sans formes intermédaires et sont immédiatement stables : la

sélection retiendra ce qui est valable)

Morgan (1866-1945) et autres généticiens du début du XXe siècle : l’évolution

s’explique par des ‘macromutations’, lesquelles n’ont aucune raison d’être

adaptatives : une forme persiste simplement si elle est capable de survivre et de se

reproduire.

Une évolution graduelle de caractères quantitatifs sous l’action de la sélection

naturelle leur paraissait contraire à ce que l’on commencait à connaître sur l’hérédité :

ce n’est pas de la science (au contraire de la biologie expérimentale) mais une vieille

spéculation…

Goldschmidt : importance des changements héréditaires pendant le développement

mais il oppose ces changements évolutifs au sein des espèces aux processus

responsables de l’apparition de nouvelles espèces (mutations systémiques :

réorganisation totale du génome) => monstres prometteurs bâtis sur un plan

d’organisation nouveau (cf théorie ‘saltationniste’).

8

Pour rapprocher tous ces points de vue, il fallut d’abord :

• éclaircir l’hérédité des caractères quantitatifs et comprendre qu’elle

pouvait s’expliquer par la ségrégation de nombreux gènes influencant le

même caractère avec généralement, en plus, une forte influence du

milieu (ce sont les travaux de Johannsen sur l’hérédité de la taille des

graines de haricot qui l’amenèrent à séparer clairement et à proposer en

1909 les termes génotype et phénotype, ce dernier influencé à la fois par

le génotype et par le milieu). Développement de la théorie polygénique

de l’hérédité des caractères à variation continue.

• Réaliser que les mutations ne sont pas une alternative à la SN, mais son

matériau : c’est la conjonction mutation-SN qui est responsable de

l’évolution adaptative. Si les mutations étaient un préalable nécessaire à

l’apparition de nouveaux gènes, on devait comprendre aussi comment

ces nouveaux gènes pouvaient remplacer les anciens, donc raisonner en

termes de fréquence des gènes dans les populations.

Ce n’est que bien après la redécouverte des lois de Mendel en 1900, lois tombées dans

l’oubli, et après la découverte des mutations, non par de Vries, mais par Morgan

(1910) que furent réunies les données biologiques de base permettant une étude de la

variabilité héréditaire au sein de l’espèce, avec en particulier la construction d’une

véritable théorie de la sélection. L’étude générale est l’objet de la discipline connue

sous le nom de ‘génétique des populations’.

La génétique des populations est née dans les années 1920-30 de la volonté de

concilier la théorie darwinienne de l’évolution (variation continue) et les données de

plus en plus précises acquises depuis le début du XXe siècle sur la transmission du

matériel héréditaire (variation discontinue et hérédité mendélienne). Cette

harmonisation a d’abord été faite par des biomathématiciens (R.A. Fisher, J.B.S.

Haldane, S. Wright), qui ont construit des modèles décrivant l’évolution des

populations sous l’influence des pressions que sont la mutation, la recombinaison, la

SN et le hasard… Et des français (Teissier, L’Héritier) qui en fournissent une base

9

expérimentale (cages à drosophiles). Le but de la génétique des populations est, par

des modèles prospectifs de plus en plus élaborés, de rendre compte de l’évolution.

Cette harmonisation entre les 2 écoles s’intéressant pour l’une, à la variation des

caractères continus, pour l’autre, à la variation de caractères discontinus a conduit à la

formulation d’une nouvelle théorie dite synthétique de l’évolution. Cette théorie

intègre les données de la génétique et prend en compte les mutations comme source de

variabilité héréditaire, le mécanisme chromosomique de l’hérédité et la sélection

naturelle. Plusieurs personnalités d’horizons scientifiques très divers en sont à

l’origine : Dobzhansky (généticien drosophile), Mayr (biogéographe, ornithologiste),

Simpson (paléontologiste vertébrés), Stebbins (botaniste), [Ford (entomologiste),

Huxley (zoologiste)] pour les principaux fondateurs de cette théorie qui fera référence

entre les années 1950 et 1980.

La synthèse évolutionniste (évolutive) en 20 points dont :

- phénotype ≠ génotype => différences phénotypiques dues aux gènes et à

l’environnement

- les effets environnementaux n’affectent pas les gènes transmis aux descendants

mais éventuellement leur expression

- variation héréditaire avec gènes comme support au travers des générations /

mécanismes chromosomiques de l’hérédité

- mutations dont l’effet (variation) est amplifié par la recombinaison =>

diversification génétique

- changement évolutif : processus populationnel avec populations

géographiquement variables

- changement des fréquences génotypiques dû au taux de mutation et aux

pressions, non mutuellement exclusives, s’exerçant sur la variabilité induite :

dérive, sélection naturelle

- Définition biologique de l’espèce.

Cette Synthèse montre enfin que le rejet d’hypothèses fausses (principe de

réfutation) est un progrès important en science.

10

La génétique des populations repose donc largement sur la construction de

modèles mathématiques qui doivent être confrontés à la réalité. Elle associe

l’observation de populations naturelles et la réalisation d’expériences de laboratoire

pour suivre l’évolution des fréquences des gènes et mesurer les paramètres qui

interviennent dans les modèles.

Un frein a longtemps été la difficulté d’isoler des gènes marqueurs dont on puisse

étudier la fréquence (variation phénotypique observable souvent génétiquement trop

complexe ou trop influencée par le milieu pour être utilisable). On était obligé de se

limiter à quelques marqueurs (groupes sanguins chez l’homme, polychromatisme chez

les animaux)… Les techniques d’électrophorèse des protéines à partir de 1966 puis,

plus récemment, les techniques utilisant l’ADN ont mis à la disposition des chercheurs

un nombre considérable de nouveaux marqueurs... Avec la surprise de constater qu’au

moins 30% des gènes de structure sont polymorphes :

Comment toute cette variabilité génétique est-elle organisée et maintenue ds les populations naturelles ?

Les hypothèses de la théorie ‘classique’ (HJ Müller : individus homozygotes pour

l’allèle ‘sauvage’ (favorisé) à la plupart de leurs gènes : variabilité maintenue par mutations)

vs. ‘polymorphisme équilibré’ (Dobzhansky : individus hz à la plupart de leurs gènes / pas

d’allèle normal : variabilité maintenue par sélection balancée) ont du mal à tenir…

=> Emergence d’une théorie neutraliste de l’évolution (Kimura) opposée à la théorie

sélectionniste (cf. avantage de l’hz).

Qu’a-t-on fait des autres ‘intuitions’ de Darwin ? Ecologie évolutive ’ressucitée’ grâce aux travaux de Lack (1947) sur l’évolution de la

taille optimale des pontes et ceux de Medawar et Williams sur le vieillissement => les gènes

comme unité de la sélection : nous ne sommes que des phénotypes jetables…

Ecologie comportementale : Hamilton (1963) formalise sa théorie de la sélection de

parentèle ; Maynard-Smith et Williams, après avoir démontré les limites de la sélection de

groupe, insistent sur l’importance du sexe dans l’évolution. Maynard-Smith introduit

également la théorie des jeux dans l’évolution pour comprendre le comportement individuel

lors de conflits d’intérêt => ESS

11

Comment fonctionne au XXIe siècle un biologiste évolutif ?

Que veut-il comprendre ? - comment une variation du succès reproducteur peut se produire ;

- quelles sont les pressions à l’origine de la corrélation de traits avec le succès

reproducteur ;

- comment la variation génétique apparaît et est maintenue ;

- comment une réponse à la sélection est contrainte par (i) le temps, (ii) l’histoire et la

géographie, (iii) l’hérédité, (iv) les conflits, (v) le développement.

S’il fallait scinder la discipline : - Domaine de réflexion des généticiens des populations (aussi bien pour des caractères

quantitatifs que qualitatifs) : la microévolution => variation intra-pop sur une courte

échelle de temps. Une question majeure : qu’est-ce qui maintient la variation

génétique ? (peu de cas pour le design phénotypique…) ;

- En écologie évolutive, on s’intéresse à l’importance de la carosserie (phénotype) ds le

succès reproducteur avec, en facteur ultime, la transmission des gènes (cf le modèle

‘Ford T’) => traits et combinaisons de traits de vie définissant une stratégie

adaptative en réponse à des pressions sélectives variées. On évite les détails

génétiques trop pointus…

Les spécialistes de l’évolution moléculaire s’intéressent à l’histoire conservée ds les

séquences d’ADN. Comme l’adaptation peut brouiller les pistes, leurs inférences sont

12

souvent fondées sur des parties du génome sans prise pour la sélection et qui a priori n’ont

que peu d’influence sur le phénotype…

- Les systématiciens (qui sont aujourd’hui souvent les précédents) raisonnent en termes

d’arbres évolutifs (poids énorme à l’histoire) fondés sur la variation entre espèces :

reconstruire l’histoire de la vie sur terre nécessite d’établir les relations réelles entre

taxons. Les changements de fréquences pas plus que le design des phénotypes ne les

préoccupent…

- Les paléontologistes sont aussi historiens de la vie, mais sur une échelle de temps

infiniment plus longue (> 100000 ans) : radiations adaptatives, extinctions de masse,

irrégularités du taux d’évolution (cf stase-ponctuation) en relation avec la tectonique

ou l’évolution du climat constituent leur matériau de base.

13

Cours 2. ‘Evolution des populations et des espèces’ Diversité intraspécifique : origine et description (PG : 5.1, 5.2)

1. Origine de la variabilité génétique

2. Diversité phénotypique : qualitative vs. quantitative

3. Typologie du polymorphisme

Quelle prise pour l’évolution ? (PG : 5.2, 5.3) 1. Eléments de génétique des populations

2. Dérive génétique et structure spatiale de la variation génétique

3. (Introduction à la théorie de la coalescence)

4. Introduction à la théorie neutraliste de l’évolution moléculaire

5. Mécanismes de l’évolution darwinienne

6. L’adaptation : un concept ‘délicat’

Conséquences (PG : 3.1, 3.3, 5.2) 1. Polymorphisme et polytypisme

2. Notion d’espèce et spéciation

3. (Phylogéographie) et phylogénie

14

Diversité intraspécifique : origine et description Support et circulation de l’information génétique

- Gène / locus : continuité des caractères d’une espèce à travers les générations assurée par la transmission d'1 information dont chaque unité constitue 1 gène. Chaque gène, dont l'effet sur 1 caractère est conditionné par 1 fonction cellulaire codée (séquence de nucléotides => instructions pour construire une protéine), est disposé à 1 endroit précis sur le chromosome : le locus.

• Cette continuité obéit à des lois (ex : lois de Mendel) • Les mutations (ponctuelles ou par fragment (réorganisations chromosomiques))

modifient la séquence du gène, ce qui entraîne parfois 1 changement du caractère qu'ils contrôlent.

• Les différents états d’un gène sont appelés allèles. Plusieurs allèles pour 1 gène signifient que ce gène est polymorphe. Le génotype d'1 individu est l'ensemble des combinaisons alléliques qu'il porte pour les locus analysés. Chez les organismes diploïdes, l'état homozygote (respectivement hétérozygote) signifie que les 2 copies du gène concerné sont semblables (resp. différentes).

- Populations : sur l'aire de répartition de l'espèce, unités géographiques

naturelles à l'intérieur desquelles les individus ont l'occasion d'échanger leurs gènes = communautés reproductrices partageant un même pool génique (Dobzhansky).

Population à l'équilibre panmictique si, lors de la reproduction sexuée, l'union des gamètes est totalement aléatoire, chaque gamète emportant 1 allèle donné en fonction de sa seule fréquence et aucun allèle n'étant spécialement lié à un autre (du même locus (HW) ou associations de gènes situés à différents locus du chromosome (déséquilibres gamétiques)). Limites souvent difficiles à cerner :

• effets de voisinage / consanguinité de position • métapopulation • groupes de populations génétiquement différenciées => espèce polytypique

(cf notion de race géographique en Zoologie).

- Structure génétique : définie par les fréquences génotypiques (inventaire de

tous les génotypes donc description génétique complète de la pop. 2 allèles : n1/N, n2/N, n3/N ; 0 : allèle perdu ; 1 : allèle fixé) ou par les fréquences alléliques mais, dans ce cas, avec perte d'information ((2n1 + n2)/2N ; (2n3 +n2)/2N).

15

Description de la variation et définition(s) du polymorphisme

La diversité des êtres vivants (Biodiversité) concerne tous les niveaux d'intégration. La diversité au sein des espèces est appelée variation et celle entre les espèces diversité taxonomique. Le terme variation traduit le fait que tous les individus d'une même espèce ne sont pas semblables entre eux. La variation peut être individuelle (intra-population) ou géographique (inter-population). Les ressemblances et les différences entre individus peuvent être sous la dépendance de facteurs génétiques, de facteurs du milieu ou des deux à la fois. L’expérimentation permet de préciser le déterminisme du caractère étudié.

« Cohabitation au sein d’une même population de 2 ou + catégories d’individus

séparables par des caractères tranchés obéissant à un déterminisme mendélien (1

ou quelques gènes) »

« Présence simultanée en 1 même lieu de 2 ou + formes discontinues (morphes)

d’une même espèce telle que la plus rare ne puisse être maintenue par les seules

mutations récurrentes »

« gène présent dans un groupe sous la forme d’au moins 2 allèles, le plus rare

étant présent à une fréquence supérieure à 0.01 (cf variants génétiques rares). »

Le polymorphisme est un bon moyen pour aborder les structures d'échanges et

de reproduction à l'intérieur des populations, pour approcher la structure génétique

d'une espèce et, plus précisément, les échanges entre ses populations, mais :

• variation héréditaire (‘nature’) vs. variation non héréditaire (‘nurture’) :

��âge : méduses/polypes ; larve/imago ;

��saisons : pelage, polyphénisme (alternance de morphes discrets face à une

variation temporelle à ‘gros grain’) ;

��condition sociale : castes chez les

insectes sociaux

��écologiques : écophénotypes =>

changements irréversibles : variabilité

des feuilles chez la sagittaire ;

16

Mante religieuse adulte verte, beige ou brune => pigment brun = pigment tétrapyrolique dérivant du pigment vert (une biliverdine) par oxydation (irradiation lumineuse) : la mante est verte lorsqu'elle a subi une lumière relativement faible pendant son développement larvaire, brune si elle a reçu beaucoup de lumière (soit en intensité, soit en durée). La coloration du substrat n'est pas directement responsable de la coloration, mais il existe indirectement une homochromie des mantes puisque les terrains secs à végétation desséchée sont plus ensoleillés. ��allométriques : une allométrie très majorante peut conduire à une

variation apparemment discontinue : le Golofus et ses cornes céphaliques ;

l’espace des formes de coquilles chez les mollusques illustre l’adéquation

contraintes phylogénétiques-sélection => Haldane : « l’anatomie comparée

reflète l’histoire de la lutte pour accroître son rapport surface/volume »

��tératologiques ou accidentelles

• polymorphisme « génétique » vs. polymorphisme « statistique » : variabilité

des caractères quantitatifs (analyse statistique au niveau phénotypique car

influence de nombreux gènes (en théorie) avec petit effet pour chacun d'entre

eux : génétique quantitative.

17

��Les bases mendéliennes de la génétique quantitative peuvent être

recherchées au moyen de QTL ;

��le cas des traits d’histoire de vie généralement caractérisés par une grande

plasticité phénotypique => interactions génotype-environnement :

définition de normes de réaction de forme variable.

��L’adaptabilité est-elle héritable ? La part de la génétique dans la

plasticité est recherchée au moyen des outils de la génétique quantitative

et, de plus en plus, ceux de la biologie (physiologie) moléculaire

(régulation de l'expression génique) ; la mise en évidence du signal

environnemental à l’origine de la bifurcation vers un phénotype est

fondamentale ;

�� Quand et où l’adaptabilité est-elle avantageuse ? Les individus

plastiques (i.e. généralistes) sont favorisés / aux individus canalisés (i.e.

spécialistes) dans les environnements ‘à grain fin’ (cf. hétérogénéité

spatiale et temporelle).

• Variation héréditaire : les mutations (géniques, chromosomiques, génomiques)

18

Typologie Polymorphismes chromosomiques (cytogénétique)

��remaniements chromosomiques / mutations chromosomiques

��changement du nombre de chromosomes sans changement de structure :

hétéroploïdie recouvrant aneuploïdie et euploïdie (aneuploïdie vs.

polyploïdie) / mutations génomiques

��marquage chromosomique

Diversité phénotypique

- polychromatisme :

• coquille de Cepaea : complexe de locus étroitement liés (« super

gène ») avec (i) locus C (couleur) : 3 allèles, par ordre décroissant de

dominance / Cb, Cr, Cj ; (ii) 3 locus pour le nb des bandes : B

(présence) avec B0 épistatique sur les autres systèmes, à savoir U et T,

non liés aux précédents ;

• le mélanisme industriel : morphes noir et clair. Fluctuations du cours de

la forme noire depuis le XIXe….. Prudence

- polymorphisme morphologique : coquilles dextres ou sénestres

19

Diversité moléculaire

- Polymorphisme protéinique

��protéines totales natives ou dénaturées (rupture de certaines liaisons faibles

maintenant la structure de la protéine → plus d’activité biologique)

� isoélectrofocalisation / électrophorèse bidimensionnelle

��polymorphismes révélés par techniques immunologiques

- Polymorphismes moléculaires (ADN)

��polymorphisme de longueur des fragments de restriction (RFLP). cf ADNmt

(femelle, pas de recombinaison possible avec des molécules différentes : clone

mt avec carte de ses sites de restriction ; taux rapide de changement évolutif) ;

��empreintes génétiques (cf mini et microsatellites)

��séquences amplifiées au hasard (RAPD)

Quelques outils fort utiles

Un classique : l’électrophorèse d’isoenzymes

Certaines enzymes possèdent des caractéristiques intéressantes en génétique des

populations :

- polymorphisme : un même gène (ici locus enzymatique) existe sous

plusieurs formes (allèles), codant pour la même fonction

(allozymes/isoaction).

- codominance : chez un individu diploïde hétérozygote, les deux allèles

présents s’expriment avec la même intensité. => lecture directe des

génotypes à partir des phénotypes.

L’électrophorèse des enzymes permet de détecter une partie de la variabilité des gènes

qui les codent. La technique est fondée sur la migration des protéines dans un gel

(polyacrylamide, amidon…) soumis à un champ électrique. La mobilité

électrophorétique d’une protéine dépend de sa charge nette, et, selon les supports, de

sa taille.

��Charge nette et structure : - structure primaire : toute mutation entraînant une substitution d’acide aminé se traduit

par une différence de mobilité électrophorétique de l’enzyme. - événements post-traductionnels :

20

o structure secondaire (spiralisation du polypeptide par liaisons H) : certains groupements peuvent participer ou non à la charge nette de la molécule, selon leur position (groupements hydrophobes tendant à se localiser à l’intérieur de la molécule, groupements hydrophiles à l’extérieur).

o structure tertiaire (enroulement de la molécule par ponts disulfure) : une structure primaire donnée peut présenter plusieurs structures tertiaires de stabilité équivalente (différentes conformations) dont la charge peut être différente.

o structure quaternaire (association de plusieurs chaînes polypeptidiques codées par un même gène ou par plusieurs gènes).

��Conditions expérimentales :

- la charge nette d’une protéine dépend également de la composition, du pH (cf. pHi), de la force ionique de la solution solvante, ainsi que de la présence d’un corps ionisable combiné à la protéine.

- La taille des pores du gel (polyacrylamide) affecte également la mobilité des enzymes. La

séparation des molécules est donc basée à la fois sur des différences de charge et de taille sauf pour certains supports (agarose, amidon), sur lesquels la séparation des protéines se fait uniquement en fonction de la charge (pas de ‘tamisage’ moléculaire).

��Visualisation et interprétation génétique

- Pour les protéines à fonction enzymatique, la révélation du polymorphisme est fondée sur la réaction rédox enzyme / substrat. Il suffit que l’un des produits de la réaction soit colorable pour mettre en évidence la limite de progression de l’enzyme dans le gel (précipité coloré insoluble).

- Cas d’un organisme diploïde (2n allèles) et d’une enzyme à 2 allèles a et b codominants - Avantages et limites : les marqueurs enzymatiques, dont la mise en œuvre est à la fois

simple et économique, ont été largement utilisés en génétique des populations durant ces 30 dernières années. Toutefois, plusieurs inconvénients notables :

- sous-estimation de la variation génomique - hypothèse de neutralité sélective pas forcément vérifiée

Aujourd’hui, une solution technique pour chaque problème : polymorphisme des acides nucléiques Analyse de la variabilité de séquences nucléotidiques

��digestion d’un fragment d’ADN (cible / ex : ADNmt) par 1 ou plusieurs enzymes de restriction. Les sites spécifiques sont généralement formés de 4 ou 6 nucléotides

��individus différenciés sur la base (i) du nombre de sites de coupure observés, (ii) de la longueur des fragments de restriction (RFLP)

��méthodologie : - extraction de l’ADN - amplification d’une région d’intérêt (clonage, PCR) - 1. digestion puis migration des fragments d’ADN => cartes de restriction - 2. séquençage

��utilisation : sites de restriction ou substitutions (transitions, transversions) traités comme des caractères à 2 états et utilisés par les méthodes cladistiques standard => ADNmt et phylogéographie

21

Les marqueurs microsatellites

��définition : séquences répétées en tandem d’un motif de 2 à 5 paires de bases ��méthodologie (isolement) :

- construction de bibliothèques génomiques - sélection de bibliothèques - séquençage et amplification par PCR

��utilisation : allèles codominants (comme les allozymes) généralement nombreux pour un locus => structure génétique locale, analyses de paternité…

22

Eléments de génétique des populations

Constitution génétique des populations et principe de Hardy-Weinberg

Le principe de Hardy-Weinberg définit l’hypothèse nulle de l’évolution : en

l’absence de mutation dans une population d’effectif infini, les fréquences

alléliques restent indéfiniment constantes au fil des générations.

- Objectif de la génétique des populations : analyse de l’évolution de la structure

génétique. On admet que le changement des fréquences alléliques peut être compris

par l'analyse des perturbations de l'équilibre : sélection (reproduction différentielle des

génotypes (cf fitness), mutation, migration, accouplements dirigés, dérive (pression

dispersive)).

- Les paramètres Données nécessaires aux analyses : effectifs de génotypes (et allèles) → fréquences

des gènes dans les populations. Cas le plus simple d’un caractère à déterminisme

monogénique (gène autosomique, deux allèles codominants A1 et A2) dans une

population de N individus diploïdes à reproduction biparentale (6 autres cas...) :

- constitution génotypique : f (A1A1) = n1/N, f(A1A2) = n2/N, f(A2A2) = n3/N

avec Σni/N = 1

- constitution allélique : calcul des fréquences alléliques :

p = (2n1 + n2)/2N ; q = (2n3 +n2)/2N

ou encore

p = f(A1 A1) + ½ f(A1A2) ; q = f(A2A2) + ½ f(A1A2)

- variance de la distribution des estimations (cf. loi binomiale):

Var (p) = Var(q) = pq/2N (noter l’importance de N dans le calcul de cette variance)

23

- Le cas idéal

Un modèle très simple : Hardy-Weinberg (population infinie sans mutation, sélection, migration et croisements aléatoires) 2 choses à retenir :

- pas de pression évolutive � pas de variation des fréquences, ∀∀∀∀ le régime de

reproduction ;

La panmixie confère à la population une structure génotypique caractérisée par 2pq

hétérozygotes. L’un des moyens utilisés pour juger des écarts à la panmixie, sous

l’influence d’un régime de reproduction particulier ou d’une pression évolutive, est

fondé sur ce taux d’hétérozygotes attendus.

Test de conformité à l’équilibre : utilisation de la distribution de probabilités de la

variable aléatoire χ2, mais problèmes sitôt que le nombre devient élevé => tests exacts.

- Mesures de la diversité intrapopulation

Taux de polymorphisme

- P = (nb locus polymorphes/ nb locus analysés) x 100

- Pbs : - allèles rares détectés dans de grands échantillons (règle des 1% ou 5%)

- ne tient pas compte de l’intensité du polymorphisme

Hétérozygoties observée et théorique (attendue)

- Ho = fréquence des individus hétérozygotes observés ds l’échantillon

- panmixie : relation fréquences alléliques – fréquences génotypiques

24

- H = 1 - ΣΣΣΣqi2 avec qi : fréquence du ie allèle du locus étudié

� taux moyen d’hétérozygotie : moyenne arithmétique pour l’ensemble des

locus

- généralisation à l’ensemble des organismes (diversité génique de Nei) :

H = 2n (1 - ΣΣΣΣqi2 ) / (2n - 1) avec n = nb d’individus étudiés

� proba de tirer au hasard 2 allèles différents à un même locus

Une structure plus réaliste : la structure de Wright

- Consanguinité

- consanguinité = union entre individus apparentés, c’est-à-dire ayant un ou

plusieurs ancêtres en commun.

- Un individu issu d’apparentés est dit consanguin. Il sera plus fréquemment

homozygote (copies d’un même gène de l’ancêtre commun) qu’un individu issu de

l’union de deux non apparentés → déficit d’Hz par rapport à 2pq (cf. le cas

extrême de l’autogamie).

- Conséquences

1. A terme, un régime consanguin systématique conduit à la perte de tous les hz

mais sans modification des fréquences alléliques s’il agit seul.

2. Un autre régime de reproduction fermé : l’homogamie (unions entre

phénotypes semblables). Dans ce cas, la diminution du taux d’hétérozygotes

n’affecte que le locus responsable de la ressemblance phénotypique sur laquelle

- 2 allèles (gènes homologues) sont

identiques (par ascendance) s’ils sont

2 copies sans mutation d’un même

gène ancêtre. Ils sont alors

autozygotes. S’ils ne sont pas les

réplicats d’un seul gène ancestral =>

allozygotes. De fait, un individu

allozygote peut être soit homozygote

soit hétérozygote.

25

se fonde le choix du partenaire et, éventuellement avec eux, les gènes en

déséquilibre de liaison.

3. Dans une population d’effectif limité, la consanguinité est inéluctable, car le

nombre d’ancêtres possibles d’un individu est fini : il faut seulement remonter

suffisamment ‘haut’ dans la généalogie pour retrouver un ancêtre commun à ses

deux parents.

- Mesures

1. Coefficient de parenté (coancestry des anglo-saxons)

- probabilité que deux allèles tirés au hasard d’une population soient

identiques ;

- pour 2 individus i et j : probabilité FIJ que deux allèles tirés au hasard l’un

chez i, l’autre chez j, soient identiques (coefficient de consanguinité de

Malécot).

2. Coefficient de consanguinité

Deux façons de voir les choses :

- En termes probabilistes : probabilité que les deux gènes homologues de l’individu

soient identiques (coef. d’inbreeding FI → tirage sans remise). Cette proba est nulle

dans une population panmictique de taille infinie.

Dans ce contexte, les paramètres peuvent être calculés en ayant recours à la généalogie

des individus considérés (pedigrees) :

Pour un individu i de parents issus d’un ancêtre commun A :

fi = (1/2)n1+n2 (1/2 + 1/2fA) fi = ΣΣΣΣ(1/2)n+1 (1 + fA)

� le coefficient de consanguinité fi d’un individu est donc égal au coefficient de parenté φPM

de ses 2 parents.

- En termes d’hétérozygotie : si elle est le seul facteur agissant sur la structure

génétique, la consanguinité peut être exprimée relativement à la population par l’indice

26

de fixation F défini comme l’écart entre fréquence d’hétérozygotes observés (Ho) et

2pq ou écart à la structure de HW (proportions panmictiques) :

F = (2pq – Ho) / 2pq soit F = 1 – Ho/2pq

⇔⇔⇔⇔ Ho = 2pq(1 – F)

Ce résultat permet de définir la structure de Wright, que l’on peut substituer à celle de

HW, et qui permet de bien séparer, dans la structure génotypique, ce qui dépend des

fréquences alléliques et ce qui dépend du ‘régime’ d’association des allèles (F) :

Pr(A1A1) = p2 + Fpq = (1 – F)p2 + Fp Pr(A1A2) = (1 – F) 2pq Pr(A2A2) = q2 + Fpq = (1 – F)q2 + Fq

27

Dérive génétique et structure spatiale de la variation génétique

Pour simplifier, on modélise la transmission des gènes d'une génération à l'autre

selon le schéma du cycle de reproduction d’une population monoèce pratiquant

l'autofécondation, mais avec des générations séparées.

Tansmission aléatoire avec répétition des gamètes entre générations séparées (d’après L. Excoffier/GENET)

Selon ce modèle, les 2N gènes des individus d'une certaine génération sont tirés avec répétition à partir des 2N gamètes de la génération précédente :

• Un individu peut transmettre plusieurs copies du même gamète à la génération suivante.

• Les deux gènes d'un certain individu peuvent être issus du même gène à la génération précédente (identité par ascendance).

Définition - Tri aléatoire des individus sans relation avec leur fitness (exemple de la

répartition des groupes sanguins dans les populations humaines).

- Dans une population d’effectif fini, fluctuations fortuites des fréquences

alléliques d’une génération à la suivante du fait d’un tirage au hasard d’un

nombre réduit de gamètes (échantillonnage binomial). Dans une population

diploïde de N individus, si p0 est la fréquence d’un allèle A à t=0, le nombre x1

d’allèles A à la génération suivante est une variable aléatoire obéissant à une

loi binomiale B (2N, p0) :

→→→→ E(x1) = 2Np0 et Var(x1) = 2N p0 (1-p0)

→→→→ en proportion : p1 = x1/2N (d’espérance p0) de variance : p0 (1-p0)/2N

(variance et hétérozygotie décroissent au même taux).

L’espérance de pi sera toujours égale à p0 mais, dans la réalité, les fluctuations de la

fréquence d’une génération à la suivante sont imprévisibles. Toutefois, au bout d’un

28

certain temps, l’un ou l’autre des allèles sera fixé définitivement (pi = 0 ou 1) et ce

d’autant plus vite que N est petit, rien ne tendant à maintenir ou ramener la population

à des fréquences moyennes. A envahira la population sous l’effet du hasard avec une

proba p0 (proba p0 que pi = 1) ou disparaîtra avec une proba (1-p0). En d’autres termes,

le ‘comportement’ moyen des fréquences alléliques sur un grand nombre de sous-

populations de même taille extraites d’une même population (de taille infinie) de

départ peut être prédit : chaque sous-population (‘idéale’) va devenir homogène et une

différenciation de plus en plus grande entre elles apparaîtra, mais la diversité allélique

de l’ensemble sera maintenue (cf. expérience de Buri, 1956).

29

Dérive génétique et consanguinité

1- Evolution de l’hétérozygotie

Dans toute population panmictique d’effectif limité observée à la génération t, la

probabilité Ft pour deux allèles d’être identiques n’est pas nulle.

Sous le modèle de Wright-Fisher : probabilité que deux gamètes qui vont fusionner portent à

un locus donné une copie du même allèle est 1/2N (tirage au hasard de 2N gamètes de la

30

génération précédente (t-1)) ; leur probabilité d’identité est alors de 1. De fait, la proba pour

deux gamètes de porter un allèle différent est (1- 1/2N) et leur proba d’identité est de Ft-1. En

additionnant :

Ft = (1/2N) + (1-1/2N) Ft-1

Soit

(1 - Ft ) = (1-1/2N) (1- Ft-1)

(1 - Ft ) = (1-1/2N)t (1- F0)

ou, si F0 est nul : Ft = 1- (1-1/2N)t

Le coefficient de consanguinité augmente donc d’autant plus vite que la population est petite.

A terme, F = 1 donc, si on remonte assez haut dans la généalogie, on trouvera un seul

gène ancêtre de tous les gènes présents à un locus dans une population donnée, car

chaque ‘coalescence’ réduit 2 lignées à une seule (cf « ève mitochondriale »).

2- // entre dérive et consanguinité : notion de structuration génétique

On considère une population totale subdivisée, par conséquent deux niveaux de

structure. Dans une sous-population de taille finie, la panmixie est de règle (HW) mais

la dérive conduit plus ou moins vite à la fixation d’un allèle. De fait, la population

totale sera affectée d’un déficit en hz comparable à celui obtenu par consanguinité.

Pour mesurer cet effet, on utilise à nouveau la proba F d’identité de 2 allèles tirés de la

même sous-population à la génération t, que l’on notera Ft, valeur moyenne sur toutes

les sous-populations, sachant que F varie de génération en génération sous l’influence

de la dérive. Rapportée à la population totale (ou ancestrale pour faire le

rapprochement avec la fig .5), cette proba se note Fst et est la probabilité que deux

gènes homologues dans une sous-population (relativement à la population totale)

soient identiques.

Ce constat introduit l’un des facteurs provoquant un écart à HW : le mélange de

sous-populations génétiquement différenciées…

31

Fréquences génotypiques dans les pops consanguines / subdivisées avec dérive ----------------------------------------------------------------------------------------------------- Fréquence de la consang. / Génération (pop totale) Panmixie / gén 0 consang Fis / gén t consang totale / gén ∞ F (Fis ou Ft) 0 ped./ 1 – (1 – 1/2N)t 1 Fréquences AA p2 p2(1-F) + pF p Aa 2pq 2pq(1-F) 0 aa q2 q2 (1-F) + qF q ----------------------------------------------------------------------------------------------------

=> la dérive détermine des généalogies de gènes : si chaque gène ne produisait à

chaque génération qu’une seule copie, la généalogie serait faite de lignées parallèles :

pas de dérive possible. Dans la réalité : variation aléatoire du nombre de descendants.

32

(Introduction à la théorie de la coalescence)

L’évolution du polymorphisme est généralement abordée sous un angle

prospectif. Par exemple, nous savons prédire ce que deviendra une population

soumise à la dérive. Des hypothèses parfois très contraignantes conditionnent les

résultats obtenus à partir des échantillons (ex : état d’équilibre de la pop).

La théorie de la coalescence est essentiellement rétrospective : on veut reconstituer

l’histoire généalogique d’un échantillon de gènes observés jusqu’à leur ancêtre

commun le plus récent (MRCA des anglo-saxons), avec comme hypothèses un modèle

de mutation et une histoire démographique de la population. On ne modélise ici qu’en

se référant à l’échantillon.

1. Généalogies (individus et gènes)

En première approximation, on assimile une population diploïde de taille N à une

population haploïde de taille 2N. On visualise ainsi plus simplement leurs relations

d'une génération à l'autre en représentant uniquement les lignées de ces gènes. Lorsque

deux lignées se rejoignent chez un gène ancestral, on dit qu'ils coalescent. Il s'agit

donc d'un évènement de coalescence.

La théorie de la coalescence décrit le processus de coalescence des gènes d'un

échantillon depuis la génération présente jusqu'à l'ancêtre commun de tous les

gènes de l’échantillon.

2. Démographie et temps de coalescence (Kingman, 1982)

Soit un échantillon de n lignées extrait d’une population panmictique de taille N

(2N chromosomes) sous neutralité. On remonte dans le passé : on passe d’un état de n

lignées à n-1 lignées (1er événement de coalescence), etc.. jusqu’à la dernière lignée :

ancêtre commun à tous les gènes actuels. On séjourne pendant un certain temps Tj

séparant deux événements (j => j-1).

33

Distribution de probabilité des Tj conditionnée par 2 hypothèses, (i) modèle

démographique de Wright-Fisher, (ii) n<< N : 1 seul événement de coalescence par

génération.

- proba que 2 lignées dérivent d’une même copie : 1/2N

- nombre de paires de lignées différentes : j(j-1)/2

P(j) = j(j-1)/4N

- pas d’évènement de coalescence : 1 – P(j)

On peut donc vérifier à chaque génération l’occurrence d’un événement de

coalescence. Temps de coalescence

��� = nb de générations écoulées jusqu’à la coalescence

P(Tj= t) = [1-P(j)]t-1P(j) (Fonction de masse de la loi géométrique dont l’espérance et la variance s’écrivent : E(Tj) = 4N/j(j-1) ; V(Tj) = 4N [(4N - j(j-1))/j2(j-1)2]

N très grand donc longueur génération infime/longueur généalogie : les

��� peuvent donc être assimilés à des variables aléatoires exponentielles et on peut visualiser leur espérance sur une généalogie moyenne :

Dans une population stationnaire de taille constante, la majorité des évènements de

coalescence surviennent relativement tôt et les derniers sont très espacés. Le temps

moyen pour la dernière coalescence est égal à 2N générations, avec toutefois une

variance égale à 2N(2N-1).

34

On peut également dériver la taille totale Tn de la généalogie, c'est à dire le temps jusqu'à l'ancêtre commun le plus récent de tout l'échantillon :

Lorsque n est grand, Tn = 4N, ce qui correspond au temps moyen de fixation d'un nouveau mutant de fréquence initiale 1/(2N) dans une population : relation entre processus de dérive et processus de coalescence. On notera aussi que comme la probabilité de coalescence de n'importe quelle paire de lignées est identique, toutes les topologies de généalogies ayant les mêmes temps de coalescence sont équiprobables. Ainsi, la topologie b de la généalogie moyenne ci-dessous est aussi probable que la topologie a précédente.

�� �� � �� � �� � � � � � �� �� � �� � � � � �� � �� � ��

Enfin, la taille absolue des généalogies va dépendre étroitement de la taille efficace de

la population d'où elles sont issues. Sur la figure ci-dessus, on a représenté côte à côte

la généalogie moyenne d'un gène nucléaire pour lequel il existe donc 2N copies dans

la population et la généalogie moyenne d'un gène mitochondrial, pour lequel il existe

N/2 copies dans la population (système haploïde à transmission maternelle).

35

Effectif efficace (ou génétique) d’une population

Dans une population idéale, chaque individu a la même probabilité de participer à

la génération suivante, ce qui n’est pas souvent le cas dans une population réelle. On

définit Ne, effectif efficace d’une population réelle, comme l’effectif d’une population

théorique (‘idéale’) soumise au même taux de croissance de Ft que la pop réelle. Les

différences sont liées au non respect d’une ou plusieurs conditions du modèle de

dérive (fluctuations d’effectifs, nombres inégaux de mâles et femelles, structure d’âge,

etc…).

- Fluctuations d’effectif entre générations

Supposons que la taille d’une population passe de N1 à N2 en deux générations

successives :

(1 – F2) = (1-1/2N2) (1- F1)

(1 – F1) = (1-1/2 N1) (1- F0)

soit (1 – F2) = (1-1/2N2) (1-1/2 N1) (1- F0)

par analogie avec le cas où N constant, on écrit : (1- F2) = (1-1/2 N)2 (1- F0) où N

représente cette fois la taille efficace, ce qui conduit à :

(1-1/2 N)2 = (1-1/2N2) (1-1/2 N1)

avec une bonne approximation donnée par : 1/N = ½(1/N2+1/ N1)

cas général : 1/Ne = (1/t) (1/N1 + 1/N2 + ..... + 1/Nt)

→ importance des termes les plus petits (cf bottlenecks / effets de fondation)

- Répartition uniforme de la population / dispersion (Wright, 1946)

Parfois, une homogénéité environnementale couvrant une surface supérieure à

celle couvrant la dispersion potentielle des individus conduit à une structuration de la

population totale. Dans ce cas, Ne dépend de 2 quantités :

- le nombre d’individus reproducteurs par unité de longueur ou de surface (δ) ;

- la dispersion ‘cumulée’ représentée par la variance σ2 (s2) de la distance entre lieux

de naissance et de reproduction (lieu de naissance de la progéniture). Si les

déplacements se font au hasard dans toutes les directions (la dispersion suit une loi

normale) :

36

s2 = (1/(N-1))Σdi2 di

2 = (xi - mx)2

Ne, ou effectif (taille) de voisinage, s’en déduit de la manière suivante :

- pour une colonie linéaire : Ne = 2√√√√ππππδδδδ s(t) - pour une surface : Ne = 4ππππδδδδ[[[[s(t)]]]]2

Le voisinage correspond à la surface (reproducteurs inscrits dans un cercle de rayon

2s) maximale sur laquelle on peut considérer qu’il y a panmixie.

Subdivision spatiale des populations et migration

- Effet Wahlund (rupture d’isolement)

Si deux populations à l’équilibre de HW mais avec des fréquences alléliques

différentes sont mélangées, le ‘mélange’ aura une fréquence égale à la moyenne de

celles des populations initiales. Le principe de Wahlund correspond à la réduction

d’homozygotie après croisements au hasard (proportions de HW respectées) dans une

population résultant du regroupement de deux sous-populations (dèmes) par rapport à

la fréquence moyenne des homozygotes dans les deux dèmes séparés.

En termes d’effet sur une population totale de la dérive agissant dans ses deux

sous-populations (tableau) : la fréquence moyenne des génotypes homozygotes aa (a

37

de fréquence q) dans ces sous-populations sera q2(1- Fst) + qFst. La fréquence de a

dans la population fusionnée est q et, après une génération de croisements au hasard

sans autre pression, la fréquence de aa sera q2, ce qui veut dire que la fréquence des aa

avant fusion sera toujours plus élevée d’une quantité :

∆∆∆∆R = q2 (1- Fst) + q Fst - q2

= -q2 Fst + q Fst = q (1- q) Fst

------------------------------------------------------------------------------------------------------- AA Aa aa Sous-pop. 1 p1

2 2 p1 q1 q12

Sous-pop. 2 p2

2 2 p2 q2 q2

2 Moyennes :

-sous-pops séparées (p12 + p2

2)/2 p1 q1 + p2 q2 (q12 + q2

2)/2

- comme pop.totale p2 (1- Fst) + pFst 2pq(1- Fst) q2 (1- Fst) + qFst

-------------------------------------------------------------------------------------------------------

Donc, quand on pioche sans le savoir dans 2 dèmes génétiquement différenciés,

on observe un déficit en Hz par rapport au résultat attendu dans la population

panmictique ‘fusionnée’. Ce déficit, dû à l’effet Wahlund, est égal à Fst.

38

- (Une autre mesure de la divergence génétique : la distance de Nei)

La distance génétique est un concept classique mesurant généralement une

divergence entre 2 populations comme une fonction des fréquences alléliques. Celle de

Nei (1972) est fondée sur le calcul préalable de l’identité génétique I de Nei.

Pour 2 populations A et B examinées pour un gène K à i allèles différents :

Ik = ���� ai bi / √√√√ (����ai

2 ���� bi2)

Ik : probabilité que 2 allèles pris chacun dans une des populations soient identiques

(notion d’isoactivité) / probabilité que deux allèles pris ds la même population le

soient (proba normalisée). Le dénominateur intègre le degré de polymorphisme des

populations (variation intra).

Pour estimer la différenciation, plusieurs locus doivent être considérés => identité

génétique des 2 populations fondée sur le calcul des moyennes arithmétiques de

chacun des termes précédents :

I = Iab /√√√√ Ia .Ib

��D = -Ln (I)

=> D correspond au nombre moyen de substitutions alléliques intervenues par

locus depuis la séparation des 2 populations.

On peut montrer que D a pour espérance E(D)= µµµµt, où µ = taux de mutation par

génération, et t = temps de divergence des populations (en générations). En l’absence

de sélection, D est donc linéairement proportionnelle au temps de divergence.

Cependant, cette relation avec le temps implique une évolution à long terme des

populations par mutation-dérive, dans le cas du modèle des allèles infinis (pas de

mutations réverses) et de l’équilibre de la population initiale, avant la divergence. Si

on a un modèle de pure dérive, l’espérance de la distance se calcule par une expression

plus complexe.

��La distance de Nei suppose que les vitesses d’évolution sont constantes d’un locus à l’autre et d’une lignée à l’autre.

��la distance de Nei ne vérifie pas l’inégalité triangulaire : cela pose un problème pour représenter cette distance dans un espace euclidien, par exemple pour une ACP, ou pour construire un arbre UPGMA.

39

- Migration dans un modèle en îles

Flux de gènes : transfert de matériel génétique entre populations imputable aux

mouvements des individus ou de leurs gamètes. Ces mouvements définissent la

migration, laquelle modifie les fréquences alléliques des populations ‘receveuses’.

Cette notion traduit la difficulté d’une définition non arbitraire de la population.

Le modèle théorique le plus simple, très souvent utilisé, est celui dit ‘en îles’, qui

regroupe en fait plusieurs cas de figure.

Soit pi la fréquence d’un allèle dans la population étudiée (‘île’), p0 la fréquence de cet

allèle chez les immigrants (en proportion m par génération) :

pi,t+1 = (1-m) pi,t + m p0

‘Au fil du temps’, l’écart entre les deux pools diminue :

pi,t+1 - p0 = (1-m) (pi,t - p0)

soit ∆∆∆∆ pi = m(p0 - pi)

La migration homogénéise les fréquences des populations qui échangent des gènes,

donc s’oppose à leur différenciation. De plus, elle limite la consanguinité :

Si m individus de la population initiale sont remplacés à chaque génération par des

migrants, (1 –m)2 traduit la proba de tirer 2 allèles non ‘migrants’ d’où :

Ft = [1/2N + (1 – 1 /2N) Ft-1] (1 –m)2

A l’équilibre : Ft = Ft –1 , d’où, si m suffisamment petit (m2 négligeable devant m) :

Fst = 1 / (4Nm + 1)

Quelques exemples :

Nm = 0,25 (1 migrant toutes les 4 générations) → Fst =0,50

Nm = 0,5 (1 migrant toutes les 2 générations) → Fst =0,33

Nm = 2 (2 migrants à chaque génération) → Fst =0,11 : Nm est le nombre de nouveaux

immigrants participant à la reproduction à chaque génération. 2 nouveaux migrants

s’établissant par génération suffisent donc à limiter la consanguinité à une valeur maximale de

0,11 (au lieu de 1 sans migration).

40

- Structure spatiale et flux de gènes : quelques modèles

- modèles en îles (populations discrètes de taille finie / migrations) : modèle de

flux sur longue distance

nb infini d’îles (Wright, 1931) : les fréquences alléliques de la population totale sont

constantes ds le temps, de même que celles du pool de migrants. La fréquence dans

chaque île est conditionnée par les effets opposés de la dérive et de la migration

nb fini d’îles (Slatkin, 1985) : les fréquences sur l’ensemble peuvent évoluer dans le

temps (générations)

île-continent (migration unidirectionnelle)

- modèles en ‘stepping-stone’ (populations discrètes / migrations) (Kimura,

1953) : modèle de flux restreint

contrainte sur les flux (échanges entre les dèmes plus proches voisins seulement). En

terme d’isolement par la distance, cette contrainte entraîne une discrétisation de la

diffusion.

- modèle d’isolement par la distance (population continue) (Wright, 1943) :

notion de taille de voisinage se substituant à celle d’échanges entre îles /

dispersion des gènes fonction décroissante de la distance géographique. Plusieurs

moyens indirects pour illustrer voire tester ce phénomène, toujours fondés sur la

relation ‘estimateur de structure génétique-distance géographique’.

- concept de métapopulation (Levins, 1968 ; Wright, 1940) : espérance de vie

limitée des dèmes → processus d’extinction/recolonisation : l’équilibre (génétique,

démographique) est atteint sur l’ensemble des dèmes interconnectés.

41

Théorie neutraliste de l’évolution moléculaire

Contrairement à ce qui est prédit par les sélectionnistes, Les résultats découlant

des techniques d’électrophorèse montrent que :

- les populations naturelles sont très polymorphes ;

- les taux de substitution au sein des espèces sont élevés (entraînant un fardeau

génétique énorme) et ne dépendent ni du temps, ni de la lignée considérée.

- Les séquences fonctionnellement peu importantes évoluent plus vite (mutations

neutres plus nombreuses)

M. Kimura :

- La majorité des variations moléculaires n’est pas soumise à la sélection.

- Le polymorphisme observé actuellement dans les populations est transitoire,

avec des allèles neutres uniquement soumis à la dérive.

- Les substitutions observées au cours du temps sont le résultat de la dérive

(fixations aléatoires).

Tentatives de réponses + convaincantes des sélectionnistes :

- Superdominance (ex : drépanocytose), sélection disruptive (en environnement

variable), sélection fréquence-dépendante maintiennent le polymorphisme :

��approche multilocus : recherche d’une corrélation entre hétérozygotie et (i)

hétérogénéité environnementale, (ii) composantes de la fitness

��approche monolocus : étude approfondie (physiologie, biochimie, écologie)

d’une fonction enzymatique (cf LAP/ Mytilus edulis)

- Les fardeaux correspondant aux différents gènes ne s’additionnent pas (un individu

mort peut porter plusieurs allèles délétères sur des locus différents)

- Remise en cause de l’horloge moléculaire

Théorie d’autant plus importante que la plupart des modèles de structure

spatiale ou d’inférence historique reposent sur l’hypothèse de neutralité

sélective.

42

Mécanismes de l’évolution darwinienne

Intégration de la théorie mendélienne à la théorie darwinienne de l’évolution =>

néodarwinisme.

- Génétique écologique

- Profondes répercussions sur notre vision de la spéciation, qui entre dans le cadre de

la génétique des populations, aussi bien en biogéographie qu’en paléontologie.

Modèle général de la valeur sélective

Valeur sélective = aptitude d’un variant génétique à se perpétuer

��dépend de 2 traits de vie : la fécondité (=> nombre moyen de descendants

fertiles) et la survie (proba d’atteindre la maturité)

��w : nombre moyen de descendants laissés à chaque génération par un individu

Soient wA et wB, les valeurs sélectives des variants A et B, avec nA (resp. nB) individus

A (resp. B). Dans le cas le plus simple d’une population asexuée (ex : bactéries) :

Au temps t0 : p = nA / (nA + nB)

Au temps t1 : p’ = wA. nA / (wA. nA + wB. nB) = wA. p / W

Avec W = wA. p + wB. (1 - p), équivalente à dp /dt = p (wA - W) / W

La seule connaissance des valeurs sélectives relatives (quantités proportionnelles aux

nombres moyens de descendants par variant et par génération : wA = x wB) suffit pour

prévoir l’action de la sélection naturelle.

Pour une reproduction sexuée, on intègre de la même manière les valeurs sélectives dans le modèle HW.

43

Mise en évidence de la sélection naturelle

Mutations + sélection => exploitation optimale du milieu

En conditions artificielles, seuls les organismes capables de produire rapidement

des pops très importantes (mutation + compétition entre variants) peuvent être utilisés

pour tester l’hypothèse d’une sélection naturelle, c’est-à-dire sans choix d’individus

particuliers (ex : E. coli : compétition parents (congelés)-descendants / mesure : taux

de croissance).

Le modèle n’est toutefois pas déterministe dans la mesure où les mutations

apparaissent aléatoirement.

Pour des organismes plus complexes, on doit faire agir la sélection sur une

variation déjà existante (pop. artificielle avec 2 variants génétiques => ex : Drosophila

/ gène défavorable ‘Bar’/ gène favorable ‘yeux rouges’ vs. ‘yeux blancs’).

Dans la nature, les exemples les plus édifiants font souvent intervenir l’action de

l’homme, car modification radicale d’un facteur environnemental (pression sélective) :

��résistance des moustiques aux insecticides organophosphorés

��crabe envahissant et littorine

44

Sélection naturelle en action : moustiques et insecticides

Les étapes :

- 1972 : mutation (surexpression du gène) affectant la production d’une estérase impliquée dans la détoxification de la molécule d’insecticide => taux de survie ���� ;

- 1977 : mutation sur le gène de l’acétylcholinestérase => sensibilité aux

organophosphorés ���� avec un coût : fonctionnement moins efficace ;

- 1984 : nouvelle mutation affectant l’activité estérase : amplification (série de duplications) de 2 gènes voisins codant chacun pour 1 estérase => production énorme d’enzymes

- 1994 : duplication associant (côte à côte) gène standard et gène ‘résistant’

=> développement possible en environnement traité + restauration d’une valeur sélective ‘normale’ en environnement non traité

Les enseignements :

- différents mécanismes permettent l’adaptation à une même pression sélective ;

- dynamique de l’adaptation : au départ, mutations à fort effet sur w (mise

en place de la résistance), puis progression plus lente vers un phénotype optimum si l’environnement reste constant (mutations initiales remplacées par d’autres légèrement plus efficaces) ;

- l’homme opère des changements brutaux => maximisation de la proba

d’observer des mutations qui augmentent fortement w.

45

Sélection naturelle en action : bigorneau et crabe

Les étapes :

- XIXe : littorines (L. obtusata) à coquille haute et épaisse

- Entre 1895 et 1915 : ���� de la hauteur de la spire ⇔⇔⇔⇔ apparition de Carcinus

moenas, prédateur de la littorine (cf expérimentations)

- 1980-90 : littorines à coquille arrondie et peu épaisse. Déterminisme

génétique de la forme soutenu par la disparition des génotypes « pointus »,

∀∀∀∀ l’habitat (absence des crabes), éliminées par la SN

- 1990-2000 : remontée du crabe vers le nord => populations moins denses

et corrélation entre présence de crabes et épaisseur de la coquille :

mutation permettant de construire une coquille épaisse ou réaction

physiologique ?

Protocole expérimental de l’expérience de Trussel & Smith (2000)

46

Résultats

��En présence du crabe (effluves), les littorines fabriquent 1 coquille plus épaisse, ∀∀∀∀ leur origine et leur lieu d’implantation

��les coquilles situées au nord sont toujours moins épaisses (eau plus froide

moins riche en carbonates)

��corrélation négative entre croissance corporelle et épaisseur de la coquille : trade-off survie / fécondité instantanée

Les enseignements :

- l’analyse de la SN nécessite une échelle géographique et/ou temporelle adéquate : elle ne peut favoriser un variant dont les descendants subissent des pressions différentes ;

- changements rapides et imprévisibles => sélection d’une stratégie fondée

sur la plasticité phénotypique ; - tous les caractères ne sont pas équivalents : contraintes de développement

±±±± fortes associées au changement d’état => plasticité vs. variation génétique : pour éviter le coût lié à ce changement lorsqu’il est inutile, option plasticité. Le changement de forme ne coûte a priori pas grand chose…

47

- Polychromatisme de Cepaea : un problème avec trop de solutions

Un polymorphisme à portée de la main et des yeux => 20 ans de controverse

�� la sélection visuelle en action

�� la sélection climatique en action (terrain et expérimentations

physiologiques)

�� le grain de sable : dérive génétique et effets de zone

- Sélection sexuelle

��Le canard phallique d’Argentine : pourquoi la plupart des oiseaux mâles n’en

ont pas ?

��L’ « élan d’Irlande » : ni orthogénèse, ni même allométrie mais l’outil d’un

comportement rituel avantageux… Sans rapport avec l’extinction de l’espèce

��Le dard des escargots : ce qu’on ne ferait pas pour préserver ses

spermatozoïdes !

48

L’adaptation : un concept ‘délicat’

- Définition : physiologie vs. génétique

�� L’hétérogénéité spatiale ou temporelle ne définit pas seulement un

environnement à ‘gros grain’ mais également une variation ‘à grain fin’

dont la conséquence est une régulation physiologique (adaptation

physiologique => stress et/ou une réponse comportementale de

l’activité. Lorsque le changement est substantiel � acclimatation, qui est

une réponse également réversible.

�� De telles réponses permettent un ajustement plus ou moins rapide et

ponctuel à des fluctuations environnementales plus courtes que la durée

de vie des individus. Ainsi, les composantes du cycle annuel s’ajustent

en durée et en timing aux variations climatiques spatiales et

interannuelles.

�� Sur du long terme : réponses développementales irréversibles : plasticité

phénotypique (variance) ou ‘états’ du trait fixés

Définition formelle de l’adaptation : état apomorphique qui a évolué en réponse à

une fonction apomorphique (un changement environnemental l’ayant rendue

avantageuse). Il a une utilité présente et a été généré par une sélection passée

pour son propre rôle biologique (sinon exaptation : caractère dont la fonction

actuelle diffère de la fonction originelle).

� déf. fonctionnelle (réponse à un signal spécifique entraînant un gain de fitness)

� déf. phylogénétique stricte (Coddington) qui ignore la variation intra-pop et l’adaptation en réponse à une sélection spécifique d’une lignée (voir aussi convergence)

� défs. opérationnelles ‘microévolutives’ (optimisation, changement environnemental donné → changement d’état id. du trait) à l’intérieur d’un cadre phylogénétique rigide.

49

- Comment étudier l’adaptation ? �� comparaison d’une forme ‘idéalement’ fonctionnelle avec les formes

observées

�� manipulations phénotypiques ou manipulations de l’environnement

�� méthodes comparatives

- Le programme adaptationniste Voltaire (Pangloss), et plus tard, B. de St Pierre => logique de la

Providence/Finalisme

La cathédrale San Marco (Venise) (cf ouvrages de Gould)

Les adaptations sont imparfaites (« il n’y a pas de phénotype immortel,

inaccessible aux prédateurs et produisant un nombre infini de descendants »

(Maynard-Smith)) pour plusieurs raisons :

�� une adaptation ne peut pas être optimale à tous les niveaux

d’organisation ;

�� anachronisme évolutif : adaptations surannées (ex : fruits

surprotégés en Amérique du sud en réponse à une faune qui n’existe

plus) ;

�� contraintes génétiques (ex : HbS et anémie falciforme) et

phylogénétiques (historiques)

�� contraintes de développement (cf pléiotropie / Lucilia et insecticides

=> résistance et asymétrie contrecarrée par une sélection canalisante

sur gènes modificateurs)

�� notion de compromis entre les fonctions : stratégie d’histoire de vie

50

Notion d’espèce et spéciation (5.3)

Le concept d’espèce est-il utilisable ?

Notion de base : seule catégorie considérée comme naturelle…

On est passé d’une classification recherchant ‘l’ordre de la création’ (ordre naturel et

gradation des êtres vivants d’Aristote avec l’espèce comme unité élémentaire) à celle

reconstituant l’histoire des taxons. La première étape a bien fonctionné jusqu’aux

inventaires du XVIIe d’espèces provenant des 4 coins du monde…

Le problème de sa définition : Darwin lui-même ne la définit pas dans un ouvrage qui traite pourtant de son origine !!

Définitions du statut d’espèce => à la différence des autres catégories taxinomiques

(niveaux de hiérarchie), la définition de l’espèce peut également se fonder sur le

partage de propriétés biologiques : une définition doit intégrer la nature de l’espèce et

le moyen de la reconnaître (concept opérationnel) :

��définition intuitive qui mêle ressemblance physique et continuité généalogique, sachant que l’intuition est très souvent efficace (cf. Nouvelle Guinée :120 sps pour les ornithos contre 110 pour les indigènes)

��définition essentialiste fondée sur la notion de type ‘idéal’ et d’une réalité qui s’en approche (cf catégories linnéennes => Dieu a créé les types dont les individus biologiques sont la matérialisation / archétype). Conception fixiste (variation contingente sans rôle pour l’avenir de l’espèce)

��définitions typologiques : entités pratiques définies par les méthodes de la taxinomie (cf phénétique) ; répondent au concept essentialiste

��définition nominaliste : seul l’individu compte, le concept d’espèce est utilisé par facilité, extension à n’importe quel type de groupement ; Buffon et Lamarck l’ont été un moment

��définitions biologiques (populationnelles) : « groupe de pops naturelles réellement ou potentiellement interfécondes et reproductivement isolées d’autres groupes semblables » (E. Mayr) => entités disjointes du fait de cet isolement reproducteur et

51

disjonction facile aujourd’hui à mettre en évidence (marqueurs moléculaires). Problèmes liés à (i) l’instantanéité (relations entre individus contemporains seulement), (ii) la reproduction uniparentale ou biparentale facultative

��définitions phylogénétiques : « portions du réseau généalogique qui, entre elles, ont des relations divergentes de type arbre », s’y ajoute le concept de séparation permanente => relations entre espèces symbolisées par des dendrogrammes (pas de reproduction entre branches) et relations entre individus conspécifiques par un réseau généalogique.

Individus d’une même espèce unis par :

��une relation de parenté (critère phylogénétique) ��la capacité de se reproduire entre eux (critère biologique)

Devenirs d’une espèce

Anagénèse : processus évolutifs avec modifications de la descendance (variation

intraspécif + sélection) : transformation d’une espèce à l’échelle géologique

Cladogénèse : processus liés à l’isolement reproducteur : plusieurs espèces issues

d’une même espèce ancestrale

��une ‘bonne espèce’ se définit donc facilement : elle présente, après être

apparue par cladogénèse, une anagénèse qui permet de la distinguer des

autres.

Mais il existe :

��des espèces jumelles (ex : Cepaea)

��des hybrides fertiles (ex : tigron)

52

Mécanismes de la spéciation Un scénario de spéciation doit au minimum prédire l’apparition de différences

génétiques suffisantes entre deux groupes d’individus de la même espèce pour empêcher toute reproduction (pas de descendants viables) entre eux => mécanismes d’isolement reproducteur deux types :

(i) prézygotiques : empêchent la fusion des gamètes (isolements temporel, éthologique, écologique, mécanique, gamétique),

(ii) postzygotiques : empêchent les flux de gènes (hybrides léthaux, stériles ou peu fertiles).

��Spéciation allopatrique en 3 étapes : (i) fragmentation de la population initiale

(plus de rencontres), (ii) fixation de variants génétiques différents, (iii)

différenciation génétique entre les populations telle que si remise en contact, la

production de descendants viables est impossible (Cf. isolements prézygotique

(notion de renforcement : contre-sélection des croisements entre sous-espèces) et

postzygotique (mauvaise coadaptation génomique des hybrides : D.

simulans/généraliste & D. sechellia/spécialiste du morinda)) => l’anagénèse peut

continuer.

- gradualisme : anagénèse et cladogénèse découplées ds le temps - équilibres ponctués : anagénèse et cladogénèse liés ds le temps (petites

populations => dérive) radiation adaptative et dimensions de la niche écologique / effet

fondateur (dérive) + SN

anneaux d’espèces : constat de la cohabitation de 2 vraies espèces,

mais distinction délicate sitôt qu’on s’éloigne de la zone de contact, avec hybridations possibles => 1 espèce apparue à l’opposé de l’anneau (très grande distance) s’est suffisamment différenciée de part et d’autre d’une barrière pour que, lorsqu’elle disparaît, les contacts soient stériles / exs : Ensatina (salamandre – cf illustration), Larus (goëland) : preuve d’une variation intraspécifique graduelle conduisant à une spéciation => continuité

53 54

��Spéciation parapatrique : aires de répartition contiguës avec mise en place

d’une zone hybride souvent secondaire (ex : corneille) = exemple un peu extrême de cline

��Spéciation sympatrique : scission de l’espèce ancestrale sans subdivision de

son aire de répartition. Sans doute générée par la mise en place par sélection d’un polymorphisme stable suivi d’accouplements homotypiques. Chez les végétaux : polyploïdisation

��Autres : évolution chromosomique (Mus musculus / fusions robertsonniennes)

55

Phylogénie et phylogéographie

La classification biologique décrit et distingue les espèces actuelles et fossiles

puis propose un arrangement selon un ordre hiérarchique :

��2 principes : phénétique et phylogénétique

��3 écoles principales : phénétique (taxinomie numérique), cladistique

(systématique phylogénétique), évolutive (mélange des 2 autres)

La phylogénie, c’est l’enchaînement des espèces au cours du temps (Haeckel,

1866). Pour Darwin (1872), elle représente le cours historique de la descendance des

êtres organisés (notion de généalogie). Un arbre phylogénétique illustre donc la

filiation des espèces hypothétiques au cours du temps géologique. C’est la meilleure

représentation graphique des relations de parenté entre espèces, en fonction du temps

(échelle verticale) et de la diversité taxinomique (échelle horizontale).

Arbres phylogénétiques

- Principes

- Représentations graphiques consistant en des noeuds et des branches (chemins

connectant les taxons) qui résument les relations évolutives entre organismes.

- Les UTO (unités taxinomiques opérationnelles) sont le plus souvent au moins

des espèces, parfois des populations conspécifiques bien isolées.

- Les noeuds externes d’un arbre représentent les UTO actuelles, les noeuds

internes les unités ancestrales. Sur un arbre phylogénétique, les relations sont

orientées (polarisées), avec un point de départ qui est la racine de l’arbre

(irréversibilité du temps géologique). Les UTO y sont classées en fonction du

caractère + récent de leur dernier ancêtre commun.

- Les branches périphériques conduisent aux noeuds externes et les branches

intérieures connectent les noeuds internes. Leurs longueurs reflètent le

nombre de changements évolutifs à chaque étape ancêtre-descendant. L’arbre

peut être additif ou plus ou moins additif (distorsions d’origines diverses).

- Nombreux types de graphes : de l’arbre enraciné avec échelle (longueurs

proportionnelles au nb de changements génétiques) jusqu’au réseau sans

échelle.

56

- Algorithmes de phylogénie fondés soit sur la notion de distance (méthodes

quantitatives) soit sur celle d’ « état de caractère » (méthodes qualitatives).

Les problèmes

- même un nombre peu élevé d’UTOs conduit à un nombre énorme d’arbres différents

dont un seul est valide : quel critère d’optimalité ?

- la reconstruction dépend des données, des mesures de distance et des algorithmes de

phylogénie utilisés.

- Cladistique (cladisme)

��Méthode de reconstruction phylogénétique, formulée par Hennig (1950,

1966). La distinction caractère ancestral / caractère dérivé se fonde sur un

triple critère engageant anatomie comparée, paléontologie, ontogénie et

recours à un groupe extérieur.

��La cladisitique utilise des caractères (morpho, anat, moléc) dérivés pour

définir des groupes de taxons rassemblant tous les descendants d’un même

ancêtre commun (groupes monophylétiques = clades). Les caractères peuvent

être qualitatifs ou quantitatifs (alors transformés en classes). Le but est

d’estimer la phylogénie avec un critère impliquant le moins d’hypothèses

possibles : on établit des relations de parenté entre les espèces par la

recherche de caractères évolués partagés en supposant un minimum de

transformations évolutives (parcimonie).

��Le cladisme diffère de l’évolutionisme, qui donne plus de poids à certains

caractères, et de la phénétique où tous les états de caractères (ancestraux et

dérivés) sont pris en compte.

Plésiomorphie = état ancestral du caractère. Symplésiomorphie = cet état partagé par

plusieurs taxons (ne sert pas à créer les nœuds en cladistique).

57

Apomorphie = état dérivé d’un caractère. Synapomorphie = cet état partagé par un

groupe de taxons. Base des relations phylo en analyse cladistique. (ex : ailes =

synapomorphie des membres de la classe des oiseaux).

Homologie : similarité réelle, héritée d’un ancêtre commun

��Ex : Le même organe sous les variétés de formes et de fonctions observées =>

membres antérieurs des Tétrapodes = ailes des oiseaux, mb ant du cheval,

bras humain etc).

��2 types d’homologie (synapomorphie, symplésiomorphie). Seuls les états

dérivés portés en commun sont preuve d’ancestralité commune exclusive

(monophylie stricte)

Analogie : élt ou organe qui a la même fonction mais qui dérive d’une base non

homologue. (évolution par convergence).

��Ex : ailes des oiseaux et des papillons = homoplasie (Lankester, 1870).

��Se divise en convergence (apparition indépendante chez différentes espèces,

d’un même état de caractère) et réversion (apparition d’un état de caractère

ayant l’apparence de l’état ancestral).

��Convergence et parallélisme sont dus au même phénomène (terminologie :

convergence pour taxons éloignés, parallélisme pour taxons plus proches).

��Importance du niveau hiérarchique. Ailes des chauve-souris et des oiseaux

sont des caractères homologues, en tant que membres antérieurs,

synapomorphie des Tétrapodes. Au sein des Tétrapodes, les oiseaux sont plus

proches des crocodiles que des Chauve-souris (Mammifères), et les ailes des

oiseaux et des chauve-souris sont des analogies (en tant qu’ailes, apparues

deux fois, selon des processus très différents, cf plumes ou peau… et assurant

la même fonction de vol).

Clade : groupe monophylétique. Existence d’un ancêtre commun exclusif.

58

Groupes paraphylétiques : diagnostiqués par des plésiomorphies et n’incluant pas tous

les descendants d’un ancêtre commun. Par ex, le groupe des poissons est diagnostiqué

entre autre par l’existence de nageoires paires. Il est paraphylétique car les membres

des tétrapodes sont le plus parcimonieusement interprétés comme des nageoires paires

modifiées (donc chez les poissons, c’est une symplésiomorphie). D’autres groupes

semblent être paraphylétiques, car aucune synapomorphie ne leur a été décrite à ce

jour (Invertébrés, Reptiles, algues, Gymnospermes).

Groupe polyphylétique : groupe dans lequel l’ancêtre commun le plus récent est

assigné à un autre groupe et non pas à lui même (Farris). Ces groupements n’ont

aucune signification phylogénétique. Les caractères qu’ils partagent sont des

homoplasies (ex des ailes des oiseaux et des papillons).

Les groupes (12) (34) et (1234) sont des groupes monophylétiques (clades) (arbre a). Le groupe (123) est un groupe paraphylétique (b). Le groupe (23) est polyphylétique (c).

- Phénétique : méthodes fondées sur une matrice de distances

Nombreuses solutions pour obtenir une mesure de distance entre 2 OTUs, avec

un recours classique aux analyses multivariées (ACP, AFC simple ou multiple) :

l’ordination en espace réduit fournit sur chaque objet des coordonnées factorielles

utilisées pour faire de la classification, généralement hiérarchique.

��Méthode de la moyenne des distances non pondérées (UPGMA)

��Arbre phylogénétique de Fitch et Margoliash

��Méthode du neighbour joining

1 2 3 4 1 2 3 4 1 2 3 4

a b c

59

Finalement :

Dendrogramme : arbre où les liens entre taxons sont représentés par une succession

de branchements. Les éléments terminaux sont les taxons ou Unités Evolutives (UE,

OTUs). Peut être obtenu à partir de diverses procédures. Terme très général.

Phénogramme : dendrogramme produit par taxinomie numérique. Relations

exprimant le degré de similitude globale entre taxons.

Cladogramme : dendrogramme des relations phylogénétiques entre taxons, obtenues

par analyse cladistique (nœuds et branchements définis par des synapomorphies).

Phylogramme : dendrogramme exprimant les branchements cladistiques et le degré

de divergence adaptative subséquente aux branchements (Mayr, 1969).

60

Le problème de l’’arrangement’ (ranking) dans la classification : espèce-

taxon vs. espèce- catégorie

- Pas toujours facile de positionner un taxon dans la hiérarchie créée pour les

coordonner et les subordonner (cf. Oiseaux : classe ou super-ordre ?)

- Pour l’espèce : on veut coordonner catégorie et taxon en subordonnant la

catégorie aux mécanismes (évolutifs) à l’origine du taxon (ex : interfécondité)

��Que faire dans le cas d’un groupe de pops conspécifiques A, B, C, D, E dont

l’une (C) se retrouve isolée pendant suffisamment longtemps pour qu’il y ait

isolement reproducteur ?

��Caractère ‘isolement repro’ : 2 états avec l’état ‘absence’ ancestral =>

l’espèce C est donc un taxon monophylétique : OK

��Peut-on pour autant considérer que les autres pops (interfécondes) constituent

une autre espèce ? Non, car on construit un taxon paraphylétique sur la base

d’un caractère ancestral => en plus des 3 points contenus dans les

propositions précédentes (confusion taxon-catégorie, processus à l’origine de

la spéciation, définition de la catégorie sur la base du mécanisme qui conduit

au taxon), on utilise comme critère la continuité du flux de gènes alors que

c’est la rupture du flux qui détermine l’isolement reproducteur.

- PhyloCode : définition d’un ‘point fixe’. 1 taxon peut être défini par une

apomorphie, un nœud ou une branche donc tout est défini à partir d’un arbre

phylogénétique.

��Pour (contre…) l’espèce : le concept de LITU (unité taxonomique la moins

inclusive) ‘supplante’ celui d’espèce, non retenu (ni taxon, ni catégorie), ds la

mesure où il représente le plus petit taxon identifiable (1 apomorphie) =>

séparation claire biologie-nomenclature

��Un problème pratique : protection des « espèces » menacées… Protection

d’un LITU (taxon terminal) menacé n’est pas encore entré dans les mœurs !

61

(Phylogéographie)

- Sous-discipline de la Biogéographie. Domaine d’étude des principes et processus

qui gouvernent la distribution géographique de lignées généalogiques, en

particulier de lignées conspécifiques. Terme proposé en 1987 par Avise et al.

Aspects historiques de la distribution actuelle des lignées.

- discipline intégrative : analyse et interprétation intégrant diverses méthodes ou

domaines comme la biologie moléculaire, la génétique des populations, la

phylogénie, démographie, éthologie et géographie historique.

- Outil de prédilection en phylogéographie animale = ADN mitochondrial : évolution

rapide au sein des lignées animales, absence de recombinaison, généralement

transmis maternellement. C’est aussi une limitation car seules les lignées femelles

sont étudiées.

- Phylogéographie intraspécifique : aspects phylogéniques dans les processus

microévolutifs. En raison de l’absence de recombinaison, les lignées ou individus

peuvent être considérés comme OTUs dans une reconstruction phylogénique.

En opposition à l’écogéographie (autre discipline de la biogéographie, qui met l’accent

sur la sélection naturelle), la phylogéographie met en évidence l’impact d’événements

historiques pontuels (ex : évènements de vicariance) en opposition à des facteurs

récurrents tels que dérive, flux de gènes, sélection.

62

Cours 3 : Génétique quantitative et normes de réaction (5.2)

La génétique des populations est incapable d’expliquer la variation de la

majorité des caractères observables car l'hérédité des caractères continus n'est

pas bien décrite par la génétique mendélienne : ils sont transmissibles mais

dépendent souvent de plusieurs gènes => niveau d’intégration : l’individu.

Comment aborder leur évolution, autrement dit comment analyser la variation

génétique qui conditionne la réponse à la sélection ?

- démarche réductionniste : relations gènes-caractère => génétique du

développement

- comportement 'macroscopique' des caractères héréditaires => génétique

quantitative

Exemple : 1 trait sous la dépendance de 4 locus, avec 2 allèles/locus, sans

dominance :

��1 allèle accroît d’1 unité la valeur du trait (+)

��l’autre allèle n’ajoute rien (-)

��3 génotypes par locus : ++, +-, --, avec des effets +2, +1, 0

��Sur les 4 loci : 34 = 81 génotypes diploïdes de 8+ à 0 avec seulement 9 classes de

phénotypes

��Plus les locus sont nombreux, plus les classes phénotypiques le sont, plus les

intervalles de classe sont étroits

Avec quelques locus et une certaine quantité de plasticité, la distribution phénotypique

est assimilable à une courbe normale.

63

Statistiques utilisées en génétique quantitative

1. Variance totale

Mesure de la variation phénotypique d’un échantillon :

Vp = 1/(n-1)ΣΣΣΣ (Yi – Y )2

2. Covariance et corrélation linéaire

Etude conjointe de deux variables quantitatives En génétique quantitative : 1 seule variable mesurée sur des couples (ex : parents-descendants) => covariance (corrélation) phénotypique On cherche à savoir si les deux variables sont interdépendantes (si elles covarient). Pas de relation de cause à effet mais plutôt variations des 2 variables comme 2 effets d'une même cause (ex : la parenté). La corrélation au sens strict est une mesure de l'association entre deux variables quantitatives.

X

RégressionY

di=écart résiduel pour X fixé

Σ di² =minimumYi

i

Y

�Y

d

Corrélation

hi=écart résiduel orthogonal

X

Y

h

i

Y

Σ hi² =minimum

XX

X

RégressionY

di=écart résiduel pour X fixé

Σ di² =minimumYi

i

Y

�Yd

Corrélation

hi=écart résiduel orthogonal

X

Y

h

i

Y

Σ hi² =minimum

XX

• paramètres (population de N individus) covariance corrélation

,

( )( )x

x y

i ii

yx y

N

µ µσ

− −=�

X,YX,Y =

X Y

σρ

σ σ

x Xµ = y Yµ =

• estimateur (échantillon de n individus)

( )( )1( , )

.x y

x y

i iX m Y mr X Y

n s s

− −= �

64

3. Régression linéaire On cherche à :

• Expliquer les variations observées sur une variable Y (dépendante, à expliquer) par une variable X (indépendante, explicative), à l’aide d’une relation linéaire.

• Prédire les valeurs de Y pour certaines valeurs de X. Ecriture du modèle La fonction linéaire qui lie Y et X est de la forme : Y = αααα X + ββββ Elle permet de calculer pour chaque X une valeur estimée Y En réalité la variable Y ne suit pas parfaitement ce modèle : on observe pour chaque observation des écarts au modèle ou résidus. Le modèle complet s’écrit alors, pour chaque valeur de Y : Yi = αααα Xi + ββββ + εεεεi εi sont les résidus. Estimation des paramètres Méthode des moindres carrés. La construction de la droite de régression doit satisfaire la contrainte suivante : Σ εi

2 = minimum C’est-à-dire dans le cas d’un échantillon :

ˆ (Y - Y)²= minimum�

Ecarts résiduels

Yi -

X

Y

Y

Y

X

65

Les valeurs a et b qui minimisent cette quantité sont calculées à partir de n couples d’observations (Yi,Xi) :

2

(Yi - Y)(Xi - X)covariance(X,Y) (n-1)=

(Xi-X)variance(X)(n-1)

a =

2

(Yi - Y)(Xi - X)

(Xi-X)a = �

� b Y aX= − Décomposition de la variation totale Pour chaque valeur de Y (Yi), l’écart total à la moyenne Y est :

Ecarts totaux

X

Y

Y

Yi - Y

Ecarts dus à la régression

X

Y

- Y Y

Y

Ecarts résiduels

Yi -

X

Y

Y

Y

X On démontre que les sommes des carrés des écarts (SCE) sont additives (comme dans l'ANOVA), on peut donc écrire :

( ) ˆ ˆYi - Y ² = (Y - Y)² + (Yi - Y)² � � �

SCETOT = SCEREG + SCEERR

66

Pour comprendre l’héritabilité : prenons le problème à l’envers

��Héritabilité = proportion de la variance phénotypique totale entre individus

due à la variance génétique additive

��Variance génétique additive = variance des valeurs reproductives (entre

individus)

��Valeur reproductive d’un individu = 2 x l’écart entre ses descendants et la

moyenne (Mx) de sa population (panmictique) ou effets moyens de ses allèles

sommés sur tous les locus impliqués

��Effet moyen d’un allèle = écart moyen entre Mx et individus ayant reçu

l’allèle A d’1 parent, l’autre étant extrait au hasard de la population ou

changement de Mx produit par la substitution de tous les allèles B par A.

Mesuré au moyen des valeurs génotypiques

��Valeur génotypique / génétique (cas d’un clone en environnement constant) =

écart entre un clone et la valeur moyenne de tous les clones. Ds le cas d’un locus

à deux allèles :

Valeurs génotypiques : -a 0 d +a Génotype : aa réf. Aa AA

d = degré de dominance (A dominant sur a)

��Moyenne d’une population : intégration des fréquences alléliques :

M = a(p-q) + 2 dpq Gamme de phénotypes de +a (p=1) à –a (q=1) => 2a

=> pour plusieurs locus (effets additifs) :

M = ΣΣΣΣa(p-q) + 2ΣΣΣΣ dpq Gamme de phénotypes de ΣΣΣΣa (p=1) à ΣΣΣΣa (q=1) => 2ΣΣΣΣa

67

Effet moyen Les enfants reçoivent de leurs parents des gènes, pas des génotypes, donc la valeur transmise ne peut pas être fondée sur les seules valeurs génotypiques L’effet moyen d’un gène A1 est obtenu en considérant les zygotes issus d’un gamète A1 et d’un gamète tiré au hasard de la population : Type de gamète

Génotypes (valeurs, fréquences) Valeur moy. des génotypes

Moyenne de la population

Effet moyen du gène

A1 A1 A1 A2 A2 A2 a d -a

A1 p q pa + qd -[[[[a(p-q) + 2dpq]]]] q[[[[a + d(q-p)]]]] A2 p q -qa + pd -[[[[a(p-q) + 2dpq]]]] -p[[[[ a + d(q-p)]]]] On peut aussi exprimer ces effets moyens en termes d’effet moyen d’une substitution allélique :

αααα = a + d(q – p) équivalent à αααα = αααα1 - αααα2

soit : αααα1 = qαααα αααα2 = -pαααα

L’effet moyen dépend explicitement des fréquences alléliques donc :

��de la population où la substitution se produit ��des échantillons extraits de la population pour estimer les paramètres génétiques

Les erreurs d’échantillonnage sont donc communes pour ces estimations à partir de populations naturelles. Fixation de A :

- si A rare et dominant : effet moyen très important

- si A commun et dominant : effet très réduit

- si A rare et récessif : effet très important

- si A fréquent et récessif : effet réduit

68

Valeur reproductive

Les effets moyens, qui se réfèrent à des allèles isolés, sont des abstractions théoriques. La valeur d’un individu, jugée par la valeur moyenne de sa progéniture, est sa valeur reproductive. Elle se mesure. Cette mesure n’a de sens que pour l’individu et la population dans laquelle il s’est accouplé. La valeur reproductive d’un individu est la somme des effets moyens des gènes qu’il porte. Pour un locus à 2 allèles :

---------------------------------------- A1 A1 : 2αααα1 = 2qαααα

A1 A2 : αααα1 + αααα2 = (q-p)αααα A2 A2 : 2αααα2 = -2pαααα

------------------------------------------------------------ La variation des valeurs reproductives (= ‘génotypes additifs’) est appelée variation génétique additive. Les effets non additifs incluent la dominance, les interactions entre locus et parfois les

effets maternels (covariance génotype x environnement)

69

Le modèle de base La variation continue est en fait la somme d'une composante génétique et d'une

composante environnementale : P = G + E

��2 origines : (i) normes de réaction (environnement au sens large = conditions de

vie) => justifient qu’un clone ou des lignées consanguines restent variables, (ii)

effets additifs des gènes (G)

��1 principe de base : les descendants ressemblent à leurs parents plus qu'à un

individu tiré au hasard de leur population => variable utile = différence de taille

entre un individu et la moyenne de la population = déviation phénotypique (P)

Variabilité du phénotype mesurée par la dispersion de P autour de sa moyenne (0) : VP

D'où VP = VG + VE

��La variation de taille dépend d'une variation (i) génétique, (ii) environnementale

Héritabilité

�� L'héritabilité au sens large H2 est le rapport VG / VP : part de la variance

phénotypique d’origine génétique => si VP proche de VG, le caractère est

essentiellement déterminé par des gènes

��2 méthodes pour la mesurer :

- ressemblance entre apparentés : régression parent moyen-enfants ou

corrélation entre apparentés

70

��La connaissance de H2 permet de prédire P chez un individu dont on connaît

le(s) parent(s). Pour une reproduction sexuée, G n’est pas transmis en

totalité :

- la moitié des gènes sont transmis

- relations de dominance (interactions entre allèles d’un même locus)

détruites par la méiose (cf descendances des homozygotes dominants vs.

hétérozygotes)

- relations d’épistasie (associations horizontales : interactions entre loci)

modifiées par la recombinaison

��VG décomposée en 3 composantes (modèle complet) :

- l’effet (variance) « additif » transmis (VA) = valeur reproductive

- la variance de dominance (VD)

- la variance d’interaction (VI)

��VA / VP = h2 : héritabilité au sens étroit, utilisée quand la reproduction est

sexuée => proportion de la variation phénotypique due à la variation entre

valeurs reproductives.

71

Une application : la sélection artificielle raisonnée

Domestication : sélection non rationnelle très forte sur des caractères d’intérêt

généralement continus

Sélection dirigée : avec les outils de la génétique quantitative : prédiction de la

réponse à la sélection => changement de la moyenne du phénotype par génération de

sélection artificielle

3 concepts :

��S : différentiel de sélection

= moyenne des parents sélectionnés – moyenne population

��R : réponse à la sélection

= moyenne des descendants – moyenne pop de la génération précédente

��I : intensité de la sélection

= S / écart-type phénotypique de la pop des parents

Une relation très simple unit ces concepts à celui d’héritabilité :

R = h2S

72

Un exemple célèbre de sélection artificielle : l’huile de maïs

��isolement de lignées de plus en plus riches (resp. pauvres) en huile durant 76 générations

��contenu initial moyen : 5% ��contenu ‘final’ dans les 2 lignées : 20% vs. 0.4% ������ de la réponse : héritabilités passées respectivement de 0.3 à 0.12

(lignée grasse) et de 0.5 à 0.15 (lignée maigre) ��La fréquence des allèles ‘stimulant’ le caractère recherché ���� :

épuisement de la variation génétique

73

Génétique quantitative et sélection naturelle : les pinsons de Darwin (revus par Grant & Grant, 1993)

Traits de vie = caractères quantitatifs ��la génétique quantitative permet donc de comprendre la SN et d’étudier

ses effets à court terme ��valeurs d’héritabilité déterminées expérimentalement (comparaison

parent-enfant)

��1 espèce = 1 taille (et 1 forme) de bec => consommation optimale d’une

classe de graines. Ex : Geospiza fortis consomme préférentiellement de petites graines

74

��2 événements imprévisibles :

- 1977-78 : sécheresse => chute d’effectif de 1200 à 180 affectant particulièrement les femelles : pourquoi ?

au début : toutes tailles de graines disponibles à la fin : les petites ont disparu => avantage aux pinsons les plus grands, plus efficaces => ���� de la taille moyenne à la génération suivante (+ 4%) - 1982 : ‘El Nino’ (pluies) => production de graines énorme : direction

du changement évolutif inversée ? survie plus grande des petits mieux adaptés à l’exploitation de petites graines (cf marquage) => pinsons nés en 85 : becs 2.5% plus petits

��Estimation d’un différentiel de sélection S pour plusieurs caractères : Moyenne des survivants (parents) – moyenne de la pop

- becs moins longs légèrement favorisés (survie ����) : S = -0.3 mm - becs moins larges très favorisés : S = -0.17mm

��Héritabilités hauteur-longueur-largeur du bec : 0.65<h2<0.79 ��Sachant R = h2S, on prédit 1 réponse à la sélection indétectable pour la

longueur (-0.02mm), mesurable pour la largeur (-0.15mm). C’est ce qu’ont confirmé les mesures effectuées : - pas de changement pour la longueur - � de 0.12mm de la largeur moyenne

75

Erosion naturelle de la variabilité génétique ��Comme en génétique des pops, la variabilité génétique dans les populations

naturelles est maintenue grâce aux mutations mais réduite par la dérive et la SN

��La dérive entraîne une diversité interpopulation Qu’elle soit mesurée par H (hétérozygotie pour les caractères qualitatifs) ou par Vp (variance phénotypique), la diversité génétique répond de la même manière aux 3 pressions évolutives majeures

��ces effets interviennent simultanément dans la nature

76

Génétique quantitative et génétique mendélienne sont-elles vraiment

si différentes ? Non !

Les calculs le prouvent

��R. Fisher aborda le problème : la transmission mendélienne des gènes assure une

transmission des phénotypes selon le modèle de régression parent-enfant.

On a vu l’intervention de la génétique des pops dans le calcul des effets moyens

��E n’a, à tord, pas d’équivalent mendélien

��Un nombre limité de locus conduit à 1 distribution normale du caractère

Les méthodes empiriques aussi : la technique des QTL

��localisation des locus (ou des régions chromosomiques) déterminant la variation

quantitative

��Expérience : 2 souches A et B différant par leur taille : - quelque part sur le B : gènes d’1 grande taille - 2 croisements : A x B puis un ‘backcross’ A x F1 => le chromosome mosaïque

peut receler 1 fragment blanc porteur des gènes ‘grand’ se répercutant sur la taille de l’individu

- si les individus ayant hérité d’1 fragment blanc dans une certaine région sont en moyenne plus grands que ceux qui ont hérité d’1 noir => région comportant 1 locus impliqué dans la taille

��Il faut repérer ces régions : marqueurs génétiques (microsatellites) répartis le long du chromosome (cf. barre noire avec allèle a pour la souche A, b pour B)

77

Cours 4 : Ecologie des populations (5.5, § 1)

GENERALITES

L’organisme dans son environnement

• Les organismes dépendent totalement de l’environnement physique (énergie, matériels) mais l’influencent également

• L’organisme : un système ouvert => flux :

- flux (courant) = surface x conductance (1/résistance) x gradient (ddp)

- surface relative (cf notion d’allométrie) et propriétés de la surface

• Réponses à une variation environnementale

- homéostasie : c’est quoi et que faire quand elle coûte trop cher ? - gros grain vs. grain fin : l’échelle de la variation spatiale ou

temporelle - facteurs biologiques dans l’environnement

• modification adaptative : la balance entre coûts et bénéfices penche pour les seconds

Démographie

Populations : structures d’âge ou stades - table de survie et équation de Euler-Lotka

- dynamique des populations : modèles à une seule espèce Modèles en temps continu Modèles en temps discret

- dynamique des populations : modèles à deux espèces Compétition Modèle prédateur-proie

78

Evolution des histoires de vie

2 approches pour comprendre l'évolution des organismes vers une configuration adaptée de leurs traits (stratégie adaptative) :

- optimisation : modèles fondés sur 2 hypothèses :

(i) la sélection maximise une mesure de la fitness,

(ii) l'existence de compromis / la valeur optimale d'un trait entraîne une modification d'autres traits causant une diminution de la fitness. => état qu'un organisme doit atteindre (compromis optimal), sans information sur les moyens d'y parvenir ;

- génétique quantitative : infos sur les moyens permettant la transmission d'une génération à l'autre d'un trait et sur son maintien

=> prédiction de trajectoires évolutives sur du court terme

79

ECOLOGIE ET EVOLUTION DES POPULATIONS

��L'écologie des populations étudie les mécanismes qui expliquent les

variations de taille et de distribution des populations en interaction avec les habitats et tente de les prédire dans le temps et l’espace.

- population = groupe d’individus de la même espèce vivant sur une surface définie

- Nt+1 = Nt + naissances – morts + immigration – émigration => Nt+1 = f(Nt)

. t = un point ds le temps

. les événements se produisent entre t et t+1

. cette équation ignore la dynamique de la croissance de la population : (i) les naissances induisent 1 feedback positif (boucle), (ii) des âges ou/et des génotypes différents peuvent avoir des taux de mortalité, de reproduction ou de migration différents

��L'écologie évolutive intègre écologie et génétique des populations : le taux de croissance d’une population est influencé par les fréquences génotypiques. La fitness des génotypes dépend elle-même de la taille de la population et de la fréquence des gènes :

Nt+1 = f(pt, Nt) et pt+1 = g(pt, Nt) - traits d'histoire de vie (âge-spécifiques) : lien entre approches

écologique et évolutive. Associés à (i) la survie individuelle (ici et maintenant : taille, croissance

corporelle, longévité, mécanismes de défense ; mécanismes migratoires et de diapause)

(ii) l'accroissement du nombre de descendants - Fitness : espérance du nombre de descendants viables et fertiles

(i) fitness absolue : mesure de la capacité de survie et de reproduction dans un environnement donné,

(ii) fitness darwinienne : succès moyen d'un groupe d'individus porteurs d'un génotype ou d'un allèle particuliers,

(iii) fitness ‘démographique’ : contribution moyenne d'un individu à l'accroissement de la population.

- Stratégies adaptatives : combinaisons de traits sélectionnées dans des

limites fixées par des (i) contraintes (physiologiques, phylogénétiques), (ii) compromis (ou trade-off) entre traits : stock individuel d'énergie

limité => répartition entre traits assurant la survie et traits augmentant le nombre de descendants, les uns ne pouvant se développer qu'aux dépens des autres : coûts.

80

Modélisation de la croissance d’une population

Dans l’hypothèse où le taux de croissance est constant, 2 approches ‘extrêmes’ :

��temps discret : temps divisé en intervalles (ex : 1 an) => équations (de différence) décrivant la croissance d’un pas de temps à l’autre (croissance géométrique) ;

Nt+1 = R Nt + Nt (R = taux net de croissance per capita)

Nt+1 = (R + 1) Nt

Nt+1 = λλλλ Nt (λλλλ = taux fini d’accroissement per capita)

à t = 0, N0 individus => NT = N0λλλλT

��temps continu => équations différentielles (croissance exponentielle)

dN/dt = rN(t) (r = taux intrinsèque d’accroissement per capita)

�� =TtN

NdtrNtdN

0

)(

)0(/)(

ln N(t) – ln N(0) = rT – r 0 = rT

N(t) / N(0) = e rT

81

��R vs. r => une différence bien connue des banquiers…

Ex . : T = 25 ans et r = R = 0.2/an (cf. graphiques)

��les ‘intérêts’ s’additionnent instantanément au capital (r) ou seulement 1 fois par an (R) :

- croissance géométrique : NT = N0λλλλT

- croissance exponentielle : NT = N0erT

�� expressions id. après substitution : λλλλ = er

�� R =λλλλ - 1 => R = er – 1

�� Si r = 0.2, les courbes se superposent pour R = e0.2 – 1 = 0.2214

��Comparaison croissance exponentielle- croissance géométrique

��Croissance exponentielle (r = 0.2) et croissance géométrique (R = 0.2214)

82

Tables de survie-fécondité (life tables) L'importance de la structure d'âge est fondamentale en écologie évolutive

car l’action d’une pression sélective est souvent différente d’une classe d'âge à l’autre. Les tables de survie/fécondité sont essentielles pour connaître l'état démographique actuel (probas de naissance et de mortalité) et prédire l'état futur d'une population. Les paramètres démographiques déduits des tables sont en relation avec les traits d'histoire de vie soumis à la sélection naturelle.

��Les tables de survie ne sont qu’un support à la modélisation de l’évolution des histoires de vie.

Il faut distinguer : ��les tables statiques (verticales) : recensement de la population à un moment

donné en comptabilisant les vivants et les morts par classe d'âge => méthode souvent biaisée (mortalité/natalité variable d'année en année)

��les tables par cohorte (par génération, horizontales) : mesures sur une même cohorte tout au long de son existence => méthode exacte, mais lourde

Age et classe d'âge

Le temps étant continu, les individus sont répartis en classes d'âge [x, x+1]

��Classe d’âge 0 = naissance <âge< 1er anniversaire, etc.

��notation par âge x=0,1,2... dans les tables de survie et notation par classes d'âge i=1,2,3... dans les modèles matriciels

��Chaque classe d'âge i correspond aux âges i-1 ≤≤≤≤ x ≤≤≤≤ i et i = [x,x+1] :

1 confusion vient du fait que le nombre attribué à la classe d'âge peut aussi être celui de la borne inférieure de l'âge.

x=0 x=1 x=2 x=3 x=4

i=1 i=2 i=3 i=4 classe d'âge

âge

83

Paramètres

1. Effectifs par âge

ax : nombre de femelles survivantes à l'âge x

Jx : nombre de jeunes (filles) produits par toutes les femelles d'âge x

2. Eléments de la table de survie/fécondité

px : proportion de survivants de l’âge x et x+1

px = ax+1/ax qx : proportion de morts entre x et x+1

qx = (ax - ax+1)/ax

lx : proportion de survivants de la naissance jusqu'à l'âge x

lx = ax/a0 mx : nb. attendu de jeunes produits par femelle de la classe d'âge x

mx = Jx/ax

. Pour 1 individu appartenant à la classe d'âge [x,x+1] dans la population : ��lx est sa probabilité de survie jusqu'à cet âge, il caractérise la longévité de

l'individu ��mx est le nombre moyen de descendants de cet individu dans cette classe, il

caractérise sa fécondité ��lx mx est appelée fonction de reproduction

. Si les éléments de la table sont constants, la population est caractérisée (i) par 1 distribution d’âge stable, (ii) 1 taux de croissance exponentiel constant

Exemple de table de survie/fécondité

âge x classe

d'âge i

ax Jx lx

=ax/a0

mx

=Jx/ax

lxmx

0 1000 0 1.0 0 0

1 1 [0,1] 500 500 0.5 1 0.5

2 2 [1,2] 400 1200 0.4 3 1.2

3 3 [2,3] 200 400 0.2 2 0.4

4 4 [3,4] 0 0 0 0 0.0

84

3. Fécondité nette : R0

Définie de plusieurs façons :

�� taux net d'accroissement par génération avec structure d’âge stable => cf. modèle le plus simple de croissance démographique :

Pour g générations : Ng = R0gN0

��taux d’accroissement observé par unité de temps T (λλλλ �= R0 1/T) = Nt+1/Nt

��taux net de reproduction = nb moyen de descendants (filles) produit par une femelle durant toute sa vie

��fonction de reproduction cumulée de la naissance à la mort :

�∞

==

0x0 R xxml

��ex. : R0 = 1.3 (1 femelle ayant achevé sa reproduction est remplacée par 1.3 femelle) => la population s’accroît de 30% par génération

4. Temps de génération : T

��Age moyen des mères de jeunes produits par une population de distribution d’âge stable :

=

== max

0

max

0 T

x

xx

x

xx

ml

mxl

= 10

x

0xxx ).mxl( −

=

=� R

ω

��Age moyen des mères de jeunes produits par une cohorte (moyenne des lx.mx)

��Temps moyen nécessaire pour accroître une population d'un facteur R0

5. Espérance de vie à l'âge x Nombre moyen d'unités de temps (ex. années) restant à vivre pour un individu donné.

e

a a

aL lx

ii x

i

xii x x=

+==

∞+

=∞

��

( ) /

/1 2

avec La a

aii i= + +( )1

02

85

6. Taux maximum intrinsèque d'accroissement : rm

Taux instantané de croissance per capita (modèle exponentiel en temps continu)

��méthode estimée

rLog R

Gc =( )0

appelé encore capacité d'accroissement

L'estimation est bonne si R0 ≈1. L'approximation se situe en général dans une fourchette de 10% autour de la valeur exacte de r.

��méthode exacte : solution de l'équation d'Euler (Lotka, 1907) encore appelée équation caractéristique :

ΣΣΣΣx=0 e-rx lx.mx = 1

Chaque table de survie est caractérisée par son taux intrinsèque d’accroissement et, pour 1 distribution d’âge stable, chaque classe croît au même taux (exponentiel) :

�∞

==

00 )()(

x

xx mtntn

� nb de nouveau-nés au temps t = somme des descendants des individus de chaque classe d’âge (x)

��nb d’individus d’âge x vivants à t [nx(t)] = (nb de nouveau-nés x années (pas de temps) plus tôt) x (leur survie jusqu’à t) => n0(t-x)lx = nx(t)

� �∞

=−=

000 )()(

x

xxmlxtntn

��sachant nx(t) = n0(t)ert , on peut calculer l’effectif d’1 classe d’âge en n’importe quel point du passé (t-x) en inversant le signe de r (‘retour ds le passé’) => n0(t-x) = n0(t) erx

�� �∞

=

−=0

00 )()(x

xxrx mletntn

�� �∞

=

−=0

1x

xxrx mle

Cette équation ne peut se résoudre (valeur exacte de r) que par itérations à partir d'une valeur approchée (par exemple rc).

86

8. Valeur reproductive à l'âge x : Vx

VRRmmlle

Vx xixi

iri

x

rx

e +== �∞

=

valeur reproductive résiduelle :

iixi

rix

rxmlel

eVRR .

1�∞

+=

−=

��VRR = [valeur d'un descendant futur d'un individu] / [valeur de cet individu]

valeur reproductive totale = deux composantes :

Vx = contribution actuelle + contribution attendue

à la population future à la population future

(=mx) (= VRR)

Elle mesure donc la contribution de chaque classe d'âge à la fitness. Dans une certaine mesure, la maximisation de la fitness est équivalente à la maximisation de la valeur reproductive à chaque âge.

87

Un modèle en temps discret : la matrice de Leslie Description de la structure d'âge

Soit une population (de femelles) présentant m classes d'âge de durée égale. On cherche à décrire l'évolution de cette population à l'aide d'un pas de temps ∆∆∆∆t égal à la durée de chaque classe d'âge (ex : 1 an). On représente la population au temps t par un vecteur n(t) contenant les effectifs de chaque classe d'âge i=1 à m :

n t

n tn t

n tm

( )

( )( )

......( )

=

����

1

2

Pour connaître l'effectif des différentes classes d'âge à t+1, on utilise une matrice particulière [M] qui contient les paramètres démographiques de survie (p) et de fécondité (F) pour chaque classe d'âge. Le modèle de Leslie stipule que pour des paramètres correctement choisis on peut écrire: [M] n(t) = n(t+1) avec n(t+1) = vecteur d'âge à t+1. Construction de la matrice de Leslie à partir des éléments de la table de survie

Les éléments de la matrice doivent satisfaire les expressions suivantes : n1(t+1)=ΣΣΣΣ Fini(t)

ni(t+1)=Pi-1ni-1(t) pour i=2, 3...

=

− 00000...............0....000....00

....

1

2

1321

m

m

p

pp

FFFF

M

��La première ligne contient les coefficients de fertilité Fi : nombre

d'individus de la classe 1 au temps t+1 produits par chaque individu de la classe i au temps t

��La sous-diagonale contient les probabilités de survie des individus d'une

classe i à t dans la classe i+1 à t+1

88

Le mode de calcul des Fi et Pi dépend du mode de reproduction de la population et du mode de recensement. Pour une population à reproduction discontinue, si le comptage est réalisé juste après la reproduction

• la survie de la classe i )1(

)(−=

ililPi

le nombre de descendants au temps t+1 issus d'une femelle appartenant à la classe d'âge i au temps t sera : Fi = mi. pi

Exemple avec la table de survie/fécondité précédente :

âge x lx

mx

classe

d'âge i

Pi Fi

0 1.0 0

1 0.5 1 1 [0,1] 0.5 0.5

2 0.4 3 2 [1,2] 0.8 2.4

3 0.2 2 3 [2,3] 0.5 1.0

4 0.0 0 4 [3,4] 0.0 0.0

F1 F2 F3 F4

F1 0.5 2.4 1.0 0.0

F2 0.5 0.0 0.0 0.0

F3 0.0 0.8 0.0 0.0

F4 0.0 0.0 0.5 0.0

89

Propriétés de la matrice de Leslie.

On réitère le produit [M] n(t) = n(t+1) pour t, t+1, t+2...

Au bout d'un certain nombre d'itérations, le rapport L=n(t+1)/n(t) se stabilise autour d'une valeur λλλλ. Simultanément le vecteur v(t) = n(t) transformé en fréquences relatives, se stabilise dans 1 direction qui est celle d'un vecteur u.

��∃ 1 vecteur u et un scalaire λλλλ qui satisfont l'équation suivante :

[M] u =�λλλλ u ��Le scalaire �λλλλ est la première valeur propre de M et correspond au taux fini

d'accroissement de la population (croissance géométrique).

��Le vecteur u est le premier vecteur propre de M et correspond au vecteur d'âge stable de la population : il contient les proportions de chaque classe d'âge observées quand la population s'accroît avec un taux �λλλλ.

Distribution stable : les effectifs de chaque classe sont distribués selon u

Distribution stationnaire : distribution stable dans laquelle les effectifs restent stables => la population possède une croissance nulle (�λλλλ=1).

Taux de convergence : ρρρρ = λλλλ1111 / |λ / |λ / |λ / |λ2222|||| Plus ρρρρ est fort, plus la population atteint rapidement la structure stable

Hypothèses du modèle matriciel de Leslie

Ce modèle très simple représente une croissance exponentielle en temps discret avec une structure d'âge. L'application de ce modèle suppose les conditions suivantes : 1. la population est isolée (pas de flux migratoires ni de dispersion) 2. les classes d'âge sont de durée égale 3. l'espace et la nourriture sont illimités (pas de densité-dépendance) 4. la mortalité et la fécondité sont constantes dans la population et au cours du

temps (pas de fluctuations interannuelles de ces paramètres)

Il s'agit en fait d’une hypothèse nulle qui permet de tester des alternatives concernant le fonctionnement de la population, notamment : • existence de flux migratoires • densité-dépendance • fluctuations interannuelles des paramètres démographiques

90

L’équation logistique : un modèle particulier de densité-dépendance

Sans régulation, même une population à reproduction très lente recouvrirait rapidement la Terre (cf. Malthus)

��l’équation logistique décrit très simplement la croissance d’une population régulée : [[[[taux d’accroissement]]]] = [[[[r]]]] [[[[N]]]] [[[[opportunité de croissance non exploitée]]]]

��temps discret : => équations de différence :

forme générale : Nt+1 = F(Nt)+ Nt

[ ])1(11 KNRNN ttt −+=+

��temps continu => équations différentielles

dN/dt = rN - f(N)

)( KNKrNdt

dN −=

dont la solution est : rte

NNK

KtN−−+

=)(1

)(

0

0

��le taux d’accroissement diminue linéairement avec la taille de la

population : - si N < K (N/K<1) => accroissement à 1 taux d’autant plus lent que N

proche de K

- si N > K (N/K>1) => décroissance linéaire de la population

- K : point d’équilibre = capacité limite du milieu

91

��à l’intersection des 2 lignes : population à l’équilibre (Nt = Nt+1) ��même valeur de K (50) mais R plus élevé

��même courbe avec évolution par pas de temps des effectifs à partir d’1

taille initiale de 20

����

��transcription sur un diagramme effectif- (pas de temps)

92

Repères bibliographiques (en vert : les incontournables) Evolution Avise J. C., 1994. Molecular markers, natural history and evolution. Chapman &

Hall.

Brondex F., 2000. Evolution : synthèse des faits et théorie. Coll. ‘Sciences sup’, Dunod.

David P. & Samadi S., 2000. La théorie de l’évolution : une logique pour la biologie. Coll. ‘Champs-Université’, Flammarion.

Gould S.J. : tous ses petits essais publiés en ‘poche’. ‘Point Sciences’, Seuil.

Futuyma D. J., 1998. Evolutionary Biology. 3rd edition. Sinauer Assoc.

Hartl D.L., 1994. (traduction de ‘A primer of population genetics’). Génétique des populations. ‘Médecine-Sciences’ Flammarion.

Hartl D.L. & Clark A.G., 1989. Principles of population genetics. Sinauer Assoc.

Henry J.P. & Gouyon P.H., 1997. Précis de génétique des populations. Masson (SV).

Le Guyader H., 1998. L’évolution. Bibliothèque ‘Pour la science’.

Maynard Smith J., 1989. Evolutionary Genetics. Oxford University Press.

Ridley M., 1998. Evolution biologique. De Boeck Université.

Solignac M., Périquet G., Anxolabéhère D. & Petit C., 1995. Génétique et évolution, 1 & 2. Coll. ‘Méthodes’, Hermann.

Ecologie Barbault R.,1992. Ecologie des populations et des peuplements. Masson, Paris.

Begon M. & Harper M., 1996. Population ecology : a unified study of animals and plants. 3rd ed. Sinauer Associates, Inc., Sunderland, Massachussetts.

Blondel J., 1995. Biogéographie. Masson, Paris.

Case T.J., 2000. An illustrated guide to theoretical Ecology. Oxford Univ. Press, Oxford.

Henry C., 2001. Biologie des populations animales et végétales. Coll. ‘Sciences sup’, Dunod.

Ricklefs R.E., 1990. Ecology. 3° ed. Freeman and Co., New York.

Stearns S.C. & Hoekstra F. 2000. Evolution. Oxford Univ. Press, Oxford.