基因组时代的 动物遗传评估技术

35
基基基基基基 基基基 基基基基 张 张 张张张 张张张张张张 2009.8.25 张张张

Upload: varian

Post on 19-Mar-2016

137 views

Category:

Documents


0 download

DESCRIPTION

基因组时代的 动物遗传评估技术. 张 勤 刘剑锋 中国农业大学 2009.8.25 哈尔滨. 遗传评估. 评估和比较动物个体在遗传上的优劣 为选择优秀种用个体提供依据 动物育种的中心工作. 表现型=基因型+环境. 选择. 常规遗传评估技术. 基因 (黑箱). 表型. 遗传评估. BLUP. 亲属的表型. 环境. 特点:利用表型进行遗传评估. 常规遗传评估技术. BLUP 方法是常规遗传评估技术的核心. y :表型信息 A :系谱信息. 美国荷斯坦奶牛产奶量表型及遗传进展. 常规遗传评估技术. 加拿大猪 100kg 体重日龄遗传进展. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 基因组时代的 动物遗传评估技术

基因组时代的动物遗传评估技术张 勤 刘剑锋中国农业大学2009.8.25哈尔滨

Page 2: 基因组时代的 动物遗传评估技术

遗传评估• 评估和比较动物个体在遗传上的优劣• 为选择优秀种用个体提供依据• 动物育种的中心工作

表现型=基因型+环境

Page 3: 基因组时代的 动物遗传评估技术

常规遗传评估技术基因基因(黑箱)(黑箱) 表型表型

环境环境

选择选择

遗传评估遗传评估

亲属的表型亲属的表型

BLUPBLUP

特点:利用表型进行遗传评估

Page 4: 基因组时代的 动物遗传评估技术

常规遗传评估技术• BLUP 方法是常规遗传评估技术的核心

yZyX

AZZXZZXXX

e ''

u

ˆ''

''12

a2

y :表型信息A :系谱信息

eZuXy

Page 5: 基因组时代的 动物遗传评估技术

常规遗传评估技术• 对很多重要经济性状十分有效

Milk yield in US Holsteins

6

7

8

9

10

11

12

1960 1970 1980 1990 2000Birth year

Firs

t lac

tatio

n yi

eld

(100

0 kg

)

Genetic

Phenotypic

美国荷斯坦奶牛产奶量表型及遗传进展加拿大猪 100kg体重日龄遗传进展

Page 6: 基因组时代的 动物遗传评估技术

常规遗传评估技术• 局限性

– 当性状表型难以获取或遗传力低时,遗传评估可靠性不高– 不能进行早期遗传评估

Page 7: 基因组时代的 动物遗传评估技术

标记辅助选择(MAS)基因基因(黑箱)(黑箱) 表型数据表型数据

基因信息基因信息遗传评估遗传评估分子遗传学分子遗传学

主效基因主效基因 //QTLQTL

选择选择

特点:利用表型和部分基因的信息进行遗传评估

Page 8: 基因组时代的 动物遗传评估技术

标记辅助选择( MAS )

eMgZuXy y :表型信息A :系谱信息M : 标记信息

遗传评估技术 - MA-BLUP :

Page 9: 基因组时代的 动物遗传评估技术

标记辅助选择( MAS )• 应用现状

– 实际应用不多– 应用效果不显著– 主要原因:

• 已被证实具有显著效应的基因或标记有限– (发现并证实一个有效的基因需要很长的时间和很高的成本)

• 这些基因或标记仅能解释有限的遗传变异– ( 10 QTL ~ 50% 遗传变异)

Page 10: 基因组时代的 动物遗传评估技术

基因组选择• 利用覆盖全基因组的高密度标记( SNP )进行个体遗传评估

– 可以捕获所有的遗传变异– 无需表型信息即可进行遗传评估– 利用 SNP 芯片技术进行标记测定

基因基因(黑箱)(黑箱) 标记信息标记信息 遗传评估遗传评估

Page 11: 基因组时代的 动物遗传评估技术

全基因组 SNP芯片

Year No. SNP ChipsHuman 2008 3,000,000 1000k

Poultry 2005 2,800,000 60K

Bovine 2007 ~2,000,000 54k

Pig 2008 ~2,000,000 60k

Sheep 2007 - 50k

Page 12: 基因组时代的 动物遗传评估技术

用于遗传评估的数据10001112200200121110111121111011110011211000201220022201111202101200211122110021112001111001011011010220011002201101120020110102022212112210201001110001122022122211202112012020100202202000021100011202011221112111022011110000212202000221012020002211220111012100111211102112110020102100022000220100020110000220221102211210112111012222001211212220020002002020201222110022222220022121111210021111200110111011200202220001112011010211121211102022100211201211001111102111211021112200010110111020220022111010201112111101120210210212110110221220012110112110120220110022200210021100011100211021101110002220020221212110002220102002222121221121112002011020200122222211221202121121011001211011020022000200100200011110110012110212121112010101212022101010111110211021122111111212111210110120011111021111011111220121012121101022202021211222120222002121210121210201100111222121101

Page 13: 基因组时代的 动物遗传评估技术

基因组选择• 基本步骤1. 利用一个参考群体估计每个 SNP的效应

–参考群体:每个个体都有性状表型记录和所有 SNP基因型2. 利用 SNP效应估计值计算候选群体的个体基因组育种值

–候选群体:每个个体都有所有 SNP基因型

Page 14: 基因组时代的 动物遗传评估技术

基因组选择估计所有

SNP 的遗传效应SNP 基因型性状表型

SNP 基因型 估计基因组育种值

SNP 基因型

候选群体

估计基因组育种值

参考群体

Page 15: 基因组时代的 动物遗传评估技术

在参考群中估计标记效应 gi

1n i iy X g e

设计矩阵 染色体片断遗传效应

估计标记效应

Page 16: 基因组时代的 动物遗传评估技术

在候选群体中计算个体 gEBV

p

i iigXEBV1

g

全部基因组染色体片断

设计矩阵 染色体片断效应

计算基因组育种值 (gEBV)

Page 17: 基因组时代的 动物遗传评估技术

基因组育种值

1 + 1 - 1 - 1 + 1 + 25 - 1 + 1 - 1 - 1 - 1 + 42 + 1 - 1 - 1 - 1 - 1 - 22 - 1 + 1 - 1 - 1 = +38

- 40

SNPeffect

- 00

+ 20

+ 40

- 20

Chr 1 Chr 2 Chr 3 ...... Chr n

Known SNPs

n

iiigEBV

1

gXNumber of SNPs

SNP allele effect

Page 18: 基因组时代的 动物遗传评估技术

标记效应的估计方法最小二乘法岭回归和 BLUP贝叶斯方法

BayesA, B, C 和压缩其他方法

半参数、非参数机器学习、主成份分析

Page 19: 基因组时代的 动物遗传评估技术

最小二乘法对标记效应分布无任何假设1: 对每个标记作单点回归分析

2: 选择效应值最大的 m 个点放入模型中,同时对其进行估计

1ny Xg e

1n i iy X g e 不足:

1. 难以确定模型选择的阈值 2. 容易高估标记效应

Page 20: 基因组时代的 动物遗传评估技术

最佳线性无偏预测和岭回归

假定全部标记有相同的方差

2)( gVar Ig

1ˆ ( ' ) 'X X X y g Iλ

1n i iy X g e

22ge BLUP:

岭回归 : 人为选定

2

2

2

2

0 0 0 0 00 0 0 0... ... ... ...

0 0... ...

g

g

g

g

sym.

Page 21: 基因组时代的 动物遗传评估技术

贝叶斯方法 -A允许不同标记有不同的方差且服从一定分布

)()|()|( 222iii ggiig PgPP g

( , | ) ( | , ) ( , )i i iP y P y g P g g数据模型

方差模型

),(~ 22 svgi

使用 Gibbs sampling!u , gi , Ve , Vgi

图片来自 Hayes,2001

Page 22: 基因组时代的 动物遗传评估技术

允许标记方差为 0

概率为 q

概率为 1-q

02 gi

),(~ 22 svgi

2

0

122

01

2

10

122

01

2 // gj

n

iij

n

i

p

jkkikiijgj

n

iij xbxbyxxN ,

Bayesian shrinkage

标记效应越大 , 压缩越弱 标记效应越小,压缩越强

贝叶斯方法 -B,压缩

Page 23: 基因组时代的 动物遗传评估技术

准确性:估计育种值和真实育种值间的相关0. 848

0. 7980. 732

0. 318

00. 10. 20. 30. 40. 50. 60. 70. 80. 9

1

LS BLUP BayesA BayesB

Accu

racy

r2

数据来自 Meuwissen al et., 2001

不同方法的准确性

Page 24: 基因组时代的 动物遗传评估技术

SNP Add.

Polygenic

SNP Dom.

y 1 Xa Zu e

y 1 Xa Yd Zu e

y 1 Xa e

a: additive SNP d: dominance SNPu: polygenic e: residue

y :表型信息X: 遗传标记信息A :系谱信息

模型的扩展

Page 25: 基因组时代的 动物遗传评估技术

基因组选择和常规遗传估计技术的育种效益比较(以奶业为例)• 后裔测验 ( 数据来自加拿大 )

– 每年参加后测的公牛数量 : 500 头– 每头后测公牛的育种成本 : 5 万美元– 后测的总成本 : 2500 万美元– 中选公牛数目 : 20 头– 每头中选公牛的育种成本 : 125 万美元– 年遗传进展 : 0.215 遗传标准差– 单位遗传标准差遗传进展的育种成本 : 1.16亿美元

Page 26: 基因组时代的 动物遗传评估技术

• 基因组选择– 每个个体基因组标记信息测定成本: 500 美元– 基因组单倍型效应估计

• 孙女试验设计 : 50 个公牛家系 , 每头公牛 50 个儿子 ,每个儿子 100 个女儿• 效应估计成本: 125 万美元

– 公牛母亲选择• 进行 2000 头母牛的预选择• 全部个体进行基因组标记信息测定,根据 GEBV 选

择 1000母牛• 评估成本 :100 万美元

基因组选择和常规遗传估计技术的育种效益比较(以奶业为例)

Page 27: 基因组时代的 动物遗传评估技术

• 基因组选择(续)– 公牛选择

• 从 1000 头公牛母亲中获得 500 头预选公牛• 对所有公牛进行基因组标记测定,根据 GEBV 选择 20 头公牛• 评估成本 : 25 万美元

– 20 头公牛的购买成本 :10 万美元– 每头公牛连续3 年的维持费用 : 3 万美元– 每年的总育种成本 :195 万美元– 每年的遗传进展 : 0.467 遗传标准差– 单位遗传标准差遗传进展的育种成本: 417 万美元

基因组选择和常规遗传估计技术的育种效益比较(以奶业为例)

Page 28: 基因组时代的 动物遗传评估技术

基因组选择的另一策略• 利用参考群体估计 SNP效应• 选择效应显著的 SNP• 利用选择 SNP的信息构建的参考群体和候选群体个体间的加性遗传相关矩阵(具有性状特异性)• 用 BLUP方法估计候选群体(无表型信息)的个体育种值

Page 29: 基因组时代的 动物遗传评估技术

yZ

yXGZZXZ

ZXXX''

u

ˆ

''''

原理:

参考群体及候选群体的个体育种值利用 SNP 的信息构建的加性遗传相关矩阵

Page 30: 基因组时代的 动物遗传评估技术

基因型系谱121101011110

111211120200

101121101111

122221121111

101101111102

011111012011

1211200110100 = homozygous for first allele (alphabetically)1 = heterozygous2 = homozygous for second allele (alphabetically)

Page 31: 基因组时代的 动物遗传评估技术

G的构建

min

min

1 ssS

g ijij

m

kkijkij gS

mS

1

1

AIS0,0AIS1,5.0AIS2,1

alleleifalleleifallelsif

Sijk

Page 32: 基因组时代的 动物遗传评估技术

准确性

标记效应估计方法

两种基因组选择策略的比较

Page 33: 基因组时代的 动物遗传评估技术

基因组选择在奶牛中的应用开始应用基因组选择的年份 国家 应用范围

2009 Canada, Germany, USA, New Zealand, Israel, France, Ireland, Spain ( 8 个国家)

For the selection of: young unproven bulls,active proven bulls,Bull dams

2010 Austria, Australia, Poland ( 3 个国家)未来 /尚未决定 UK, Netherlands, Norway,

Denmark, Italian, Japan, Belgium, Czech Republic, Estonia, Finland, Hungary, Latvia, Slovak Republic, Slovenia, South Africa, Sweden, Switzerland, China ( 17个国家)

Page 34: 基因组时代的 动物遗传评估技术

Questions

• 如何估计和分析基因间的互作效应 ?• 基因组 SNP 标记测定数目的确定 ?• SNP 效应的估计周期 ?• 长期选择优化的方案问题 ?• 多性状选择问题 ? • 畜禽育种中基因定位的必要性 ?

Page 35: 基因组时代的 动物遗传评估技术

Thanks for your attentions!