快捷搜索:    Ů  1747  ùù  ī

Bartholome2016 海岸松 多代 GS的优势在于缩短育

Bartholomé J, Van Heerwaarden J, Isik F, et al (2016) Per...
 

Bartholomé J, Van Heerwaarden J, Isik F, et al (2016) Performance of genomic prediction within and across generations in maritime pine. BMC Genomics 17:604. doi: 10.1186/s12864-016-2879-8

摘要

背景:基因组选择是减少林木育种周期的有效途径。因此,评估子代的表现和世代GS模型的预测精度是一个关键问题。
结果:利用模拟数据,首次选择了有效近交群体规模(状态数)为25的海松(pinaster)参考种群。这一参考群体(n=818)包括三代(G0、G1和G2),用4436个单核苷酸多态性(SNP)标记进行基因分型。我们评估了校正集和验证集之间的相关性以及基于子代性能的验证对预测精度的影响。采用基于系谱(best linear unbiased prediction,ABLUP)和基于标记(genomic BLUP和Bayesian LASSO)的模型,对3个不同性状(周长、高度和茎直度)的育种值进行了预测。平均而言,ABLUP模型优于基因组预测模型,预测精度的最大差异为0.12,这取决于性状和验证方法。在相关性方面不同的验证方法之间,预测精度的平均差异为0.17。在校正集中包含前体,将预测精度的差异降低到0.03。当校正集中只使用G0和G1代的基因型,验证集中使用G2代的基因型(子代验证)时,预测精度在0.70到0.85之间。
结论:通过对亲本群体预测模型的训练,可以准确地预测子代的遗传价值,这对海松育种中实施GS具有一定的参考价值。

关键词:基因组选择、生长、多代、红松、子代验证、亲缘性、茎直度

背景

Meuwissen等人首次提出利用全基因组DNA标记预测基因组估计育种值(GEBV)已经从根本上改变了分子育种的前景。现在育种家可以获得大量的单核苷酸多态性(snp)。因此,他们把工作重点放在基因组选择上,基因组选择是基于一组期望与控制感兴趣表型的每个QTL连锁不平衡(LD)的标记。与经典的标记辅助选择(使用一小组特征良好的标记跟踪少量数量性状位点(qtl),每个qtl都有中到大的效果)相比,GS提供了单位时间内更高遗传增益的可能性[2-4]。因此,随着具有成本效益的基因分型平台的可用性[5],这种方法在动物[4,6]和植物[7,8]的育种中得到了广泛的应用,包括林木[9,10]。GS需要建立一个具有基因型和表型特征的校正群体的预测模型。然后利用该模型预测目标育种群体中的GEBV,仅从标记基因型进行预测。与传统的基于估计育种值(EBV)的选择方法一样,预测精度是评价遗传算法有效性的关键问题。通过评估用GS模型得到的GEBV与经典遗传评价(基于子代检验)得到的EBV之间的相关性来评价GS模型的预测精度。无论是一般的[1,11-15],还是基于物种的(玉米[3]、油棕[16]、大麦[17]、日本雪松[18]),模拟研究都试图确定影响GEBV准确性的关键因素。在对奶牛的综述中,Hayes等人[4]强调了四个主要因素:i)目标性状的遗传力,ii)性状的遗传结构(潜在qtl的数量和影响),iii)参考群体和目标群体中标记和qtl之间的LD水平,以及iv)参考群体的大小,以及参考种群和目标种群的关联程度。用于预测GEBV的统计方法也可能影响该预测的准确性[19],但影响程度较小。
在林木育种中,一个选择重组周期的持续时间取决于开花开始的时间(如海松的7-8年)和对成熟性状进行早期间接选择的年龄(如海松的总高和茎直度为10-12年)。因此,一个完整的周期通常持续20多年。此外,大多数复杂性状(如生长、茎型和分枝特性)的低到中等遗传率限制了对选择的反应,从而限制了预期的遗传增益。GS可以通过缩短育种周期和提高低遗传力性状的选择效率/强度来克服这些限制,从而提高育种策略的效率。对主要人工林树木(桉树、云杉和松树)的初步研究取得了令人鼓舞的结果[9,10],准确度高达0.8(表1),尽管这些异交物种的LD水平较低,其种群规模较大[20,21],标记覆盖率较低(即几千个位点)。这些研究表明,带有DNA标记的GS提供的精确度与通过后代测试进行经典遗传评估所获得的精确度相似(表1)。这种方法不是捕获标记和qtl之间的历史LD关联,而是通过更好地估计已实现的基因组关系来获得预测精度[22,23]。参考种群相对较小的有效种群规模和同一种群内的验证显然有助于提高准确度。事实上,对于较大的参考群体[24,25]或当GS模型应用于不同于参考群体的目标群体[26]时,获得了较低的精确度(约0.5)。评估各代GS模型的预测准确性是很重要的,因为重组可能改变下一代的标记等位基因阶段,而且选择可能改变等位基因频率[10]。
这些影响可能会降低几代人的GS精确度【11,27】。在树木育种中实施GS策略之前,验证各代GS模型并评估标记的预测能力是至关重要的。在“亲本”群体(亲本或前几代)中建立的标记性状关联应在后代群体中得到验证(即后代验证)[28,29]。据我们所知,还没有关于森林树种的研究使用经验数据来解决这个问题。实际上,在表1所列的所有研究中,同一代的个体被分成校准和验证集,用于评估GS模型。
海松(Pinus pinaster)是欧洲西南部主要的森林树种。20世纪60年代,法国启动了一项基于轮回选择策略的育种计划[30]。从“兰德”生态型(法国西南部发现的生态型)中挑选出635株创始人(G0树)的基础种群,用于生长(高度和周长)和茎直度。该群体经历了两个繁殖、测试和选择周期(即G1和G2代)。目前正在评估GS在海松育种中的应用潜力,同时实施带系谱重建的正向选择策略[31]。根据前两代661个个体的初步调查,低标记覆盖率(2500个SNPs,即约1.39个标记/cM)的GS模型对生长和茎直度的预测精度约为0.50[25]。在本研究中,我们首先根据以下标准选择了一个参考种群:i)以高性能为主要性状的育种方案,ii)有限的有效种群规模,以及iii)结合三代海松育种群体。我们进行了模拟以优化基因组预测的基因型个体集合。最后,使用具有真实表型和基因型数据的参考群体,我们的目的是:i)比较SNP标记和基于系谱的方法的预测能力;ii)研究校准集和验证集对系谱深度和相关性预测精度的影响,以及iii)研究使用第三代个体作为验证集(子代验证)对GS模型预测精度的影响。

基于系谱和标记的模型比较

考虑到分离基因组变异(如SNPs)与表型表达的所有可能机制以及识别它们所需的努力,GS研究的主要问题之一是证明标记相对于传统BLUP的预测价值。在本研究中,无论使用何种情境,使用系谱信息的模型(ABLUP)比基于标记的模型具有更高的预测精度。用于预测GEBV的标记密度(每厘米2.4个SNPs)可以解释这种差异。事实上,模拟研究表明,标记密度和预测精度之间可能存在正的渐近关系[14,22,56]。Grattapaglia[10]采用确定性方法表明,在有效种群数量低于60的情况下,标记模型达到与ABLUP模型相似精度的最小密度为每厘米2-3个SNPs。此外,我们的参考群体选择策略也可能降低了分子标记相对于系谱提供信息的额外增益。实际上,选择过程中的一个步骤是血统恢复,这改进了BVs的估计[31]。事实上,Munoz等人[57]报告说,使用G矩阵校正系谱并重新估计EBVs提高了预测精度。在树木育种计划中经常报告的系谱误差存在的情况下[31,58,59],在先前的GS研究中观察到的ABLUP和GBLUP在预测精度上的差异可能是有偏差的。然而,我们的结果与之前基于模拟[14,18]或经验[24,26,60,61]数据的林木研究结果一致,传统的BLUP方法的准确度与GS模型相似或略高,特别是对于遗传力较低的性状。因此,与传统的BLUP相比,GS方法的单位时间遗传增益仅取决于育种周期长度的减少。这种繁殖周期长度的减少引起了与传统BLUP相比遗传变异丧失和长期遗传增益维持的问题[62-64]。

您可能还会对下面的文章感兴趣: