动物育种数据分析的效益和挑战

推荐语:
育种数据分析的效益很高,也存在一些难点。这个PPT讲了育种数据计算中现状以及挑战,讲了动物育种中效率的提升依赖于工具的进步,这些工具目前的进一步发展也存在一些挑战. 很全面的讲述。文字中,我加上了自己的理解和翻译。

PPT链接

https://www.interfacesymposia.org/I03/I2003Proceedings/MisztalIgnacy/MisztalIgnacy.presentation.pdf

1. 题目及作者

题目及作者

2. 育种为什么在现代农业中如此重要

人工受精和胚胎移植在动物育种中广泛应用,一个公牛可以有超过10万个雌性后代(奶牛)。工业化养殖(牧场, 养猪场, 农作物机械化)时代,育种的效益更加明显,任何细节的优化,效率的提升,放大规模后都会产生显著的效益。
在这里插入图片描述

现代化育种需要的条件:基因组信息、大量的表型数据、系谱数据。还包括环境数据, 家系数据等等,用于预测基因组育种值。
在这里插入图片描述

3. 不同物种的育种现状

奶牛
显著的特点是精液市场全球化,优秀的公牛,后代从产奶,肉质, 蛋白产量,料肉比都有巨大的效益。
在这里插入图片描述

肉牛

家禽
家禽育种,特别是鸡育种,规模非常大,而且分层育种结果,比如三交种,五交种。最终使用的是最后的杂交种,一个个体有效的记录可以追溯20万只鸡,考虑各种经济性质比如产蛋,肉质等等。

在这里插入图片描述

猪育种

典型的公司, PIC.

之前,我以为作物育种中,先锋,孟山都可望而不可及,中国种业落后。了解动物育种后,更让人绝望。

植物还可以直接使用自交系,可以使用二环系进行改良,本地资源由于环境的特殊适应性,国外品种还不能一统天下。

但是动物育种,都是在猪场,鸡场中养殖,工业化养殖环境更可控,不同于植物可以自交,动物的种质更难利用。

在这里插入图片描述

4. 基因组选择的效果

牛奶产量提升了2倍,鸡的成熟周期缩短了2倍,饲料转化率提升了2倍。效果十分显著

5. 基因组选择的模型

基因型育种值的构成
在这里插入图片描述
动物模型的构成
在这里插入图片描述
混合线性模型的矩阵形式
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
不同的模型

  • 公畜模型
  • 单性状动物模型
  • 多性状动物模型
  • 随机回归模型
    在这里插入图片描述
6. 育种数据计算的挑战

两大挑战:

  • 估算方差组分
  • 求解混合线性方程组
    在这里插入图片描述
    稀疏矩阵, hash结构, 指向列和值的行指针
    在这里插入图片描述

高效储存的方式, 指针

在这里插入图片描述

求解方程组的方法:PCG

在这里插入图片描述

方差组分估算, 迭代方法

在这里插入图片描述

在这里插入图片描述

7. 两种方法估算方差组分

如何估算方差组分?

  • REML
  • 贝叶斯
    在这里插入图片描述

REML

在这里插入图片描述

在这里插入图片描述
REML的挑战
在这里插入图片描述

贝叶斯

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
贝叶斯的挑战
在这里插入图片描述

8. 育种数据的软件

SAS不能处理大数据混合模型

其它软件:

  • PEST, VCE(很旧的软件)
  • ASREML(商业软件)
  • DMU
  • MATVEC(没用过)
  • BLUPF90
    在这里插入图片描述

平台

Windows和Linux, Unix都可以. 但是并行和向量化运算不是最重要的.
在这里插入图片描述
随机回归模型, 应该是最复杂的计算量最大的模型, 研究显示, 相比较于并行化运算, 标量优化(Scalar optimization)更重要.

不同的语言, 不同的算法, 结果可能是半个小时和半年的差别, 时间和内存的提升是线性的, 算法的提升确实指数型的. 好的工具加上好的算法才能事半功倍.

在这里插入图片描述

数量遗传的其它模型
这些模型, 未来也可以用于基因组选择育种:

  • 截距模型(Censored model)
  • 生存模型(Survival model)
  • 阈值模型(Threshold model)

在这里插入图片描述

9. 结论

在这里插入图片描述

在这里插入图片描述


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部