个体遗传评定_第1页
个体遗传评定_第2页
个体遗传评定_第3页
个体遗传评定_第4页
个体遗传评定_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、个体遗传评定第1页,共66页,2022年,5月20日,2点59分,星期日矩阵代数基础 纯量、矩阵和向量 纯量(scalar) 只有大小的一个数值,也称为标量、数量或元向量。 用数字或经定义的拉丁字母斜体、小写表示。 如a、r和k。第一节 有关基础知识第2页,共66页,2022年,5月20日,2点59分,星期日 矩阵(matrix) 由一定行数和一定列数的纯量,按一定顺序排列的表。 一般用大写粗体字母表示。 矩阵的阶数 (order) 或维数(dimension)是指矩阵的行数 (m) 和列数 (n) ,表示为m n。 例如:第3页,共66页,2022年,5月20日,2点59分,星期日 向量 (

2、Vector) 仅有一列或一行的矩阵,前者称为列向量(column vector),后者称为行向量(row vector)。 通常用小写粗体字母表示。 为区别行向量和列向量,通常在字母的右上角加一撇表示行向量,不加撇表示列向量。 行向量的阶数为1j,列向量的阶数为j1。 例如:第4页,共66页,2022年,5月20日,2点59分,星期日 一些特殊矩阵 方阵(square matrix):行数与列数相等的矩阵,如Ann。其他矩阵称为直角阵(rectangular matrices) 。 对称阵 (symmetric matrix):元素间满足 aij = aji 的方阵。第5页,共66页,202

3、2年,5月20日,2点59分,星期日 三角阵(triangular matrix): 上三角阵:主对角线以下元素全部为0,即当 j i 时, aij = 0 (j i 时, aij = 0 (i j)第6页,共66页,2022年,5月20日,2点59分,星期日 对角阵 (diagonal matrix):除 i=j 时的元素(主对角线元素)外,其它元素均为零的方阵,即aij = 0 (j i 时)。通常可以用Diag aj 表示,其中aj 为该阵的第 i 个对角线元素。 单位矩阵(identity matrix):所有对角线元素为1,其他元素均为0的矩阵。第7页,共66页,2022年,5月20

4、日,2点59分,星期日 分块矩阵(block matrix):用水平和垂直虚线将矩阵分为若干小块,此时的矩阵称为分块矩阵。其中的小块称为子阵(sub-matrix)。第8页,共66页,2022年,5月20日,2点59分,星期日 分块对角阵 (block diagonal matrix):主对角线上的子阵都为方阵,其余子阵都是零阵的分块阵。如: 稀疏矩阵 (sparse matrix):设矩阵Amn中有 s 个非零元素,若 s 远远小于矩阵元素的总数 (即s 0,除非A = 0; |A| = 0 A=0 |kA| = |k| |A|(k为一纯量); |A+B|A|+|B| |AB|A| |B|第

5、15页,共66页,2022年,5月20日,2点59分,星期日 逆矩阵 (inverse matrix):对于一方阵A,若存在另一矩阵B,使得AB=BA=I,则称B为A的逆矩阵,并表示为A1,即A1 A=I。A1存在的先决条件: A必须是一方阵; A的行列式|A|0,即A为非奇异阵。其中,A*是A的伴随矩阵。对任意 n 阶矩阵A , 称为A 的伴随矩阵。其中,Aij 是A 中元素aij的代数余子式。 第16页,共66页,2022年,5月20日,2点59分,星期日A1具有如下性质: A1A=AA1=I; A1是唯一的; ; (A1) 1 =A,因而也是非奇异阵; (A1) =(A) 1; 如A为对

6、称阵,则A1也是对称阵; 若A、B均可逆,则(AB)1 =B1 A1 。如果 n 阶矩阵A的行列式A0,则称A是非奇异阵;否则,称A为奇异阵。非奇异阵也就是满秩矩阵 :对于方阵A,如果存在一个同阶的方阵B,两方阵的积为单位阵,则称方阵A为满秩方阵或非奇异阵。第17页,共66页,2022年,5月20日,2点59分,星期日 广义逆 (generalized inverse):对于任一矩阵A,若有矩阵G,满足:AGA = A则称G为A的广义逆,记为A,即AA A = A广义逆的性质: 若A为方阵且满秩,则A = A 1 ; 对于任意矩阵A, A必存在。第18页,共66页,2022年,5月20日,2点

7、59分,星期日 Kronecker乘积(或直积, direct product)设 和 分别为 mn 和 pq 阶矩阵,定义 ,称为 A 和 B 的Kronecker乘积或直积,记为 。即:第19页,共66页,2022年,5月20日,2点59分,星期日直积的有关性质: 0A=A0=0 (A1+A2)B=(A1B)+(A2B) A(B1+B2)=(AB1)+(AB2) ( A)( B)= (AB) (、 均为纯量) (A1B1)(A2B2)=(A1A2) (B1B2) (如A1与A2、B1与B2可乘) (AB)=AB (AB)-1=A-1B-1 (如A、B均可逆) (x y)=y x=yx第20

8、页,共66页,2022年,5月20日,2点59分,星期日 Hadamard乘积:两个矩阵A和B的元素间相乘,要求A和B同阶。用*表示:第21页,共66页,2022年,5月20日,2点59分,星期日随机变量的期望值和方差设X为一随机变量,则: 其数学期望: ,且具有如下性质:(k 为一常数)(X、Y相互独立时) 其方差: , 且具有如下性质:(X、Y相互独立时)(称为X和Y的协方差)第22页,共66页,2022年,5月20日,2点59分,星期日 将上述内容推广至多个变量。设x1, x2, xn为 n 个随机变量,则:随机向量x的期望向 量x 的方差-协方差矩阵V的对角线元素为n个变量的方差;非对

9、角线元素为变量间的协方差。第23页,共66页,2022年,5月20日,2点59分,星期日 动物育种中常用的是表型方差-协方差矩阵V、遗传方差-协方差矩阵G和残差方差-协方差矩阵R。第24页,共66页,2022年,5月20日,2点59分,星期日G阵的构建需要一个由个体间亲缘相关系数组成的矩阵A,该矩阵称为加性遗传相关矩阵。由于它是由Wright计算近交系数公式中的分子计算而得,故又称为分子血缘相关矩阵。个体 i 和 j 间的加性遗传相关。计算公式:个体 i 的近交系数加1。即:第25页,共66页,2022年,5月20日,2点59分,星期日A阵元素计算机计算的递推公式:式中: 和 分别为个体 i

10、的父亲和母亲; 和 分别为个体 j 的父亲和母亲; 为 和 间的加性遗传或亲缘相关系数。若个体 i 的一个亲本或双亲未知, 。 和 分别为个体 i 与 和 间的加性遗传相关。 未知时, ; 未知时, 。第26页,共66页,2022年,5月20日,2点59分,星期日线性模型基础 模型 (model) 模型:指描述观察值与影响观察值变异性的各个因子间关系的方程式。 因子:影响观察值的因子也称为变量 变量可分为离散型变量(变异不连续)和连续型变量; 离散型因子分为固定因子和随机因子两类; 连续性变量通常作为协变量看待。第27页,共66页,2022年,5月20日,2点59分,星期日 固定因子与随机因子

11、:与抽样和目的有关 固定因子(fixed factors):抽取因子的若干特定水平、水平数相对较少、研究目的是要对这些水平的效应进行估计或比较。 随机因子(random factors):因子的各水平是其所有水平的一个随机样本、水平数相对较多、研究目的是要对该样本去推断总体。 固定效应与随机效应 固定效应 (fixed effects):固定因子各水平对观察值的效应。 随机效应 (random effects):随机因子各水平对观察值的效应。第28页,共66页,2022年,5月20日,2点59分,星期日 线性模型 (linear model) 定义:模型中所包含的各个因子是以相加的形式影响观察

12、值,即它们与观察值的关系为线性关系。 组成:一个完整的模型应包括3部分内容: 数学方程式(或数学模型式)及其解释; 模型中随机变量的数学期望、方差协方差; 建立模型时的所有假设和约束条件。第29页,共66页,2022年,5月20日,2点59分,星期日例7.1: 模型中每个参数的解释 yij :第 i 个日龄组的第 j 头肉牛的体重, 为观察值; :总体均值,是一常量; ai :第 i 个日龄组的效应,为固定效应; eij :随机误差或残差效应。 随机变量的期望、方差及协方差第30页,共66页,2022年,5月20日,2点59分,星期日 约束与假设 所有犊牛都来自同一个品种; 母亲年龄对犊牛体重

13、无影响; 犊牛的性别相同或性别对体重无影响; 除日龄组外的其他环境条件相同。 对每一观察值建立方程式第31页,共66页,2022年,5月20日,2点59分,星期日y11=198= + a1 +e11y12=204= + a1 +e12y13=201= + a1 +e13y21=203= + a2 +e21y22=206= + a2 +e22y23=210= + a2 +e23y31=205= + a3 +e31y32=212= + a3 +e32y33=216= + a3 +e33y41=225= + a4 +e41y42=220= + a4 +e42日龄组1 2 3 4观察值残 差个 体1

14、2 3 4日 龄 组 第32页,共66页,2022年,5月20日,2点59分,星期日y11 =198= + a1 + e11y12 =204= + a1 + e12y13 =201= + a1 + e13y21 =203= + a2 + e21y22 =206= + a2 + e22y23 =210= + a2 + e23y31 =205= + a3 + e31y32 =212= + a3 + e32y33 =216= + a3 + e33y41 =225= + a4 + e41y41 =220= + a4 + e42a1a2a3a4yae第33页,共66页,2022年,5月20日,2点59分

15、,星期日关联矩阵:又称设计矩阵或发生矩阵。指示 y 中的元素与 a 中元素的关联情况。 a1 a2 a3 a4yaX第34页,共66页,2022年,5月20日,2点59分,星期日模型的矩阵表示:式中,y为观察值向量,a为固定的日龄组向量,e为随机残差效应向量,X为a的关联矩阵。且有:其中,I 为单位矩阵,2为观察值的方差。第35页,共66页,2022年,5月20日,2点59分,星期日 线性模型的分类按模型中各因子的性质分类如下: 固定效应模型 (fixed effect model):模型中除随机残差外,其余所有效应均为固定效应。 随机效应模型 (random effect model):模型

16、中除外,其余的所有效应均为随机效应。第36页,共66页,2022年,5月20日,2点59分,星期日式中:y观察值向量; b固定效应(包括)向量; u随机效应向量; e 随机残差效应向量; X固定效应的关联矩阵(设计矩阵或发生矩阵); Z随机效应的关联矩阵(设计矩阵或发生矩阵) 混合效应模型 (mixed effect model):模型中除和e外,既含有固定效应,也含有随机效应。第37页,共66页,2022年,5月20日,2点59分,星期日第二节 BLUP育种值估计背 景 BLUP法是基于克服传统选择指数法的缺点的。 选择指数实质上就是育种值的估计值。 选择指数法假定不存在影响观察值的系统环境

17、效应,或者这些效应已知,可以对观察值进行事先校正,则选择指数是育种值的最佳无偏估值。但是这一假定几乎不能成立。 BLUP的基本思路是在估计育种值的同时对系统环境效应进行估计和校正。 根据这一思路,BLUP法必须基于混合模型。第38页,共66页,2022年,5月20日,2点59分,星期日最佳 (Best):估计误差方差 最小;无偏 (Unbiased):估计值无偏,即估计值的期望值就是真值, ;基本原理 BLUP的涵义:BLUP是Best Linear Unbiased prediction的首字母缩略词,既最佳线性无偏预测。其中:线性 (Linear):估计值是观察值的线性函数;预测 (pre

18、diction):是可以对随机效应进行预测。通常,对固定效应称估计,对随机效应称预测。第39页,共66页,2022年,5月20日,2点59分,星期日 混合模型(Mixed model)式中,y观察值向量;b和u分别为固定效应和随机效应向量;e为随机残差向量;X和Z分别为b和u的关联矩阵。且有:这里是假定固定效应与随机效应间无互作。育种中是假定遗传与环境间无互作。第40页,共66页,2022年,5月20日,2点59分,星期日 混合模型方程组(MME) MME的解:解向量 s右手项 r系数矩阵 C注意:尽管MME的解中有V-1,但MME中没有,直接求解MME便可,即 。C-1可用分块矩阵表示为:(

19、1)第41页,共66页,2022年,5月20日,2点59分,星期日式中,y 表型观测值向量 b 为固定环境效应向量 X 固定环境效应b的关联矩阵 a s个个体的随机加性遗传效应向量 Z 随机遗传效应a的关联矩阵,当a中的所有个体都有观测值时,即sn时,Z = I e 随机残差效应向量单性状无重复观察值的动物模型BLUP 模型表达式 一个个体时: n 个个体时:y为个体的观察值;bj为第j个固定效应;a为个体的随机加性遗传效应;e为随机残差效应。第42页,共66页,2022年,5月20日,2点59分,星期日随机效应a和e的数学期望为:随机效应a和e的方差-协方差矩阵分别为:其中: 为加性遗传方差

20、; 为随机残差方差;A为待估个体间的加性遗传相关矩阵(additive genetic relationship matrix),即分子亲缘相关系数矩阵(numerator relationship matrix)。 第43页,共66页,2022年,5月20日,2点59分,星期日 混合模型方差组(MME) 式中,A-1 A的逆矩阵 X X 的转置矩阵 Z Z 的转置矩阵与(1)式相比,(2)式是在(1)式两边同除了一个R-1变换而来。(2)第44页,共66页,2022年,5月20日,2点59分,星期日为系数矩阵的逆矩阵。 MME的求解也可表示为:其中, 为固定效应的BLUE值; 为随机效应的B

21、LUP值。第45页,共66页,2022年,5月20日,2点59分,星期日 个体育种值估计的准确度 (Accuracy, ACC)用估计育种值与真实育种值之间的相关系数来度量,其计算公式为:式中, 为 中与个体 i 对应的对角线元素。 当个体 i 为非近交个体时: 当个体 i 为近交个体时: 式中,fi 为个体 i 的近交系数。第46页,共66页,2022年,5月20日,2点59分,星期日Relationship between true BV and EBV for three accuracy values, r= 0.8, 0.5 and 0.3 第47页,共66页,2022年,5月20日

22、,2点59分,星期日 对育种值估计准确度的进一步理解 个体某一性状的真实育种值只有一个,而且永远不变。 个体的估计育种值则与信息来源和信息的多少密切相关,并随之变化。 一般而言,利用的信息越多,准确度越大。 准确度还是育种值估计中利用信息多少的一个度量。它表明了当拥有更多信息时,EBV变化的可能性。 随着准确度的提高, EBV的变化减小。第48页,共66页,2022年,5月20日,2点59分,星期日 估计育种值的可靠性 (Reliability) 预测误差方差(Prediction error variance, PEV)估计育种值与真实育种值之间的相关系数 的平方 称为估计育种值的可靠性。可

23、靠性是一个决定系数,是对真实育种值变异中由估计育种值说明的变异部分( )的一个度量。PEV是育种值预测时对误差大小的一个度量。PEV是对真实育种值变异中未由估计育种值说明的变异部分 ( ) 的一个度量。第49页,共66页,2022年,5月20日,2点59分,星期日 当个体 i 为非近交个体时: 当个体 i 为近交个体时: 育种值估计的准确度可由预测误差方差计算 预测误差标准差 (Standard error of prediction, SEP)第50页,共66页,2022年,5月20日,2点59分,星期日第51页,共66页,2022年,5月20日,2点59分,星期日单性状有重复观察值的动物模

24、型BLUP 模型表达式重复力模型 (Repeatability model)式中,y为观察值向量;b为固定效应向量;a为随机加性遗传效应向量;p为随机永久环境效应向量;e为随机残差效应向量。Z1为加性遗传效应的关联矩阵;Z2为永久环境效应的关联矩阵。且有:第52页,共66页,2022年,5月20日,2点59分,星期日 混合模型方程组其中:其中:h2为性状的遗传力,re为性状的重复力。第53页,共66页,2022年,5月20日,2点59分,星期日动物模型BLUP的理想性质 能最有效地充分利用所有亲属的信息; 能校正由于选配所造成的偏差; 当利用个体的重复记录时,可将由于淘汰造成的偏差降到最低;

25、能考虑不同群体及不同世代的遗传差异; 能提供个体育种值的最精确的无偏估值。达到如上理想性质的前提是: 数据特别是系谱正确完整; 所用模型是真实模型; 随机效应方差组分已知,而且是正确的。第54页,共66页,2022年,5月20日,2点59分,星期日多性状动物模型BLUP 育种值估计 模型表达式以两个性状为例。性状1的模型为:性状2的模型为:令:则有:第55页,共66页,2022年,5月20日,2点59分,星期日 随机效应的期望和方差-协方差其中, 和 分别为性状1和2的加性遗传方差; 为性状1和2间的加性遗传协方差。 和 分别为性状1和2的残差方差; 为性状1和2间的残差协方差。 A为分子血缘

26、相关矩阵;I为单位矩阵。第56页,共66页,2022年,5月20日,2点59分,星期日 MME及其求解计算G-1和R-1后,代入混合模型方程组求解,便可得到:固定效应的BLUE值加性遗传效应的BLUP值第57页,共66页,2022年,5月20日,2点59分,星期日第三节 遗传参数估计的REML方法最大似然 (Maximum likelihood, ML) 法 是统计学参数估计的一个重要方法, 由Fisher提出。最大似然法的一般原理概率函数与密度函数设f (x, ) 为随机变量X的概率函数(X为离散型变量)或密度函数(X为连续型变量), 为有关的已知参数,且X为 的函数。则f (x, )为已知

27、时,X=x的发生概率(X为离散型变量)或X=x的概率密度(X为连续型变量)。第58页,共66页,2022年,5月20日,2点59分,星期日似然函数(likelihood function)假定 为待估计的未知参数,但 X=x 已知,为观察值。将f (, x) 看作是x一定时 的一个函数,称之为似然函数,记为L(, x),表示 取不同值时, X=x发生的可能性或似然性。最大似然原理寻找一个使得X=x发生可能性最大的 值 ,即当X=x时,寻找 ,满足 其中为参数空间。如果 存在,则称它为 的最大似然估值。第59页,共66页,2022年,5月20日,2点59分,星期日注意事项: 的估计值必须落在参数空间内。我们不考虑参数空间外的ML估值。似然函数通常用对数形式,即ln L或log L。因为在求最大值过程中需要求对数后求导。混合模型下参数的ML估计ML法要求说明数据的分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论