高级医学遗传学_第1页
高级医学遗传学_第2页
高级医学遗传学_第3页
高级医学遗传学_第4页
高级医学遗传学_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、高级医学遗传学研究设计与统计分析方法介绍流行病学与卫生统计学系陈大方 教授 1种瓜得瓜种豆得豆2内 容 概述研究设计方法统计分析方法 3概述4 按遗传与环境因素的相对作用由遗传因素决定的疾病(血友病A、白化病)基本上由遗传因素决定的疾病(蚕豆病 )多因子遗传病 (高血压、冠心病 )基本上由环境因素决定的疾病 (中毒 )疾病的分类5疾病的分类 随着人类基因组计划的完成和后基因组计划的开展,人们对于疾病的认识也越来越深入。已有的研究结果发现人类疾病都与基因受损有关,因此提出了基因病-人类疾病的新概念。由此提出将人类疾病分为三种类型。 第一类是单基因病。仅由单个基因DNA序列某个碱基对的改变就造成疾

2、病,并且可以把这样的改变传递给后代。如血友病A、白化病等。6 第二类是多基因病(复杂性疾病)。这类疾病的发生涉及两个以上基因的结构或表达调控的改变,主要指慢性非传染性疾病,如肿瘤、高血压、冠心病、糖尿病、哮喘病、骨质疏松症、神经性疾病、原发性癫痫等。 第三类为获得性基因病。主要是传染病由病原微生物通过感染将其基因入侵到宿主基因引起。如HIV。7复杂性疾病的特征Genetic Heterogeneity(遗传异质性)Gene-Gene and Gene-Environment Interaction(基因基因,基因环境的交互作用)Incomplete Penetrance(不完全外显性)Phen

3、ocopy(表型拷贝)Pleiotropy(多效性)8研究设计方法9患病家系成员设计10优点:具有明显的孟德尔遗传特点。遗传方式确定(常显、常隐或X连锁)。缺点:如果指定的遗传方式不正确,可能导致错误的结论。难以收集到家系全部人员。患病家系成员设计11患病同胞对设计患病同胞对表型不一致同胞对12患病同胞对设计优点:可以进行非参数统计分析。研究对象相对容易收集。缺点:检验效能相对较低样本量要求较大13患病先证者核心家系设计14优点:可以进行非参数统计分析。研究对象相对容易收集。缺点:统计分析时仅仅杂合子的双亲可以有效利用。对于迟发性疾病难以收集到双亲资料。患病先证者核心家系设计15双生子研究设计

4、 通过比较在相似或不同环境中成长起来的同卵双生子及异卵双生子某一疾病或性状发生的一致性,来判断遗传与环境因素的作用。养子研究设计 通过比较、分析养子与其同胞及生身父母某疾病或性状的相似性和与其寄养同胞或养父母的相似性,研究在某种疾病或性状发生中遗传因素与环境因素相对作用的大小。家系研究中其它研究设计方法16半同胞研究设计 是指同父异母或同母异父的兄弟姐妹。根据半同胞中所研究疾病的患病情况,可分析疾病或遗传性状来自父方或母方。17病例对照研究设计18优点:相对容易收集到资料。 投入少,产出高。缺点:由于存在连锁不平衡和种群分层, 容易导致假阳性或假阴性。病例对照研究设计19衍生的研究类型 巢式病

5、例对照研究 单纯病例研究 病例时间对照设计 病例对照与队列研究作为病因研究的主要方法,有其各自的优势与不足,而且这些优势与不足可以相互补充,因此,在实践过程中产生了一些新的研究类型,结合使用这两种方法,可以扬长避短。病例-队列研究病例交叉研究20timeExposureStudy startsDiseaseoccurrenceExposureDiseaseoccurrencetimeStudy startsExposuretimeDiseaseoccurrenceStudy starts历史性队列双向性队列前瞻性队列21 巢式病例对照研究(nested case control study)

6、基本原理 按队列研究方式进行 选择一队列,收集基线资料,采集所研究的生物学标志的组织或体液标本储存备用 随 访 随访到出现能满足病例对照研究样本量的病例数为止22匹配 按病例进入队列的时间、疾病出现时间与性别、年龄等匹配条件,从同一队列选择1个或数个非病例作对照,抽取病例与对照的基线资料并检测收集的标本资料处理 按匹配病例对照研究方法处理资料23 1992年Ross用巢式病例对照研究: 上海地区肝癌与尿中黄曲霉素生物学标志关系 18244名中年男性队列中发现22例肝癌 每例配5或10个对照 检测研究开始时的尿样: 发现黄曲霉素B1及其代谢产物和DNA加合物的OR值经 调整混杂因素后,为3.8(

7、1.212.2)。 黄曲霉素作为肝癌致病因素最直接的证据24 病例-队列研究(case-cohort study)基本原理 研究开始时,在队列中随机选取一组样本作为对照组观察结束时,队列中出现被研究疾病所有病例作病例组与随机对照组进行比较 这种研究模式,可同时研究几种疾病,不同疾病有不同病例组,但对照组都是同一组随机样本25病例-队列与巢式病例对照研究的区别对照是随机选取,不与病例进行匹配随机对照组中成员如发生被研究疾病,既为对照,又同时为病例1个随机对照组可以同时和几个病例组比较分析26病例-队列与巢式病例对照研究的优点 因果关系清楚 资料可靠 论证强度高 省时省力省钱 适合于分子流行病学研

8、究27背 景1994年Piegorseh、Begs等提出 遗传与环境的关系 交互作用 病例对照研究和队列研究的效率费用 病例病例研究(case case study) 应用前提条件 在正常人群中基因型与环境暴露各自独立发生 所研究疾病为罕见病(此时可用OR来估计RR值)28基本原理29研究示意图单纯病例研究环境暴露基因型病人+-+-+-30解决问题 1991年美国Maclure提出病例交叉设计 日常生活中一些突发事件之后,常会伴随某些结果的发生。究竟是这些突发事件导致了结果的发生,还是仅仅由于机会所致? 病例交叉研究(case-crossover design)31暴露与某急性事件有关 比较相

9、同研究对象暴露情况 在急性事件发生前一段时间与未发生事件的某段时间基本原理 如果暴露与少见的事件(或疾病)有关,那么刚好在事件发生前一段时间内的暴露频率应该高于更早时间内的暴露频率。32 研究对象 病例和对照,两部分的信息均来自于同一个体, “病例部分“ 危险期,疾病或事件发生前的一段时间。 “对照部分” 对照期,危险期外特定的一段时间。 研究是对个体危险期和对照期内的暴露信息进行比较33 例如 据报道某种药物可以引发猝死,如果该报道正确,则应该可以观察到服用此药物后一段时间内猝死增多,或者说在猝死前几天或几周内应有服药增多的报道。34统计分析方法 35家族聚集性分析 比较患病率或发病率 患者

10、亲属一般人群 患者亲属对照亲属 随亲缘系数的降低而降低 比较某些数量性状(血压水平等) 亲属对之间的相关非亲属对36同病率 双生子中某疾病(或性状)的一致性称为同病率。 C共同罹患所研究疾病或表现所研究性状的双生子对子数 D双方表现不一致的双生子对子数 37表1 几种疾病双生子的同病率38系谱分析 目的 通过系谱分析初步判断某病为单基因遗传病还是多基因遗传病。 分析方法 将家系调查所获得的资料按一定方式绘成系谱图(pedigree chart),根据发病情况,按遗传规律分析其表型及基因型。 结果 符合孟德尔遗传方式,提示属单基因遗传病;不符合孟德尔遗传方式,但与遗传因素密切相关,可能为多基因遗

11、传病。39系谱分析中仅包括父母及其子代的小家系,称为核心家系。所谓指示者,是指在一个家系中表现型极端者,大多为患者或某性状的表现者。一个核心家系加上三位指示者,即组成一个系谱分析单位。附有指示者的核心家系是对多基因遗传病进行系谱分析的理想单位。 40易患性与发病阈值在多因子遗传病中,遗传基础和环境因素的共同作用决定了一个个体是否易于患某种疾病,这种易于或不易于患病的属性变量称为易患性(liability)。患者亲属中的现患率大于一般人群,患者亲属的易患性平均值比一般人群的易患性平均值更接近阈值。此即所谓的阈值模型(threshold model)。 41图1 一般人群和患者亲属易患性分布图 G

12、:一般人群;R:患者亲属;T:阈值;Xg:一般人群易患性均值至阈值的正态离差;Xra:患者亲属易患性均值至阈值的正态离差;A:患者易患性平均值;ag:一般人群易患性均值与患者易患性均值的正态离差;qg:一般人群患病率;qra:患者亲属患病率。 42遗传度及其估计 在多因子遗传病中,遗传对易患性所起作用的大小程度称为遗传度(heritability,h2)。43表3 一些常见多因子遗传病的发病率和遗传度 疾病或畸形群体发病率(%)患者一级亲属发病率(%)遗传度(%)哮喘4.02080精神分裂症1.01080原发性高血压4-820-3062消化性溃疡4.0837冠心病 2.5765脊柱裂 0.17

13、476唇裂腭裂 0.0427644 在研究中若通过匹配等方法给先证者选取可比的对照组,进行病例对照研究时,可用以下方法估计遗传度: 式中PC为对照组亲属的不发病概率,PC=1-qc;qc为对照组亲属的发病率;XC为对照亲属易患性均值至阈值的正态离差;ac为对照亲属中患者的易患性均值至对照亲属易患性均值的正态离差;A为病例数;其余同前。病例对照研究45 实 例 谢宗孟等(1983)调查克汀病时发现患者一级亲属1217人中有49人发病,qra=0.0400,对照组一级亲属45076人中有263人发病qc=0.0058,由qra得Xra=1.751 ,ara=2.154 , pra=1-qra=0.

14、9600;由qc得 XC=2.524 ,ac=2.845 ,pc=1-qc=0.9942;本例 r=1/2,代入以上公式得: 因此,地方性克汀病的遗传度为544.54%。46 对质量性状的多因子遗传病可用以下方法估计。 CMZ和CDZ分别为同卵双生子和异卵双生子的同病率;n1和n2分别为同卵双生子对子数和异卵双生子对子数。双生子法47实例 303对双生子中,同卵双生子201对中近视一致者156对;异卵双生子102对中近视一致者47对。 本例近视的遗传度为596.57% 。=0.0657 48单基因疾病的分析方法49分离分析检验实际观察的子代同胞分离比与某特定遗传方式决定的理论分离比差异是否有显

15、著性,判断所研究疾病是否符合假定的遗传方式。分离比是指患者在同胞总数中的比值。此种分析的基础是假设患者均为杂合体,若群体中患者是纯合体发病,以上方法可造成较大偏差。 50实例一 疑为软骨发育不全的100个家庭 父母一方患病的家庭共有子女235人, 其中127人患病(观察值)。 试求证本病是否为常染色体显性遗传。51表1 分离分析2检验整理表2=1.536 df=1 P0.0552 遗传平衡定律在一个大的、随机婚配的群体中,如果没有迁移、选择的影响,突变率保持不变,各种基因型的频率也将代代保持不变,成为遗传平衡的群体,此即遗传平衡定律,亦称Hardy-Weinberg定律。在以群体为研究对象进行

16、单基因遗传病分析时可以用遗传平衡定律来估计群体中所研究疾病的基因频率和基因型频率。 53 设一对等位基因A和a(A为显性基因,a为隐性基因),群体中的频率各为p与q,p+q=1,随机婚配时子代基因型及其频率为: 精 子 A (p) a (q) 卵 A (p) AA Aa (pp) (pq) 子 a (q) Aa aa (pq) (qq) 基因型频率的分布为: (p(A)+q(a)254实例二 黑酸尿症发病率为1/100万 该病为常染色体隐性遗传病,因此基因型均为纯合子aa(q2)。根据Hardy-Weinberg定律: 因为x=q2=0.000001,q= 正常显性基因频率p=1-q=1-0.

17、001=0.9991 杂合子频率2pq=210.001=0.002 该病发病率虽然仅为1/100万,但在群体中杂合子即隐性基因携带者的频率达1/500。55多基因疾病的分析方法56表型与基因型一般统计分析病例-父母三结构资料的TDT分析病例-父母三结构资料对数线性模型分析同胞数据SDT分析以家系为基础的关联分析 (FBAT)基因环境(基因)交互作用分析连锁分析多位点基因的单倍体型构建分析 全基因组关联分析 统计分析方法57 分析基因型与表型的关系,也就是比较不同基因型的研究对象的表型是否存在差异,如基因型不同,表型也显著不同,则表示两者有关。 表型为连续型变量的基因型之间比较可用t-检验、方差

18、分析、线性回归等统计方法。表型为分类型变量的基因型之间比较可用卡方检验、LOGISTIC回归等统计方法。 表型与基因型一般统计分析58 原理:理论上,父母亲的两个等位基因传递子女的概率均各为50%,如某一等位基因从父母传递给患病的子女的概率大于50%,表示传递不平衡。传递不平衡检验(TDT)能发现与疾病直接有关的基因,或与疾病基因相连锁的基因。特点:它主要用于分析定性性状(如是否患病),不适用于定量性状(如血糖、胰岛素等表型资料)的分析。 病例-父母三结构资料的TDT分析59原理:它比较患病的同胞与非患病的同胞某等位基因出现的平均数。理论上,这两种家系数相等,如两种家系数显著不等,表示该基因与

19、患病与否有关,该基因可能是与疾病直接有关的基因,也可能是与疾病基因相连锁的基因。特点:主要用于分析定性性状(如是否患病),不适用于定量性状(如血糖、胰岛素等表型资料)的分析。同胞数据SDT分析60原理:FBAT以核心家系为单位计算每个核心家系数的基因型(X)的分布概率与统计量“S”(统计量S是表型T与基因型X的乘积),然后累加各核心家系的统计量S及S的方差与协方差,进行卡方检验。特点:FBAT既适应于定性资料又适应于定量资料,并且可以先对表型变量经有关混杂因素进行调整,将调整后的残差值或校正值放入FBAT程序中进行分析,这样得到的结果就是经过混杂因素调整后的关联分析的结果。FBAT适用于各种类

20、型的家系结构。有父母双亲、只有单亲、双亲均无、一个同胞、多个同胞的家系都可混合在一起应用。FBAT 分析61原理:单倍体型分析通常采用置换法,通过对病例与对照两组分别构建单倍体型并计算各型频率进行的卡方检验,得出P值;随机分配每个研究对象是病例还是对照,用假定的病例对照数据重复上述的单倍体型构建及两组单倍体型频率,重复置换1000次,得出1000个P值,观察从假定的病例对照数据得来的P值小于从实际的病例对照分组样本得来的P值的比例(百分率),该比例即为两组比较的P值。特点:单倍体型(Haplotype)是指同一条染色体上紧密相连的一些位点(或基因)的组合。不同位点间排列距离越近,在减数分裂时发生重组的可能性就越小,以同一单倍体型整体传递给子代的可能性也就越大。单倍体型分析的可以帮助研究者进一步验证在连锁分析中所取得的数据,排除假阳性;通过多个位点的单倍体型排列,还可以使某些多态性不够充分的单个位点的信息得以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论