科内培训基因变异的表述方法_第1页
科内培训基因变异的表述方法_第2页
科内培训基因变异的表述方法_第3页
科内培训基因变异的表述方法_第4页
科内培训基因变异的表述方法_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基因变异的表述方法

1整理课件上集回忆@DNA的化学结构。@查找序列。@正义链和反义链。@碱基书写顺序。@mRNA和前体mRNA。@外显子和内含子。@CDS和UTR。@外显子≠CodingDNA。@全基因突变、热点突变和突变。2整理课件HGVS标准了基因及蛋白的变异表述表述不统一将造成互相理解障碍3整理课件“突变〞与“多态性〞的不同Mutation突变Change改变〔罕见的〕Disease-causingchange致病改变Polymorphism多态性Changein>1%inpopulation人类群体中大于1%的改变Notdiseasecausingchange不致病的改变4整理课件建议使用的词语Mutation突变Polymorphism多态性负面正面建议使用中性词Variant/Alteration变异CNV拷贝数变异SNV〔NotSNP〕单核苷酸变异5整理课件“指南〞的定义6整理课件PGM中的Variant7整理课件VariantCaller的导出结果写成“SNV〞为好8整理课件报告有待标准写成“变异〞为好9整理课件标准的基因名称-1或搜索引擎搜索关键词“HGNCgene〞10整理课件标准的基因名称-211整理课件参考序列出处-1基因的核酸信息包括染色体基因组DNA序列和mRNA序列,核酸信息参考NCBIGenBank核酸序列数据库参考序列〔ReferenceSequence,RefSeq〕。基因组DNA序列GenBank注册号前面用NT、NC或AC加下划线进行标注,其中以“NT_〞标注的序列为BAC克隆或鸟枪测序法获得的不完整的基因组测序序列。如10号染色体上的片段NT_030059,同一序列号有不同的版本号时,后面用点加版本号表示,如NT_030059.14。成熟mRNA转录本12整理课件参考序列出处-2美国国立生物技术信息中心〔NCBI〕收录的参考序列编码具有权威性及唯一性。其中前缀“NM_〞表示为mRNA序列,“NP_〞表示多肽序列,“NG_〞表示基因组序列。基因组参考序列应列出完整基因序列,包括5'以及3'非编码区〔UTR〕。当使用某段编码DNA参考序列描述突变时,应选择适宜的转录体,且转录体的起始转录点应当明确,例如选择最常见的转录体,或者是的最大转录体,或者具有组织特异性的编辑转录体。当某一参考序列具有多种转录方式时,选择NCBI数据库里注释最全面的版本。——?肿瘤个体化检测治疗指南〔试行〕?国家卫生计生委个体化医学检测技术专家委员会制定13整理课件参考序列出处-HGVS有不同看法HGVS建议使用LRG〔LocusReferenceGenomic〕序列作为首选参考序列。如果该基因没有LRG序列,那么采用RefSeq作为参考序列。HGNC的页面14整理课件LRG序列的web页面点击这些绿色的+号得到有意思的内容15整理课件前缀——应指出突变位于哪种序列中“g.〞表示基因组序列,如g.476A>T。“c.〞表示CodingDNA〔编码DNA〕序列,如c.76A>T。“m.〞表示线粒体DNA序列,如m.8993T>C。“r.〞表示RNA序列,如r.76a>u。“n.〞表示非编码RNA序列。“p.〞表示蛋白质序列,如p.Lys76Asn。对于DNA变异的表述,“c.〞优于“g.〞——直观地得知该变异点在外显子上还是内含子上,会不会造成氨基酸编码改变,与表型联系起来。16整理课件序列位置编号-1基因组、线粒体DNA、RNA、非编码RNA、蛋白序列:以参考序列的第一个碱基或氨基酸确立为1,直接数其在对应参考序列中的位置即可。如:g.476,m.9222,p.76。17整理课件序列位置编号-2CodingDNA〔编码DNA〕序列:将CodingDNA看成连续的〔排除内含子间隔〕,以起始密码子ATG的第一个碱基A确立为1,以终止密码子的最后一个碱基确立为结束N。假设碱基在CodingDNA范围内,那么其位置为1~N区间内的自然数,如c.112。起始密码子ATG的上游的第一个碱基确立为-1,一直向5’端推移编号为-2、-3……,整个5’UTR区域位置均为负数表示,如c.-72。——没有“0〞碱基。终止密码子下游的第一个碱基确立为*1,一直向3’端推移编号为*2、*3……,整个3’UTR区域位置均为“*自然数〞表示,如c.*85。对于内含子起始片段内的位点,以上一外显子最后一个碱基的位置、加号和距离这个碱基的位置表示,如c.77+1;对于内含子末端的位置,以下一外显子第一个碱基的位置、减号和距离这个碱基的位置表示,如c.77-2。——“+〞和“-〞的分界线需谨慎决定。5’UTR假设有内含子,内含子上的碱基位置以“-23+1,-23+2,...,-22-2,-22-1〞形式表示;3’UTR假设有内含子,内含子上的碱基位置以“*154+1,*154+2,...,*155-2,*155-1〞形式表示。不建议使用c.IVS1+1G,c.IVS1-2G形式的表示〔IVS:interveningsequence〕。原因:外显子/内含子的编号比CodingDNA编号更易引起混乱。18整理课件序列位置编号-列表举例19整理课件c.171c.247c.246c.312序列位置编号-外显子&内含子举例c.246+6c.247-420整理课件序列位置编号-5’端举例c.-26c.-25-6c.-25c.121整理课件变异的表述总体标准-1“>〞〔英文输入法的大于号〕表示碱基替换,如c.76A>T。“_〞〔英文输入法的下划线,不是中划线〕表示从起始位置编号到终止位置编号范围的受到影响,如c.76_78del。“del〞表示缺失,如c.76delA。“dup〞表示重复,如c.8dupG〔不是c.8_9insG,重复和插入的定义不同,见后〕。“ins〞表示插入,如c.76_77insG。“delins〞表示同时有缺失和插入,如c.112_117delinsTG。“inv〞表示倒位,如c.76_83inv。“con〞表示转换,如c.123_678conNM_004006.1:c.123_678。“fs〞表示移码〔frameshift〕,变异导致在起始密码子和终止密码子之间的开放阅读框发生改变,如p.Arg97Profs*23。“ext〞表示延伸〔extension〕,变异发生在起始密码子或终止密码子上,导致氨基酸序列较之原序列变长了。如p.Met1ValextMet-12。“()〞〔英文输入法的圆括号〕表示发生变异的具体位置不确定,如c.(67_70)insG,但是圆括号内的位置范围要尽可能缩到最小。“[]〞〔英文输入法的方括号〕表示发生在某个等位基因上,如c.[76A>T];或者已确定的数量,如c.123_124[4]。22整理课件变异的表述总体标准-2DNA:前缀〔c.〕+位置编号〔76〕+参考序列碱基〔A〕+变化〔>〕+改变后的碱基〔如果有〕〔T〕:c.76A>T。碱基以大写字母表示,包括A、T、G、C、Y、R、W等。RNA:前缀〔r.〕+位置编号〔39〕+参考序列碱基〔a〕+变化〔>〕+改变后的碱基〔如果有〕〔u〕:r.39a>u。碱基以小写字母表示,包括a、u、g、c、y、r、w等。蛋白:前缀〔p.〕+参考序列氨基酸〔Trp〕+位置编号〔52〕+变化〔没有“>〞,但“del〞、“ins〞等不变〕+改变后的氨基酸〔如果有〕〔Ala〕:p.Trp52Ala。氨基酸以三字母〔第一个字母大写〕或单字母表示,如Trp或W。建议以三字母表示〔第一个字母大写〕,不建议以单字母表示,因为单字母容易和碱基混淆。23整理课件变异的表述总体标准-关于氨基酸终止HGVS:用“Ter〞或“*〞〔英文输入法且英文字体下的星号键〕表示氨基酸翻译终止,如p.Asn26Ter或p.Asn26*,不使用“X〞表示氨基酸翻译终止。原因:IUPAC-IUB(InternationalUnionofPureandAppliedChemistry,InternationalUnionofBiochemistryandMolecularBiology)已规定“X〞用来表示未指定或未知氨基酸,所以不能用来表示终止。“X〞符号代表终止密码子。例如,p.Gly542X表示542位点的甘氨酸残基被终止密码子所代替。——?肿瘤个体化检测治疗指南〔试行〕?此处存在争议24整理课件变异的表述——替换替换〔substitution〕:一个碱基/氨基酸被另一个碱基/氨基酸替换。特征是“一对一〞。如果是一个碱基/氨基酸变异成多个碱基/氨基酸,那是缺失-插入。如果是多个碱基/氨基酸变异成一个碱基/氨基酸,那是缺失或缺失-插入。如果是多个碱基/氨基酸变异成多个碱基/氨基酸,那是缺失-插入或转换。故没有“c.76_77AG>TT〞这种写法。用“>〞〔英文输入法的大于号〕表示某个碱基变成了另一个碱基,不建议使用“A76T〞类似的形式表示。但是氨基酸替换没有“>〞,要写成“p.Trp52Ala〞这样的形式。举例:c.76A>T,p.Glu26Asp。25整理课件变异的表述——缺失缺失〔deletion〕:原本该有的没有了。举例:c.76del或c.76delA;c.76_78del或c.76_78delACT〔可以不用写成c.76_78del3〕;p.Gln8del;p.Gln8_Ala10del。氨基酸移码变化见后。最靠近3’端法那么〔most3’position〕:缺失的碱基,认为其靠近3’端,而不是5’端。ACTTTGTGCC变成ACTTGCC,缺失了哪三个碱基?ACTTTGTGCC还是ACTTTGTGCC?——TGT比TTG更靠近序列的3’端,故认为缺失了TGT〔c.5_7del〕,而不是TTG〔c.4_6del〕。ctttagGCATG变成cttagGCATG,写成c.301-3delT,而不是c.301-4delT、c.301-5delT。但是该法那么有例外,在描述外显子/内含子边界的变异时,认为缺失的碱基影响外显子大于影响内含子。如CAGgtg变成CAgtg,写成c.3delG,而非c.3+1delG。不确定断裂位置的情况〔见于使用MLPA和PCR法发现的外显子缺失〕,要使用圆括号和预估的断裂位置范围,例如:c.(87+1_88-1)_(300+1_301-1)del,表示某基因Exon3、4缺失,5’断裂点在Intron2〔c.87+1_88-1,不确定具体在哪处〕,3’断裂点在Intron4〔c.300+1_301-1,不确定具体在哪处〕c.(?_-30)_(12+1_13-1)del,表示从基因5’某个位置开始至Intron1中的某个位置缺失。c.(?_-1)_(*1_?)del,表示整个基因都缺失了。提醒:不要随便打“?〞。能确定具体断裂位置就不要打问号。26整理课件变异的表述——重复重复〔duplication〕:碱基或氨基酸多出了一份拷贝〔不是多份拷贝〕,并且多出来的局部直接加在其3’端。如果不是直接加在其3’端,而是插到了其它地方,那叫“插入〞。举例:c.7dup或c.7dupT〔注意不写成c.7_8insT〕;c.77_79dup或c.77_79dupCTG;c.(87+1_88-1)_(301+1_302-1)dup;p.Gly4_Gln6dup;描述重复的位置时也须符合“最靠近3’端法那么〞。例如:MKMGHQHQCC变成MKMGHQHQHQCC,写成p.His7_Gln8dup,不写成p.His5_Gln6dup.27整理课件变异的表述——多份重复多份拷贝重复〔repeat〕:碱基或氨基酸多出了多份拷贝,并且多出来的局部直接加在其3’端。如果不是直接加在其3’端,而是插到了其它地方,那叫“插入〞。表示形式:“第一个重复单元起始位置_第一个重复单元终止位置+[总共的重复数]〞,如c.123_124[4]。或者,“第一个重复单元起始位置+重复单元+[总共的重复数]〞,如c.123TG[4]。不用“c.123_124TG[4]〞形式表示——显得冗余。特殊举例:脆性X综合症FMR1基因5’端重复单元:c.-128_-126[79]——确定共有79个重复单元;c.-128_-126[(600_800)]——重复单元数在600~800之间,具体数量不确定〔通过SouthernBlot做出的结果〕。不要写成c.-128GGC[79],因为该基因中有的GGC重复单元可能变异为GGA单元,写成c.-128GGC[79]就不符合实际情况。亨廷顿舞蹈症HTT基因重复单元:c.53AGC[21],p.Gln[23]〔为什么此处不写氨基酸编号原因不明〕。群体研究:g.1209_4523[12_45]——该片段在人群中重复12~45次不等。28整理课件变异的表述——插入插入〔insertion〕:原本没有的却有了,且多出的局部不是其5’端紧邻的碱基或氨基酸的拷贝——和“重复〞的区别。举例:c.51_52insGAGA;c.123+54_123+55insAB012345.2:g.76_420;p.Lys2_Met3insGlnSerLys;p.Trp182_Gln183ins17;注意:所描述插入位置一定是由下划线连接起来的范围,而非单个点。“c.51_52insGAGA〞清晰的说明了插入位置是在c.51和c.52之间。“c.51insGAGA〞就会引起混淆:插入位置是在c.51的5’端还是3’端?不确定时需打圆括号,如“c.(67_70)insG〞——不确定是在c.67~c.70间的哪个位置插入了G;“c.11_12ins(2)〞或者“c.11_12insNN〞——确定插入了两个碱基,但不确定插入的碱基序列是什么;“c.11_12ins(100)〞或者“c.11_12insN[100]〞——确定插入了100个碱基,但不确定插入的碱基序列是什么;29整理课件变异的表述——插入〔续〕如果插入DNA或RNA的碱基很多〔多到无法把所有插入的碱基都写出来〕,应尽量寻找所插入的碱基来源,参加到描述中,如“c.123+54_123+55insAB012345.2:g.76_420〞。实在找不到插入碱基的来源,怎么办?——HGVS未指明。个人看法,仅供参考:可以用“ins+插入碱基的数量〔加括号〕〞来表示,数量要打括号,如“c.11_12ins(100)〞。不直接写成“c.11_12ins100〞。但,在已清晰地描述了DNA或RNA的变异根底上,氨基酸变异描述可以不加括号,直接写插入的数量,如“p.Trp182_Gln183ins17〞。30整理课件变异的表述——缺失-插入组合先缺失,再插入。同时满足缺失和插入的表述标准。举例:c.112_117delinsTG或者c.112_117delAGGTCAinsTG;c.113delinsTACTAGC或者c.113delGinsTACTAGC;p.Cys28delinsTrpVal;氨基酸的在码变异〔inframe〕和移码变异〔frameshift〕:在码变异〔inframe〕:一个或多个氨基酸变成另外的一个或多个氨基酸,但其它氨基酸编码不受影响。DNA的单碱基替换,或碱基缺失/增加的数量是3的倍数,可导致在码变异。移码变异〔frameshift〕:DNA的碱基缺失或增加不是3的倍数,造成在起始密码子和终止密码子之间的开放阅读框发生了变化。变异发生处C端下游的氨基酸编码都受到影响。注意以上概念和蛋白“延伸〞的区别。31整理课件变异的表述——移码变异在码变异的表述:没有“fs〞,如“p.Gln8_Ala10del〞;“p.Cys28delinsTrpVal〞。移码变异的表述:1、短描述:前缀+受影响的第一个氨基酸+fs,如“p.Arg97fs〞。2、长描述〔推荐采用〕:前缀+受影响的第一个氨基酸的变异情况+fsTer〔或fs*〕+变异后的新终止位置,如“p.Arg97Glyfs*26〞。不要参加“del〞、“ins〞、“dup〞等字眼。关于确定变异后新的终止位置:受影响的第一个氨基酸确立为1,然后再新的开放阅读框中,其C端下游的氨基酸依次编号为2、3……#。#即为终止密码子所对应的氨基酸位置编号。把#直接连在“fsTer〞或“fs*〞的后面。举例:变异后新的开放阅读框为Trp112〔受影响的第一个氨基酸,原本是Asn〕,Ala113,Gln114,Asp115,Leu116,*117。那么变异写作“p.Asn112Trpfs*6〞〔117-112+1=6〕,不是写作“p.Asn112Trpfs*5〞,“p.Asn112Trpfs*117〞,亦或“p.Asn112Trpfs*118〞。在变异后新的开放阅读框中没有发现终止密码子,那么“#〞用“?〞代替,如“p.Ile327Argfs*?〞。32整理课件查看移码后的翻译序列-133整理课件查看移码后的翻译序列-234整理课件氨基酸的特殊变化-1#同义变化:氨基酸没有改变,用“p.(=)〞表示。不使用“p.Leu54Leu〞或“p.L54L〞形式表示。打括号说明没有在蛋白水平和RNA水平上进行实验实证。不建议用“p.Leu54=〞或“p.L54=〞形式表示〔仅是不建议,不是禁止〕。但国内的?指南?对同义变化的表述没有谈及。#无义变化:用“Ter〞或“*〞〔英文输入法且英文字体下的星号键〕表示氨基酸翻译终止,如p.Asn26Ter或p.Asn26*,不使用“X〞表示氨基酸翻译终止。——存在争议。特殊例子:p.*110Glnext*4或p.*110Qext*4,表示原110位氨基酸应为终止位置“*〞,但变成了Gln,延伸出了4个新氨基酸〔包括这个Gln〕,然后在114位终止。即Gln110〔原本是*〕、Ala111、Asp112、Trp113、*114。p.*321Argext*?或p.*321Rext*?,表示原321位氨基酸应为终止位置“*〞,但变成了Arg,延伸出了很多个新氨基酸,没发现终止密码子,不知道在哪里终止,因此打上“?〞。35整理课件氨基酸的特殊变化-2#第一氨基酸的变化:因为启动子区或起始密码子的变异导致没有蛋白翻译出来,并且提供了实验数据支持,那么用“p.0〞表示。因为启动子区或起始密码子的变异推测没有蛋白翻译出来,不能提供实验数据支持〔这种情况较常见〕,那么用“p.0?〞或“p.Met1?〞表示。因为启动子区或起始密码子的变异导致翻译起始位点改变:1、翻译起始位点变到了上游举例:“p.Met1ValextMet-12〞或“p.M1VextM-12〞,表示原第一位Met变成了Val,新的氨基酸较之参考氨基酸序列多出了12个氨基酸〔从Met-12到Thr-1〕。新的第一个氨基酸变成了Met-12。编号规那么与CodingDNA5’UTR编号规那么一致。同样没有“0〞位氨基酸。2、翻译起始位点变到了下游举例:“p.Phe2_Met46del〞或“p.F2_M46del〞,表示发生变异后,较之于参考氨基酸序列相当于原第2位的Phe到第46位的Met都缺失了。为什么不是写成“p.Met1_Lys45del〞?原序列:Met1、Phe2……Lys45、Met46、Ala47、新序列:Met1、Phe2……Lys45、Met1、Ala2、对于氨基酸

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论