




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
动态规划法双序列比对第1页,共55页,2023年,2月20日,星期日2
/55习题4,求两条序列的最长共同子序列。【作业】v=TACGGGTATw=GGACGTACG第2页,共55页,2023年,2月20日,星期日3
/550123456789000000000001020304050607080905GGACGTACGTACGGGTAT第3页,共55页,2023年,2月20日,星期日4SequenceAlignment第4页,共55页,2023年,2月20日,星期日5
/55OutlineGlobalAlignmentScoringMatricesLocalAlignmentAlignmentwithAffineGapPenalties第5页,共55页,2023年,2月20日,星期日6
/55FromLCStoAlignment:ChangeuptheScoringTheLongestCommonSubsequence(LCS)problem—thesimplestformofsequencealignment–allowsonlyinsertionsanddeletions(nomismatches).IntheLCSProblem,wescored1formatchesand0forindelsConsiderpenalizingindelsandmismatcheswithnegativescoresSimplestscoringschema:
+1:matchpremium
-μ:mismatchpenalty
-σ:indelpenalty-TGCAT-A-CAT-C-TGATCAKRANRKAAANK-1+(-1)+(-2)+5+7+3=11第6页,共55页,2023年,2月20日,星期日7
/55SimpleScoringWhenmismatchesarepenalizedby–μ,indelsarepenalizedby–σ,andmatchesarerewardedwith+1,theresultingscoreis:#matches–μ(#mismatches)–σ(#indels)第7页,共55页,2023年,2月20日,星期日8
/55TheGlobalAlignmentProblemFindthebestalignmentbetweentwostringsunderagivenscoringschemaInput:StringsvandwandascoringschemaOutput:Alignmentofmaximumscorem:mismatchpenaltyσ:indelpenalty第8页,共55页,2023年,2月20日,星期日9
/55ScoringMatricesTogeneralizescoring,considera(4+1)x(4+1)scoringmatrixδ.Inthecaseofanaminoacidsequencealignment,thescoringmatrixwouldbea(20+1)x(20+1)size.Theadditionof1istoincludethescoreforcomparisonofagapcharacter“-”.Thiswillsimplifythealgorithmasfollows:第9页,共55页,2023年,2月20日,星期日10
/55TheBlosum62ScoringMatrix第10页,共55页,2023年,2月20日,星期日11
/55MeasuringSimilarityMeasuringtheextentofsimilaritybetweentwosequencesBasedonpercentsequenceidentityBasedonconservation第11页,共55页,2023年,2月20日,星期日12
/55PercentSequenceIdentityTheextenttowhichtwonucleotideoraminoacidsequencesareinvariantACCTGAG–AGACGTG–GCAG70%identicalmismatchindel第12页,共55页,2023年,2月20日,星期日13
/55MakingaScoringMatrixScoringmatricesarecreatedbasedonbiologicalevidence.Alignmentscanbethoughtofastwosequencesthatdifferduetomutations.Someofthesemutationshavelittleeffectontheprotein’sfunction,thereforesomepenalties,δ(vi,wj),willbelessharshthanothers.第13页,共55页,2023年,2月20日,星期日14
/55ScoringMatrix:ExampleAKRANRKAAANK-1+(-1)+(-2)+5+7+3=11ARNKA5-2-1-1R-7-13N--70K---6NoticethatalthoughRandKaredifferentaminoacids,theyhaveapositivescore.Why?Theyarebothpositivelychargedaminoacidswillnotgreatlychangefunctionofprotein.第14页,共55页,2023年,2月20日,星期日15
/55ConservationAminoacidchangesthattendtopreservethephysico-chemicalpropertiesoftheoriginalresiduePolartopolaraspartateglutamateNonpolartononpolaralaninevalineSimilarlybehavingresiduesleucinetoisoleucine第15页,共55页,2023年,2月20日,星期日16
/55ScoringmatricesAminoacidsubstitutionmatricesPAMBLOSUMDNAsubstitutionmatricesDNAislessconservedthanproteinsequencesLesseffectivetocomparecodingregionsatnucleotidelevel第16页,共55页,2023年,2月20日,星期日17
/55PAMPointAcceptedMutation(Dayhoffetal.)1PAM=PAM1=1%averagechangeofallaminoacidpositionsAfter100PAMsofevolution,noteveryresiduewillhavechangedsomeresiduesmayhavemutatedseveraltimessomeresiduesmayhavereturnedtotheiroriginalstatesomeresiduesmaynotchangedatall第17页,共55页,2023年,2月20日,星期日18
/55PAMXPAMx=PAM1xPAM250=PAM1250PAM250isawidelyusedscoringmatrix:
AlaArgAsnAspCysGlnGluGlyHisIleLeuLys...ARNDCQEGHILK...AlaA13699589126867...ArgR3174325326329AsnN446725646325AspD54811171056325CysC2111521122211GlnQ3556110737235...TrpW020000001010TyrY112131113221ValV74444444541510第18页,共55页,2023年,2月20日,星期日19
/55BLOSUMBlocksSubstitutionMatrixScoresderivedfromobservationsofthefrequenciesofsubstitutionsinblocksoflocalalignmentsinrelatedproteinsMatrixnameindicatesevolutionarydistanceBLOSUM62wascreatedusingsequencessharingnomorethan62%identity第19页,共55页,2023年,2月20日,星期日20
/55TheBlosum62ScoringMatrixBLOSUM62第20页,共55页,2023年,2月20日,星期日21
/55BLOSUM90PAM30低趋异度小鼠和大鼠RBPBLOSUM45PAM240高趋异度小鼠和细菌的lipocalinBLOSUM80PAM120BLOSUM62PAM180相似度越低的序列,在比对的时候,采用PAM矩阵时,后面的数字越大,采用BLOSUM矩阵时,后面的数字越小。第21页,共55页,2023年,2月20日,星期日22
/55Localvs.GlobalAlignmentTheGlobalAlignmentProblemtriestofindthelongestpathbetweenvertices(0,0)and(n,m)intheeditgraph.TheLocalAlignmentProblemtriestofindthelongestpathamongpathsbetweenarbitraryvertices(i,j)and(i’,j’)intheeditgraph.第22页,共55页,2023年,2月20日,星期日23
/55Localvs.GlobalAlignmentTheGlobalAlignmentProblemtriestofindthelongestpathbetweenvertices(0,0)and(n,m)intheeditgraph.TheLocalAlignmentProblemtriestofindthelongestpathamongpathsbetweenarbitraryvertices(i,j)and(i’,j’)intheeditgraph.Intheeditgraphwithnegatively-scorededges,LocalAlignmetmayscorehigherthanGlobalAlignment第23页,共55页,2023年,2月20日,星期日24
/55Localvs.GlobalAlignment(cont’d)GlobalAlignmentLocalAlignment—betteralignmenttofindconservedsegment--T—-CC-C-AGT—-TATGT-CAGGGGACACG—A-GCATGCAGA-GAC|||||||||||||||||||||||AATTGCCGCC-GTCGT-T-TTCAG----CA-GTTATG—T-CAGAT--CtccCAGTTATGTCAGgggacacgagcatgcagagac||||||||||||aattgccgccgtcgttttcagCAGTTATGTCAGatc第24页,共55页,2023年,2月20日,星期日25
/55LocalAlignment:ExampleGlobalalignmentLocalalignmentComputea“mini”GlobalAlignmenttogetLocal第25页,共55页,2023年,2月20日,星期日26
/55LocalAlignments:Why?Twogenesindifferentspeciesmaybesimilarovershortconservedregionsanddissimilaroverremainingregions.Example:Homeoboxgeneshaveashortregioncalledthehomeodomainthatishighlyconservedbetweenspecies.AglobalalignmentwouldnotfindthehomeodomainbecauseitwouldtrytoaligntheENTIREsequence第26页,共55页,2023年,2月20日,星期日27
/55TheLocalAlignmentProblemGoal:FindthebestlocalalignmentbetweentwostringsInput:Stringsv,wandscoringmatrixδOutput:Alignmentofsubstringsofvandwwhosealignmentscoreismaximumamongallpossiblealignmentofallpossiblesubstrings第27页,共55页,2023年,2月20日,星期日28
/55TheProblemwiththisProblemLongruntimeO(n4):-Inthegridofsizenxnthereare~n2vertices(i,j)thatmayserveasasource.
-Foreachsuchvertexcomputingalignmentsfrom(i,j)to(i’,j’)takesO(n2)time.Thiscanberemediedbygivingfreerides第28页,共55页,2023年,2月20日,星期日29
/55LocalAlignment:ExampleGlobalalignmentLocalalignmentComputea“mini”GlobalAlignmenttogetLocal第29页,共55页,2023年,2月20日,星期日30
/55LocalAlignment:Example第30页,共55页,2023年,2月20日,星期日31
/55LocalAlignment:Example第31页,共55页,2023年,2月20日,星期日32
/55LocalAlignment:Example第32页,共55页,2023年,2月20日,星期日33
/55LocalAlignment:Example第33页,共55页,2023年,2月20日,星期日34
/55LocalAlignment:Example第34页,共55页,2023年,2月20日,星期日35
/55LocalAlignment:RunningTimeLongruntimeO(n4):-Inthegridofsizenxnthereare~n2vertices(i,j)thatmayserveasasource.
-Foreachsuchvertexcomputingalignmentsfrom(i,j)to(i’,j’)takesO(n2)time.Thiscanberemediedbygivingfreerides第35页,共55页,2023年,2月20日,星期日36
/55LocalAlignment:FreeRidesVertex(0,0)Thedashededgesrepresentthefreeridesfrom(0,0)toeveryothernode.Yeah,afreeride!第36页,共55页,2023年,2月20日,星期日37
/55TheLocalAlignmentRecurrenceThelargestvalueofsi,joverthewholeeditgraphisthescoreofthebestlocalalignment.Therecurrence:0si,j=maxsi-1,j-1+δ
(vi,wj)si-1,j+δ
(vi,-)
si,j-1+δ
(-,wj){NoticethereisonlythischangefromtheoriginalrecurrenceofaGlobalAlignment第37页,共55页,2023年,2月20日,星期日38
/55TheLocalAlignmentRecurrenceThelargestvalueofsi,joverthewholeeditgraphisthescoreofthebestlocalalignment.Therecurrence:0si,j=maxsi-1,j-1+δ
(vi,wj)si-1,j+δ
(vi,-)
si,j-1+δ
(-,wj){PowerofZERO:thereisonlythischangefromtheoriginalrecurrenceofaGlobalAlignment-sincethereisonlyone“freeride”edgeenteringintoeveryvertex第38页,共55页,2023年,2月20日,星期日39
/55/Blast.cgi
NP_006735NP_000945第39页,共55页,2023年,2月20日,星期日40
/55第40页,共55页,2023年,2月20日,星期日41
/55习题考虑序列v=TACGGGTAT和w=GGACGTACG。假设匹配奖励+1,错配和插缺罚分均为-1.【作业】填写序列v和w之间的全局联配的动态规划表(编辑图或相似度矩阵)。在各单元画出箭头以存储返回信息。全局最优联配的得分是多少?这个得分对应的联配又是什么?填写序列v和w之间的局部联配的动态规划表。在各单元画出箭头以存储返回信息。在这种情形下,局部最优联配的得分是多少?这个得分对应的联配又是什么?第41页,共55页,2023年,2月20日,星期日42
/55-012345678900-1-2-3-4-5-6-7-8-91-12-23-34-45-56-67-78-899GGACGTACGTACGGGTAT全局比对第42页,共55页,2023年,2月20日,星期日43
/55局部比对-012345678900000000000102030405060708090GGACGTACGTACGGGTAT第43页,共55页,2023年,2月20日,星期日44
/55ScoringIndels:NaiveApproachAfixedpenaltyσ
isgiventoeveryindel:-σfor1indel,-2σfor2consecutiveindels-3σfor3consecutiveindels,etc.Canbetooseverepenaltyforaseriesof100consecutiveindels第44页,共55页,2023年,2月20日,星期日45
/55AffineGapPenaltiesInnature,aseriesofkindelsoftencomeasasingleeventratherthanaseriesofksinglenucleotideevents:ATA__GCATATTGCATAG_GCAT_GTGCNormalscoringwouldgivethesamescoreforbothalignmentsThisismorelikely.Thisislesslikely.第45页,共55页,2023年,2月20日,星期日46
/55AccountingforGapsGaps-contiguoussequenceofspacesinoneoftherowsScoreforagapoflengthxis:-(ρ+
σx)whereρ>0isthepenaltyforintroducingagap:gapopeningpenalty
ρwillbelargerelativetoσ:
gapextensionpenaltybecauseyoudonotwanttoaddtoomuchofapenaltyforextendingthegap.第46页,共55页,2023年,2月20日,星期日47
/55AffineGapPenaltiesGappenalties:-ρ-σwhenthereis1indel-ρ-2σwhenthereare2indels-ρ-3σwhenthereare3indels,etc.-ρ-x·σ(-gapopening-xgapextensions)Somehowreducedpenalties(ascomparedtonaïvescoring)aregiventorunsofhorizontalandverticaledges第47页,共55页,2023年,2月20日,星期日48
/55AffineGapPenaltiesandEditGraphToreflectaffinegappenaltieswehavetoadd“long”horizontalandverticaledgestotheeditgraph.Eachsuchedgeoflengthxshouldhaveweight--x*第48页,共55页,2023年,2月20日,星期日49
/55Adding“AffinePenalty”EdgestotheEditGraphTherearemanysuchedges!Addingthemtothegraphincreasestherunningtimeofthealignmentalgorithmbyafactorofn(wherenisthenumberofvertices)SothecomplexityincreasesfromO(n2)toO(n3)第49页,共55页,2023年,2月20日,星期日50
/55Manhattanin3Layersρρσσδδδδδ第50页,共55页,2023年,2月20日,星期日51
/55AffineGapPenaltiesand3LayerManhattanGridThethreerecurr
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 聚乙烯醇海绵行业分析:高吸水性PVA海绵是最大的细分市场占51%的份额
- 2025年机器人产业人才发展报告-智联研究院
- 生存秘籍:野外探险必修课
- 2025年互联网医疗平台在线问诊服务质量与患者就医体验优化报告
- 智慧交通系统中的交通流量预测技术2025年应用创新报告
- 2025年公众参与对环境影响评价工作流程的影响分析报告
- 即时配送行业配送路径优化与成本控制:冷链物流解决方案报告
- 工业互联网平台IPv6技术升级在2025年工业互联网平台市场拓展与竞争挑战报告
- 企业可持续发展目标(SDGs)在绿色能源与新能源开发中的应用报告
- 抖音平台经纪人管理制度
- 少年军校协议合同
- 完全单孔腹腔镜胃癌手术操作专家共识(2025版)解读
- 会议流程规划能力试题及答案
- 新增值税法的变化要点与实务要领
- 2025-2030全球及中国铁芯电机行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 浦发银行贷款合同文本样式
- 西安历年美术中考题及答案
- 2025年刑事技术考试试题及答案
- 国家开放大学《管理学基础》形考任务1-4答案
- 中药试题及答案
- 2024北京海淀区初一(下)期末道法试题和答案
评论
0/150
提交评论