




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一个流感适应性预测模型季节性人流感病毒A/H3N2经历了快速的进化,在流行毒株群体中产生了年复一年的序列变化。对人类免疫系统做出反响的适应性突变主要发生在抗原表位上,即病毒外表蛋白血凝素的抗体结合区域。在这里我们针对血凝素建立了一个适应性模型来预测病毒种群从一年到下一年的进化。两个因素决定了一个毒株的适应性:适应性的表位变化和表位外的有害突变。我们用之前所有毒株的群体遗传学数据推断了在特定年份的流行毒株中两种适应性的组成。用每个毒株的适应性和频率,我们推断出下一年它的后代毒株的频率。这个适应性模型映射了A型流感病毒的适应性历史,对疫苗的选择提供了原理性的方法。我们的结果提倡对于流感和其他快速进化的通过基因链锁整合了抗原表型和其他病毒功能的病原体进行更广泛的流行病学研究。A/H3N2病毒的序列数据在1968年以后就被很好的记录,已经有好几千条的序列数据。大局部这些数据含有HA的序列,HA是流感病毒基因组八个片段之一,是与人类免疫系统作用的主要基因座位。与这个功能作用一致,HA的抗原表位变化含有流感病毒的适应性进化。进化分析对于流感研究有重要的作用:不仅用来重建病毒的起源和动力学变化过程,还能够预测未来的变化。任何对于进化的预测本质上都是对于不同毒株适应性差异的估计。正是这些差异导致了种群中频率确实定性差异,如果我们知道表型和宿主环境怎样决定适应性的话就可以预测这种频率的变化。预测能力受到随机事件的限制,病毒在宿主间的传播时病毒序列会发生改变。如果忽略这种限制,这些从一年到下一年的数据足够精确,HA的进化就能给疫苗选择提供帮助。当前疫苗株的选择主要基于血凝抑制实验,用来映射病毒株之间的抗原变化。但是毒株的适应性是一个非常复杂的表型,整合了抗原特性和其他许多的分子功能,其中一个就是蛋白质的热稳定性。因为没有重组的发生,这些功能的进化是强烈偶联的,至少在同一个基因片段是这样〔片段间的基因链锁因为重组减少〕。在这里我们将通过从基因组数据中获得的预测流感进化的适应性模型来说明这种偶联的动力学变化。进化枝作为预测的单元我们的分析是基于在1968年到2023年间获得的3944株A/H3N2的HA编码序列,分割进入半年的季节。一个特定季节的的HA序列差异在于几个不同的表位和非同义点突变。为了量化这种差异,我们估计了单个RNA位点中突变等位基因的总体频率,两个或者更多位点上突变等位基因组合的总体频率和单个毒株的总体频率。从流行病学的角度看,一个毒株的频率就是该毒株感染的人群所占的分数。我们通过进化树来推断这些毒株的系谱,然后我们能够追踪毒株世系或进化枝的进化,定义是一个共同祖先产生的一群毒株。然而,毒株通常只在一个季节被观察到,进化枝的进化史超过5年,结果是固定下来或者消失。固定的进化枝来自于树的树干局部,其他进化枝是要消失的。这些进化枝的进化正是我们想预测的从一年到下一年的变化。一个成功的进化枝在它在人群中的扩散中通过突变产生多样化。同时,同样的突变经常独立的起源于不同的进化枝。它是把区别不同进化枝的突变的特异组合。我们通过平均总体概率树来对这些进化枝进行预测,这种方法最小化了重建的误差。我们的预测是基于频率和适应性数据,这些数据只依赖于特定时间可利用的信息。假设一个进化枝v含有一系列的毒株i,每个毒株的频率是,在特定的季节t的时候。在季节t观察到的进化枝的频率表示为,是这些毒株频率的总和,这个和定义为毒株树的平均。每个毒株有一个马尔萨斯适应性或者生长速率,定义为每年的毒株数量,在模型中有详细的说明。有了这些初始的数据之后,我们预测一年后的一个季节中进化枝的频率为:〔1〕方程〔1〕描述了经过许多传播循环和年度流行循环后种群大规模动力学变化。我们把预测限制为>0.15的进化枝,这些进化枝足够大来进行可信的估计。这些进化枝在地理上是充分混合的。因为较小的进化枝中取样误差和地理差异占据优势。我们用后验方法来检查我们方法的质量,通过比拟预测的结果和实际的进化枝进化,用实际观察到的频率。适应性模型我们的适应性模型含有两个组成成分,分别描述表位的选择和非表位基因型的选择。表位的改变主要经历正向选择,因为它们影响毒株的抗原特性。抗原选择包含在多毒株的流行病学模型中,描述了一个SIR模型。在这种模型中,被感染的宿主个体会对所有的含有相似抗原特性的毒株产生局部免疫。因此,毒株生长速率取决于人群中之前流行的毒株。我们的最小化抗原适应性模型来自于SIR模型:一个特定的毒株i承受了之前流行毒株j产生的交叉免疫负担,每个j产生一个适应性的代价,这个代价与其频率和交叉免疫程度成比例。这些程度取决于毒株i和j的抗原相似性,抗原是由它们HA序列和上的表位片段编码的。我们忽略了两个以上毒株的高阶相互作用和宿主人群出生-死亡的转变,这局部在A/H3N2病毒的流行病学中被认为不起到主要作用。非表位突变主要经历负向选择因为它们影响了蛋白质的稳定性和其他保守的分子功能。这里我们用一个简单的突变负担模型来描述这个效应:每个毒株产生一个适应性负担,这个负担是最近的非抗原部位氨基酸突变的累积,发生在当前季节中它的祖先世系中。把这些都考虑进来我们得到的毒株适应性的公式是:〔2〕常数是为了保证毒株频率的标准化。重要的是,这个基于毒株的模型超越了单个突变的适应性模型,它把每个有益和有害的突变,以及在其祖先世系中之前的变化都计算在内。这个最简化的模型有一个统一的选择效应:每个非表位突变产生一个适应性代价,每个抗原表位突变减少交叉免疫的幅度为。然而,这个模型与交叉免疫的生物学和蛋白质稳定性有偏差。两种表型在遗传距离上都是不均一非线性的。即突变的影响决定于其在序列上的位置,参与的氨基酸,之前突变的背景。完整的适应性模型使用非线性交叉免疫,振幅,包括了位置特异性效应和非线性适应关系,由观察到的进化历史推测而来。模型只有四个适应性参数,能够从数据集中推断出来不损害模型的预测能力。进化枝的频率预测从我们完整的基于进化枝的适应性模型得出的北半球的从冬季到冬季的预测结果表现在图2中。为了检测模型的精确性,我们比拟了预测的频率比,即Wrightian适应性,与之前观察到的比例比拟〔在特定季节的所有>0.15的进化枝〕。图2a中的数据点分布在正确预测的对角线两侧;一些分散的点是由于频率估计中在树重建和抽样过程中产生的统计错误。正如下文所讨论的,这些预测可以进一步提高通过增加模型的数据根底。进化的频率方向预测的相当准确。有121个进化枝观察到了增加,我们在这些案例中预测成功93%。对于67个下降的进化枝,我们预测成功76%。重要的是,对于固定的进化枝我们预测的适应性振幅,与图中的对角线接近。一个进化枝的固定意味着其原始毒株中出现的所有突变的固定。正如图2b中展示的那样,我们的模型很好地预测了1994年到2023年间每年核苷酸的固定数量。这个模式的聚集是众所周知的〔80%的核苷酸固定发生在一个11年的子集中〕,也反映了流感病毒HA进化中周期性的选择去除。图2c表现了我们对于序列树的预测。用原始毒株代表的每个进化枝,根据其历史上最大的预测频率变化来着色。我们发现扩张的进化枝主要靠近树干,而减少的进化枝远离树干,这与观察到的流感进化树的形状一致。通过给进化枝的原点进行标记,使得我们能够分析它们的适应性和地理位置的相关关系。对于起源于东亚和东南亚的进化枝,我们预测其中的77%流行会扩大,而起源于其他地区的流行扩大的比例为54%;对应的观察到的比例为77%和49%。这与东亚和东南亚在散播抗原突变株的特殊角色一致,这种角色是之前建立的。因此,我们的模型抓住了A/H3N2进化中广阔的空间模式,尽管潜在的适应性模型在地理上是中立的〔即与地理位置无关〕。我们通过比拟预测的分布和后一年的频率来量化数据信息。我们发现与一个有着常数频率的空模型相比,实际观察到的频率进化比我们的模型大倍。我们强调我们的预测工作只在从一年到下一年时才有效,因为无法预测根底年之后出现的新突变从而在长时间范围内描述进化的进程。为了在一个相关系统上检验我们的模型,我们得到了季节性流感A/H1N1的适应性预测。这个谱系在1977年重新进入人群,在2023年之前的进化方式与H3N2大体相似,知道H1N1大流行株的出现。与H3N2数据集相比,H1N1的毒株样有更大的地区和季节偏差,潜在地减少了抗原选择,对于精确的表位位置有更大的不确定性。我们对于H1N1的预测可以与H3N2相比拟,但是有一些干扰,这种结果在毒株样本信息量不大的条件下预见到了。这个实验建立了我们的模型应用于其他流感毒株的适用性的原理证据。疫苗株的选择我们的模型对于选择疫苗株提供了一个原理性的方法。通过方程〔2〕,基于一个毒株v的疫苗减少了每个流行毒株i对应成比例的交叉免疫程度。这样会造成感染总数的下降,感染总数和特定季节中疫苗株和流行株的平均交叉免疫对应成比例,。理想的疫苗会最大化这种减少,把交叉免疫的中心定义为流行毒株的主体。方程〔1〕预测了明年交叉免疫的程度,能够与后验的观察到得程度相比拟。特别是,我们能用模型预测的理想疫苗株与北半球实际使用的第二年观察到的中心毒株进行后验比拟。图3表现了从1994到2023年冬季A/H3N2流感病毒的这种比拟。在所有年份,模型选择的疫苗株与交叉免疫中心的氨基酸距离比实际使用的疫苗株与交叉免疫中心的距离要小。这种差异可以用模型使用的基于序列的交叉免疫措施和现在选择疫苗使用的血凝抑制试验。后者的进化方式更加的间断,但是我们观察到的疫苗株更新的距离差距在几年以上。这些结果说明基于适应性的流感预测模型可以帮助选择疫苗株;然而,我们不能过早地得出结论直到我们的预测工程被血凝抑制数据仔细检验之后。我们的模型也能被用来估计疫苗怎样影响流感进化。适应性过程的映射我们的预测之下的适应性效应能够用流感病毒适应性历史的定量的图形来展现。作为一个关键的量,我们用累积适应性量来衡量一个给定的进化枝的总的适应性数目。图4中的图表示了2003年到2023年间A/H3N2进化枝的适应量。它展现了每年不同的适应性值和适应性频率。这种分布的进化产生了一个适应性量的波动,把流感与最近的无性进化理论模型联系起来。这种波动的增长是通过群体的平均适应量来衡量,在图4中以黑色虚线表示。这种数量衡量了适应性和实际进化枝改变的频率之间的相关关系。它能用来比拟不同适应性模型的预测能力。最好的的表位适应模型解释了63%的全模型,最好的一致选择模型解释了57%的全模型。一个对于适应性模型的理论比拟也显示了相同的结果。这些结果说明,非表位变化和非线性选择在流感适应性进化和成功的预测方面都有很重要的作用。进化的另外一种潜在模式是通过图4中的单个系谱揭示的。我们观察到高适应性的进化株通过有益突变产生未来的高适应性进化株。特别是树干处的进化枝与预测的高适应值一致,在扩散中收到多重有益突变的驱动固定下来。同时,许多高适应性的进化枝最终消失,因为它们被其他竞争性的进化枝取代。单个的有益突变会丧失如果它发生于低适应性的进化枝中或者没有竞争过后来发生的有益突变。这些观察对于流感病毒的进化提供了无性干扰的直接证据,对于等位基因普遍存在的基因谱系。无性干扰作为群体中多个有利突变共存的效应可以解释观察到的A/H3N2进化枝地区适应性的差异:发生在东亚和东南亚的抗原突变与其他地区一样有着相同的效应,但是它们发生在世系中,积累了更多之前发生的有益突变。讨论我们基于HA基因的抗原和非抗原特征开发了一个模型,成功预测了年度的流感进化枝的进化。我们的模型适用于任何宿主-病原体相互作用-特别是抗原选择-产生连续的无性适应性种群。我们的结果强调了预测能力的决定因素:我们需要足够的基因型信息和抗原表型差异,多突变适应性负担组分,模型训练需要深入的没有偏差的抽样。这说明预测能够通过整合不同基因型和表型数据来提高,其中包括特定突变的自由能效应,血凝抑制数据,神经氨酸酶基因组学,毒株的地理分布。更进一步,预测可以从群体频率扩展至生长速率和种群数量,包括每年的发生率。我们希望从有限的毒株数据中对于特定突变的选择效应有更好的理解。这对于其他流感毒株的进化预测很关键,如A/H5N1和A/H7N9。从更大的范围讲,我们的模型在群体遗传学和流行病学之间建立了直接的联系,这在未来的工作中需要进一步探索。这个联系是毒株特异的适应功能方程,在SIR框架内决定感染宿主的变化。毒株适应性不仅取决于抗原特点,也取决于其他与表型连锁的基因序列。我们期望抗原适应性和其他保守功能的偶联并不局限于流感,而是对于快速适应的病原体是一个一般的规律。因此,这种系统的流行病学应该基于与适应性相关的所有表型的总体。除了病原体之外,我们的工作也触及了什么才是可预测的进化的根本原理。尽管对于这种问题没有清晰的答案,我们的分析说明在何种条件限制下预测才可能成功。图1流感病毒进化枝的进化。图中展示了一个基于2002年到2003年间观察到的毒株构建的局部流感毒株进化树。每个毒株i在对应的季节种群中的频率为。我们预测的单位是进化枝,定义是一个最近的共同祖先产生的一系列毒株。对于这些进化枝中的一支,我们标记了它在t=2002和t+1时冬季的毒株,和它在时间t时候共同的祖先。通过对进化枝的标记指明突变的密码子的位置和目标氨基酸。一个进化枝v在一个季节t的频率为,是它在季节t中所有毒株频率的总和。标记的进化枝大体上从=0.08生长到=0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2不一样的你我他(教案)-部编版道德与法治三年级下册
- 2024秋八年级道德与法治上册 第三单元 法律在我心中 第十课 维护消费者权利(维护我们的合法权益)教学设计 人民版
- 《第四单元10以内数加与减-小鸡吃食》(教学设计)-2024-2025学年一年级上册数学北师大版
- Unit 1 Making friends (教学设计)-2024-2025学年人教PEP版英语三年级上册
- 2024年二年级品生下册《爱惜每一张纸》教学设计2 鄂教版
- 2024-2025学年高中生物 第六章 从杂交育种到基因工程 第1节 杂交育种与诱变育种教学设计2 新人教版必修2
- 2023七年级英语上册 Module 6 A trip to the zoo Unit 3 Language in use教学设计 (新版)外研版
- Unit 1 The secrets of happiness Presenting ideas 教学设计 -2024-2025学年外研版(2024)七年级英语下册
- 2023六年级英语下册 Unit 7 Shanghai Is in the Southeast of China第1课时教学设计 陕旅版(三起)
- 2023三年级数学上册 二 观察物体第1课时 看一看(1)教学设计 北师大版
- 跨学科实践“桥梁调查与模型制作”(教学设计)-2024-2025学年八年级物理下学期项目化课程案例
- (二模)温州市2025届高三第二次适应性考试历史试卷(含答案)
- 全国高职单招时事政治历史题库
- 冷库货物储存合同范本
- 专题06 机械能守恒定律 能量守恒定律(练习)(解析版)-2025年高考物理二轮复习讲练测(新高考用)
- 应急物资储备检查改进应急预案
- 第15课《青春之光》课件-2024-2025学年统编版语文七年级下册
- 2025年河南轻工职业学院单招职业技能测试题库附答案
- 世界给予我的 课件-2024-2025学年高二下学期开学第一课主题班会
- 个体诊所申请书范文
- 《高速铁路系统》课件
评论
0/150
提交评论