




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ICSCCS65.020.99GXTCTechnicalspecificationofjickfruitcoldresistancegeneminingbasedontranscriptomesequencingtechnIT/GXTC0015—2024本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由广西壮族自治区亚热带作物研究所提出并宣贯。本文件由广西热带作物学会归口。本文件起草单位:广西壮族自治区亚热带作物研究所。本文件主要起草人:杜英俊、朱鹏锦、唐秀观、钟云婕、何江、欧景莉、叶维雁。1T/GXTC0015—2024菠萝蜜抗寒基因挖掘技术规范基于转录组测序技术本文件界定了菠萝蜜抗寒基因挖掘基于转录组测序技术的术语和定义,给出了技术原理,并规定了仪器设备及试剂、品种选择与使用、转录组测序流程、生物信息学分析的要求。本文件适用于筛选菠萝蜜抗寒基因。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T35890高通量测序数据序列格式规范3术语和定义下列术语和定义适用于本文件。3.1转录组测序transcriptomesequencing通过二代测序平台快速全面地获得某一物种特定细胞或组织在某一状态下的几乎所有的转录本及基因序列,可以用于研究基因表达量、基因功能、结构、可变剪接和新转录本预测等。3.2fastq格式fastqformat基于文本的、保存生物序列(通常是核酸序列)和其测序质量信息的、每四行表示一条序列的标准格式。3.3质量控制qualitycontrol对测序仪下机的原始数据进行质量评估,具体内容包括含N比例、GC含量、序列重复情况、序列长度分布情况、碱基平衡情况等。3.4测序片段sequencingfragment高通量测序平台产生的含有碱基序列和质量值的序列片段。3.5差异表达基因differentiallyexpressedgenes(DEGs)通过阈值法、统计法或者其他检验方法,筛选出组间的表达水平存在显著差异的基因。3.6差异倍数foldchange根据同一个基因或转录本在不同条件下表达丰度差异的倍数。4原理根据基因在不同样品中的表达量识别差异表达基因,并对其进行功能注释和富集分析,筛选差异表达基因。5仪器设备及试剂2T/GXTC0015—2024仪器:Illumina高通量测序平台、琼脂糖凝胶电泳仪、分光光度计、荧光计、生物分析仪。试剂:RNA提取试剂盒。6品种选择与使用6.1品系选取选取生长势一致耐寒品系(GXRZBLM00051,编号为A)和不耐寒品系(GXRZBLM00006,编号为B),低温胁迫(3℃~4℃)后A正常生长发育,没有出现寒害症状;而B出现寒害症状,其叶背面出现水浸状斑块,叶组织变成褐色或深褐色,后呈现青枯状。6.2样品制备分别选取两个品系的菠萝蜜各5棵树,从东南西北四个方向随机采集叶片,将叶片用去离子水(ddH₂O)洗净后放液氮中速冻,带回实验室-80℃冻存。7转录组测序流程7.1总RNA提取总RNA的提取采用多糖多酚植物总RNA提取试剂盒,操作按照RNA提取试剂盒说明书进行。7.2RNA检测度。检测RNA完整性。7.3文库构建按下列步骤执行:b)将RNA打断成短片段;f)双链cDNA末端修复、加A尾并连接测序接头;7.4文库质检7.4.1初步定量使用荧光计进行初步定量,使用生物分析仪对文库的插入片段长度(insertsize)进行检测,插入片段长度符合预期后才可进行下一步实验。7.4.2准确定量运用Q-PCR(荧光定量PCR)方法对文库的有效浓度进行准确定量(文库有效浓度>2nM完成库检。7.5上机测序库检合格后,用Illumina平台进行测序,测序后得到原始数据。原始数据为fastq格式。3T/GXTC0015—20248生物信息学分析步骤8.1测序数据及质量控制8.1.1测序数据过滤过滤流程如下:8.1.2测序错误率分布测序错误率计算公式如式(1):式中:e——测序错误率。8.1.3GC含量分布检查测序读段在每个位置的GC及AT含量应分别相等,且在整个测序过程基本稳定不变。8.2转录本拼接8.2.1拼接无参考基因组的转录组测序,采用Trinity软件对cleanreads(经过处理后去除低质量、含有接头的reads)进行拼接以获取后续分析的参考序列。8.2.2Corset聚类使用Corset比对转录本的reads数和表达模式,对转录本进行层次聚类,层次聚类后的序列信息以FASTA格式储存。8.2.3转录本拼接结果统计将Trinity拼接得到的转录本序列作为后续分析的参考序列,以Corset层次聚类后得到最长Cluster序8.3基因功能注释8.3.1NR数据库注释结果统计与NR库的比对,查看本物种转录本序列与相近物种的相似情况和同源序列的功能信息。8.3.2GO分类对基因进行GO注释之后,将注释成功的基因按照GO三个大类生物过程、细胞组分、分子功能的下一层级进行分类。8.3.3KOG分类4T/GXTC0015—2024运用KOG数据库,将功能注释直接继承给同一KOG簇的其他成员。8.4CDS预测对组装得到的转录本进行CDS(编码序列)预测,按下列步骤进行:a)进行开放阅读框(ORF)预测,默认保留氨基酸长度大于100的转录本。b)将预测得到的蛋白序列分别和Uniprot蛋白数据库、PFAM蛋白质结构域数据库进行比对注释,提高CDS预测的灵敏度。c)结合蛋白数据库的比对结果,保留和已知蛋白库有同源性的、可信度得分最高的ORF。8.5基因表达定量步骤如下:a)将Trinity组装并去冗余之后的转录本作为参考序列,将每个样品的cleanreads(经过处理后去除低质量、含有接头的reads)往参考序列上比对。让片段数目能真实地反映转录本表达水平。c)采用FPKM作为衡量转录本或基因表达水平的指标,FPKM计算公式如式(2):式中:8.5.1样品基因表达量整体分布用箱线图中表示单个样品基因表达水平分布的离散程度。用密度图展示样品中基因丰度随着表达量变化的趋势。用小提琴图展示多组数据的分布状态以及概率密度。8.5.2样品相关性分析将皮尔逊相关系数r作为生物学重复相关性的评估指标。生物学重复样品间R2≥0.8。8.5.3主成分分析运用主成分分析(PCA)从原始变量中导出少数几个主成分,将原来多个指标作线性组合,作为新的综合指标。8.6差异基因筛选8.6.1差异表达基因分析和筛选条件设置按下列步骤执行:a)有生物学重复的样品,使用DESeq2进行样品组间的差异表达分析;无生物学重复的样品使用FPKM等经过标准化的数据。b)对假设检验概率(Pvalue)进行多重假设检验校正,得到错误发现率(FDR)。8.6.2基因上的reads原始计数对比对结果进行统计,得到每个样品比对到每个基因上的reads数目。5T/GXTC0015—20248.6.3差异基因数量统计统计每组的差异基因总数、上调基因数、下调基因数。8.6.4差异基因信息汇总对每个差异分组计算得到差异基因信息进行统计汇总。8.6.5差异基因M-versus-Aplot分析利用MA图分析基因的表达水平和差异倍数的整体分布。8.6.6差异基因volcanoplot分析利用火山图分析两组样品中差异基因的整体分布情况。8.6.7基因表达聚类分析将各比较组合差异基因做层次聚类分析,对数据进行标准化处理。8.7差异表达基因功能注释和富集分析8.7.1差异表达基因功能注释将基因注释到KEGG、GO、KOG数据库后,统计数据库中每个通路包含的差异基因数量。8.7.2差异表达基因KEGG富集分析8.7.2.1Pathway(通路)显著性富集分析以KEGG数据库中Pathway为单位,找出与整个基因组背景相比,在差异表达基因中显著性富集的Pathway。8.7.2.2对KEGG的Pathway进行解析,使用相应网页来展示KEGG富集通路。8.7.2.3KEGG富集程度通过Richfactor(指该通路中富集到的差异基因个数与注释到该通路所有基因个数的比值)、Qvalue(Q值)和富8.7.3差异表达基因GO富集分析8.7.3.1将差异表达基因按照GO三个大类生物过程、细胞组分、分子功能的下一层级进行分类。8.7.3.2找出与整个基因组背景相比,在差异表达基因中显著性富集
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2.2声音的特性 说课稿2025年初中人教版物理八年级上册
- 2025年党政领导干部党章党规党纪知识考试题库及答案(共150题)
- 智能财税综合实训 上篇 课件全套 社会共享初级代理实务-社会共享企业管家
- 2025年可生物降解有机垃圾厌氧发酵装置合作协议书
- 2025年广东省深圳市中考一模语文试题(原卷版+解析版)
- 银行业务流程优化与风险控制方案
- 网络安全攻防实战与防御策略
- 新能源行业光伏电站智能调度与管理方案
- 制造业智能化生产线升级方案
- 项目执行阶段工作总结与经验教训分享报告
- 2024-2025学年第二学期天域全国名校协作体高三3月联考 语文试卷(含答案)
- 江苏省职教联盟2024-2025学年高二上学期校际联考期中调研测试语文卷(原卷版)
- 2025湘美版(2024)小学美术一年级下册教学设计(附目录)
- 异位妊娠妇产科护理学讲解
- 2025年度智慧养老服务平台开发与运营服务合同
- 2025中国铁塔甘肃分公司社会招聘60人易考易错模拟试题(共500题)试卷后附参考答案
- 儿童口腔接诊流程
- 2025社区医保工作计划
- 社会责任内审评估报告表
- 个人借款分期还款合同
- 船舶起重吊装作业安全方案
评论
0/150
提交评论