某基因的生物信息学分析方法讲述_第1页
某基因的生物信息学分析方法讲述_第2页
某基因的生物信息学分析方法讲述_第3页
某基因的生物信息学分析方法讲述_第4页
某基因的生物信息学分析方法讲述_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、对某基因一些简单的生物信息学分析方法牛志伟2022-3-19 所需用到的软件: DNAman 6.0; Bioxm; MEGA; DAMBE; PAML; Matlab;2022-3-19DatabaseWebsiteNCBIGene Database Goathttp:/ Nc Valuehttp:/emboss.bioinformatics.nl/cgi-bin/emboss/chipsEMBOSS CUSPhttp:/emboss.bioinformatics.nl/cgi-bin/emboss/cuspEMBOSS CAIhttp:/

2、emboss.bioinformatics.nl/cgi-bin/emboss/caiSwiss/NCBI CD-Search/Structure/cdd/wrpsb.cgiPfam/search/sequenceSMARThttp:/smart.embl-heidelberg.de/SOPMAhttp:/npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.htmlProtFunht

3、tp:/www.cbs.dtu.dk/services/ProtFun/2022-3-19pic22022-3-192022-3-192022-3-19http:/ 32022-3-19序列序列比对比对多序列比对多序列比对2022-3-19文件夹文件夹(找到你存放序列的文件夹找到你存放序列的文件夹)点点确定确定下一步下一步下一步完成2022-3-19输出输出-树树-系统发育树系统发育树2022-3-192022-3-192022-3-192022-3-192022-3-192022-3-192022-3-192022-3-19http:/emboss.bioinformatics.nl/cgi

4、-bin/emboss/chips2022-3-19http:/emboss.bioinformatics.nl/cgi-bin/emboss/cai2022-3-19要算CBI,需要先算每个物种的cusp;算cusp的网址如下:http:/emboss.bioinformatics.nl/cgi-bin/emboss/cusp将保存的文件命名为CUSP.txt将cusp.txt用写字板程序打开(右键-打开方式-记事本程序),出现如下界面保存文件,并将该文件复制到matlab安装文件夹的bin文件夹下打开matlab程序,在command window窗口中粘进下页中的代码2022-3-19a

5、=importdata(CUSP.txt);data=a.data(a.data(:,1)=0,:);textdata1=a.textdata(2:end,1:2);textdata=textdata1(a.data(:,1)=0,:);a_num=unique(textdata(strcmp(textdata(:,2),*)=0,2);for i=1:length(a_num) ni(i)=sum(data(strcmp(a_num(i),textdata(:,2),3); nimax(i)=max(data(strcmp(a_num(i),textdata(:,2),3); Si(i)=l

6、ength(textdata(strcmp(textdata(:,2),a_num(i),2);endntot=sum(ni)-ni(:,strcmp(a_num,M)-ni(:,strcmp(a_num,W);Rij=0;for i=1:length(data) Rij(i)=data(i,3)/max(data(strcmp(textdata(i,2),textdata(:,2),3);enda_num1=a_num(Si=1);Si1=Si(Si=1);ni1=ni(Si=1);a_num2=a_num1(strcmp(a_num1,M)=0&strcmp(a_num1,W)=0

7、);Si2=Si1(:,strcmp(a_num1,M)=0&strcmp(a_num1,W)=0);ni2=ni1(:,strcmp(a_num1,M)=0&strcmp(a_num1,W)=0);tmp=0;tmp_data=0;CBI=0;for i=1:length(a_num2) for j=1:Si2(i) %count=count+1; tmp_data=Rij(1,strcmp(a_num2(i),textdata(:,2); tmp=sum(1-tmp_data(j)2)/(Si2(i)-1)+tmp; end CBI=sum(ni2(i)/ntot)*tmp

8、)+CBI; tmp=0;end便会出现结果,点击右键,复制结果值2022-3-19Align-edit/build Alignment2022-3-19注意此时将终止密码子去除。方式:鼠标左键选中,然后按后退键注意此时修改序列名称,因为后面有个软件要求序列名称不超过10个字符,且序列名称与序列之间空格不少于2字符,所以将名称修改成物种名即可,方式:右键编辑序列名称2022-3-19Alignment -Align by ClustalW(Codons)或者Align by Muscle(Codons)Data-Export AlignmentFASAT Format保存成名为:XX.fas

9、Fileopen standard sequence file打开名为xx.fas的文件FileSave or Convert Sequence Format(建议选择PAML格式)保存为名为xx.PML的文件2022-3-19G、把转换后的数据文件xx.PML和PAML子程序yn00.exe和它的控制文件yn00.ctl放到相同的工作文件夹中;右键点击yn00.ctl,打开方式选记事本文件保存关闭窗口2022-3-19打开输出文件xx-result.txt,即可查看结果。在文件夹中双击yn00.exe;2022-3-191、ka/ks的计算步骤:A、安装PAML、MEGA和DAMBE软件;B

10、、从MEGA软件中的File中导入需进行比对的序列文件,点击Align(要求核苷酸序列是三的倍数,没有终止密码子,核苷酸序列的第一位是密码子的第一位);C、在新打开的窗口中的Alignment按钮中选择序列比对的方法(可选择Align by ClustalW(Codons)或者Align by Muscle(Codons);D、在新窗口中的Data按钮中选择序列比对结果的输出方式(建议选择Fasta格式);E、打开DAMBE中的File按钮导入序列比对文件(选择open standard sequence file);F、在DAMBE中的File按钮把文件转化成所需要的格式进行输出(选择Sav

11、e or Convert Sequence Format,建议选择PAML格式,虽然phylip格式和nexus格式也可被PAML有条件的识别,但要按照PAML的要求进行改造:a、序列名称需不超过10个字符,b、序列名称和序列之间需有2个以上的空格间隔,c、如果是层叠式数据,需要加上I进行注释,其余类别数据同理处理);G、把转换后的数据文件和PAML子程序yn00.exe和它的控制文件yn00.ctl放到相同的工作文件夹中;H、对yn00.ctl文件的输入、输出项根据自己的输入、输出文件名进行相应修改;I、打开命令行,把当前目录调整到工作文件夹中,输入yn00;J、打开输出文件,即可查看结果。

12、2022-3-192022-3-19http:/npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html2022-3-192022-3-19fileopen2022-3-192022-3-19analysis-protein-motif search2022-3-192022-3-192022-3-192022-3-192022-3-19Swiss /2022-3-192022-3-192022-3-192022-3-192022-3-192022-3-19NCBI CD-

13、Search/Structure/cdd/wrpsb.cgi2022-3-192022-3-19Pfam/search/sequence2022-3-192022-3-192022-3-19SMART http:/smart.embl-heidelberg.de/2022-3-192022-3-192022-3-192022-3-192022-3-19文件打开找到氨基酸序列文件打开2022-3-19蛋白质疏水性轮廓当前序列 2022-3-192022-3-19ProtFun http:/www.cbs.dtu.dk/services/ProtFun/2022-3-192022-3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论