标准肠杆菌的数值分类方法_第1页
标准肠杆菌的数值分类方法_第2页
标准肠杆菌的数值分类方法_第3页
标准肠杆菌的数值分类方法_第4页
标准肠杆菌的数值分类方法_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、    标准肠杆菌的数值分类方法        摘要:利用SAS软件中的Cluster过程编制程序绘制了分类的树枝,结合专业知识及统计上分类较佳标准,对肠杆菌中的89株标准菌进行数值分类,收到了良好的效果。关键词:肠杆菌SAS软件聚类分析数值分类中分类号:R 378.2文章编号:1004-4337(2000)01-0019-02微生物中细菌的分类方法有多种1,随着医学的迅猛发展,利用计算机对细菌进行数值分类,已越来越受到人们的重视。本文利用SAS软件中的聚类分析,对89株标准

2、肠杆菌的数值分类进行了探讨。1资料我们研究了细菌细胞结构的30分钟脱氢酶检测方法,来指示完整细胞脱氢酶活性和部分水解酶活性,并以脱氢酶反应作为细菌分类标志。共选取了20项指标,每一株细菌在每项指标下的反应是阳性输入微机时记为1、阴性变为0,每菌株根据稳定情况重复做215次实验,取其均值作为在相应指标下的原始数据,见表1。表1标准肠杆菌的资料(±S)及聚类均数指标名称标准菌资料±S类别编号12345678色氨酸X10.2472±0.43380.0000.0000.0000.9001.0001.0000.0001.000香草酸X20.0449±0.20840

3、.0000.0000.0000.0000.0000.0001.0000.000肌醇X30.1236±0.33100.0000.0000.2000.0000.0001.0000.0000.000亮氨酸X40.2562±0.43690.0000.0000.0001.0001.0001.0000.0001.000苏氨酸X50.2146±0.39130.0530.0000.3200.9300.0000.6000.0001.000赖氨酸X60.3558±0.44950.3070.0160.8000.9670.0000.7140.0001.000精氨酸X70.015

4、4±0.09580.0000.0000.0000.0170.0000.0000.0000.200乙酸钠X80.5349±0.46060.8560.0161.0000.4040.0000.7430.8330.200阿拉伯糖X90.5004±0.47270.9240.1601.0000.2870.0000.0570.3330.575丙二酸钠X100.0073±0.03960.0000.0000.0000.0000.0000.0000.0000.225葡萄糖X110.9865±0.10791.0000.9921.0001.0001.0001.0001

5、.0001.000乳糖X120.1685±0.37650.3330.0001.0000.0000.0000.0000.0000.000麦芽糖X130.9865±0.10791.0000.9921.0001.0001.0001.0001.0001.000甘露醇X140.6270±0.48451.0000.5921.0000.1000.0000.0001.0000.000蔗糖X150.1528±0.35550.0000.0400.4000.0200.0001.0000.3330.200纤维二糖X160.0901±0.26480.0340.0000.

6、9200.0200.5000.0290.0000.000海藻糖X170.7989±0.39501.0000.3921.0000.9800.5001.0001.0000.750甜糖X180.0857±0.23990.0370.0000.0800.0000.0000.4760.0000.000谷氨酸X190.7520±0.41290.8440.3520.9601.0001.0001.0001.0001.000葡萄糖酸X200.5401±0.44450.7640.1080.9600.5370.0000.5901.0000.6752方法及结果 2.1系统聚类SA

7、S软件聚类分析提供了五个过程:Cluster、Fastclus、Varclus、Tree及Aceclus过程。我们采用了Cluster系统聚类过程对89株标准菌株进行了聚类。Clustcr过程中有11种聚类方法,经类平均法、重心法、最小方差法、最短距离法、中位数法等几种方法聚类,以类平均法较为理想,结果见表2。表2系统聚类中类平均法的聚类过程编号类别连接的类频数SPRSQRSQERSQCCCPSFPST2距离88OB3OB420.000001.0000.00087OB28OB2920.000001.0000.00016CL23OB67300.009070.7850.64315.1817.83.

8、54.54515OB130B1920.005870.7790.62915.9218.6.4.54714CL24OB2050.008610.7710.61516.3719.42.94.75213OB52OB5520.006620.7640.55917.2220.5.4.82812CL16CL18550.107680.6560.5836.4913.436.04.84211CL21CL15120.016830.6390.5666.0013.86.15.13210CL14OB7860.012940.6260.5476.4814.73.05.7153CL4CL6870.076950.1540.311-7

9、.847.88.58.5762CL3OB9880.049230.1050.196-5.0410.25.010.2131CL2OB85890.104850.0000.0000.0010.214.2812.2选择合适的类数表2中的SPRSQ、RSQ、ERSQ、CCC、PSF和PST2,是六个衡量聚类情况的统计量。其中SPRSQ为半偏R2,它表示每一次合并对信息损失程度的大小;RSQ为R2,它反映的是累计聚类结果,上一次的R2减去本次半偏R2等于本次R2;ERSQ为在一致无效假设下近似期望的R2;CCC是打印在均匀原假设之下的立方聚类检验统计量;PSF是伪F统计量;PST2是t2统计量。因此,当CC

10、C和PSF出现峰值所对应的分类数较合适,而SPRSQ、RSQ、和PST2出现峰值的前一行所对应的分类数较合适。符合条件的可能不只一种情况,然后还要结合专业看资料大概属于多少类别,再来确定分类结果。本资料结合专业上标准菌来自的属类情况及统计上聚类结果较佳标准,得知用类平均法分成13类比较理想,其中5类是独立菌,菌株的编号分别为9、57、78、80、85。非独立菌的8类均数(即凝聚点)见表1的第2至第9列数字。2.3打印树枝按照SAS软件中Tree过程可按水平(或竖直)摆放树状。对于例数较多的资料,我们编制了树枝的专用程序2,可将89株标准菌的聚类结果打印出树枝。 3讨论3.1聚类分析是物以类聚的

11、一种统计分析方法,它的目的是把分类对象按一定规则分成组或类。这些组或类不是事先给定的,而是根据数据特征而定的。在细菌分类中,如果将每一个细菌在多项指标下的反应情况量化,得到原始数据矩阵,就可以采用聚类分析进行数值分类。3.2本研究的全部资料输入586微机,建立FoxBase库后,调入SAS 6.04版中的Cluster过程并自编树枝对标准菌进行聚类,将专业知识及聚类最佳判断标准有机地结合起来,得到了比较理想的数值分类结果。3.3目前,对细菌的数值分类用的较多的是中国科学院微生物研究所的MINTS软件包,但此软件包能处理的最多样品数为255例3,而SAS软件对例数没有要求。当例数较多的资料进行聚类时,可先用Fastclus过程聚成若干类,然后再用本文的方法进行系统聚类。作者单位:郭秀花(解放军北京医学高等专科学校北京100071)徐桂永(解放军北京医学高等专科学校北京100071)李爱国(解放军北京医学高等专科学

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论