![生物统计学的应用实验指导书_第1页](http://file4.renrendoc.com/view/a171b4cf15d65093b1e97f38828e99a4/a171b4cf15d65093b1e97f38828e99a41.gif)
![生物统计学的应用实验指导书_第2页](http://file4.renrendoc.com/view/a171b4cf15d65093b1e97f38828e99a4/a171b4cf15d65093b1e97f38828e99a42.gif)
![生物统计学的应用实验指导书_第3页](http://file4.renrendoc.com/view/a171b4cf15d65093b1e97f38828e99a4/a171b4cf15d65093b1e97f38828e99a43.gif)
![生物统计学的应用实验指导书_第4页](http://file4.renrendoc.com/view/a171b4cf15d65093b1e97f38828e99a4/a171b4cf15d65093b1e97f38828e99a44.gif)
![生物统计学的应用实验指导书_第5页](http://file4.renrendoc.com/view/a171b4cf15d65093b1e97f38828e99a4/a171b4cf15d65093b1e97f38828e99a45.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGEPAGE34目录前言 2Excel在描述统计中的应用 2Excel在推断统计中的应用 6实验一常用计算方法及描述统计量分析 12试验二假设检验 17试验三方差分析 20试验四回归与相关分析 25试验五生物信息学研究与分析 27练习作业 30
前言统计学是系统介绍有关如何测定、搜集、整理和分析客观现象总体数量特征的方法论科学。随着科学技术和社会经济的不断发展,统计学的应用领域也越来越广阔,特别是随着计算机科学的发展,基于大量数据处理的统计学在探求客观事物规律性方面越发显得重要,而统计学与计算机数据处理的结合也越来越紧密。统计分析软件是数据分析的主要工具,完整的数据分析过程包括:数据的收集,数据的整理,数据的分析。统计学为数据分析过程提供一套完整的科学的方法论。统计软件为数据分析提供了实现手段。统计分析软件的一般特点:功能全面,系统地集成了多种成熟的统计分析方法;有完善的数据定义、操作和管理功能;方便地生成各种统计图形和统计表格;使用方式简单,有完备的联机帮助功能;软件开放性好,能方便地和其他软件进行数据交换。常用统计软件简介:eviews是tsp(dos版)的windows版本,以界面的友善、使用的简单而著称,基本上操作是傻瓜式,但是非常实用,处理回归方程是它的长处,能处理一般的回归包括多元回归问题。因为没有用dos操作系统了,所以这个软件很少用。SAS真正的巨无霸,被誉为国际上的标准统计软件和最权威的组合式优秀统计软件。但是图形操作界面比较糟糕,一切围绕编程设计;人机对话界面太不友好,学习起来较困难(要编程);说明书非常难懂;价格贵的人直跳。SPSS软件。这个软件的界面友好,使用简单,但是功能很强大,也可以编程,eviews能处理的它全能处理,另外横截面数据的处理是它的强项,能处理多变量问题,如进行因素分析、主成份分析、聚类分析、生存分析等。matlab软件。这是一种工科软件,功能非常强大,在建筑、工程中使用比较多,做出来的图形能够用完美来形容,编程能力很强,不过用在统计上有点大才小用,编程也相对复杂。但是用做数学建模绝对是个好的工具。EXCEL也能做一些简单直观的统计分析,如果已经安装宏的话还能做一些数值分析,也很实用。我们主要学习采用excel软件来处理相关实验数据。Excel在描述统计中的应用在使用Excel进行数据分析时,要经常使用到Excel中一些函数和数据分析工具。其中,函数是Excel预定义的内置公式。它可以接受被称为参数的特定数值,按函数的内置语法结构进行特定计算,最后返回一定的函数运算结果。例如,SUM函数对单元格或单元格区域执行相加运算,PMT函数在给定的利率、贷款期限和本金数额基础上计算偿还额。函数的语法以函数名称开始,后面是左圆括号、以逗号隔开的参数和右圆括号。参数可以是数字、文本、形如TRUE或FALSE的逻辑值、数组、形如#N/A的错误值,或单元格引用。给定的参数必须能产生有效的值。参数也可以是常量、公式或其它函数。Excel还提供了一组数据分析工具,称为“分析工具库”,在建立复杂的统计分析时,使用现成的数据分析工具,可以节省很多时间。只需为每一个分析工具提供必要的数据和参数,该工具就会使用适宜的统计或数学函数,在输出表格中显示相应的结果。其中的一些工具在生成输出表格时还能同时产生图表。如果要浏览已有的分析工具,可以单击“工具”菜单中的“数据分析”命令。如果“数据分析”命令没有出现在“工具”菜单上,则必须运行“安装”程序来加载“分析工具库”。安装完毕之后,必须通过“工具”菜单中的“加载宏”命令,在“加载宏”对话框中选择并启动它。一、描述统计工具(一)简介:此分析工具用于生成对输入区域中数据的单变量分析,提供数据趋中性和易变性等有关信息。(二)操作步骤:1.用鼠标点击工作表中待分析数据的任一单元格。2.选择“工具”菜单的“数据分析”子菜单。3.用鼠标双击数据分析工具中的“描述统计”选项。4.出现“描述统计”对话框,对话框内各选项的含义如下:输入区域:在此输入待分析数据区域的单元格范围。一般情况下Excel会自动根据当前单元格确定待分析数据区域。分组方式:如果需要指出输入区域中的数据是按行还是按列排列,则单击“行”或“列”。标志位于第一行/列:如果输入区域的第一行中包含标志项(变量名),则选中“标志位于第一行”复选框;如果输入区域的第一列中包含标志项,则选中“标志位于第一列”复选框;如果输入区域没有标志项,则不选任何复选框,Excel将在输出表中生成适宜的数据标志。均值置信度:若需要输出由样本均值推断总体均值的置信区间,则选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度。例如,置信度95%可计算出的总体样本均值置信区间为10,则表示:在5%的显著水平下总体均值的置信区间为(X-10,X+10)。第K个最大/小值:如果需要在输出表的某一行中包含每个区域的数据的第k个最大/小值,则选中此复选框。然后在右侧的编辑框中,输入k的数值。输出区域:在此框中可填写输出结果表左上角单元格地址,用于控制输出结果的存放位置。整个输出结果分为两列,左边一列包含统计标志项,右边一列包含统计值。根据所选择的“分组方式”选项的不同,Excel将为输入表中的每一行或每一列生成一个两列的统计表。新工作表:单击此选项,可在当前工作簿中插入新工作表,并由新工作表的A1单元格开始存放计算结果。如果需要给新工作表命名,则在右侧编辑框中键入名称。新工作簿:单击此选项,可创建一新工作簿,并在新工作簿的新工作表中存放计算结果。汇总统计:指定输出表中生成下列统计结果,则选中此复选框。这些统计结果有:平均值、标准误差、中值、众数、标准偏差、方差、峰值、偏斜度、极差(全距)最小值、最大值、总和、样本个数。5.填写完“描述统计”对话框之后,按“确定”按扭即可。(三)结果说明:描述统计工具可生成以下统计指标,按从上到下的顺序其中包括样本的平均值(),标准误差(),组中值(Medium),众数(Mode),样本标准差(S),样本方差(S2),峰度值,偏度值,极差(Max-Min),最小值(Min),最大值(Max),样本总和,样本个数(n)和一定显著水平下总体均值的置信区间。二.直方图工具(一)简介:直方图工具,用于在给定工作表中数据单元格区域和接收区间的情况下,计算数据的个别和累积频率,可以统计有限集中某个数直方图确定考试成绩的分布情况,它会给出考分出现在指定成绩区间的学生个数,而用户必须把存放分段区间的单元地址范围填写在在直方图工具对话框中的“接收区域”框中。(二)操作步骤:1.用鼠标点击表中待分析数据的任一单元格。2.选择“工具”菜单的“数据分析”子菜单。3.用鼠标双击数据分析工具中的“直方图”选项。4.出现“直方图”对话框,对话框内主要选项的含义如下:输入区域:在此输入待分析数据区域的单元格范围。接收区域(可选):在此输入接收区域的单元格范围,该区域应包含一组可选的用来计算频数的边界值。这些值应当按升序排列。只要存在的话,Excel将统计在各个相邻边界直之间的数据出现的次数。如果省略此处的接收区域,Excel将在数据组的最小值和最大值之间创建一组平滑分布的接收区间。标志:如果输入区域的第一行或第一列中包含标志项,则选中此复选框;如果输入区域没有标志项,则清除此该复选框,Excel将在输出表中生成适宜的数据标志。输出区域:在此输入结果输出表的左上角单元格的地址。如果输出表将覆盖已有的数据,Excel会自动确定输出区域的大小并显示信息。柏拉图:选中此复选框,可以在输出表中同时显示按降序排列频率数据。如果此复选框被清除,Excel将只按升序来排列数据。累积百分比:选中此复选框,可以在输出结果中添加一列累积百分比数值,并同时在直方图表中添加累积百分比折线。如果清除此选项,则会省略以上结果。图表输出:选中此复选框,可以在输出表中同时生成一个嵌入式直方图表。5.按需要填写完“直方图”对话框之后,按“确定”按扭即可。(三)结果说明:完整的结果通常包括三列和一个频率分布图,第一列是数值的区间范围,第二列是数值分布的频数,第三列是频数分布的累积百分比。三、利用Excel绘制散点图(一)简介:散点图是观察两个变量之间关系程度最为直观的工具之一,利用Excel的图表向导,可以非常方便的创建并且改进一个散点图,也可以在一个图表中同时显示两个以上变量之间的散点图。(二)操作步骤:数据如图附-3所示,可按如下步骤建立变量x-y,x-z的散点图:1.拖动鼠标选定数值区域A2:C12,不包括数据上面的标志项。2.选择“插入”菜单的“图表”子菜单,进入图表向导。3.选择“图表类型”为“散点图”,然后单击“下一步”。4.确定用于制作图表的数据区。Excel将自动把你前面所选定的数据区的地址放入图表数据区的内。5.在此例之中,需要建立两个系列的散点图,一个是x-y系列的散点图,一个是x-z系列的散点图,因此,必须单击“系列”标签,确认系列1的“X值”方框与“数值方框”分别输入了x,y数值的范围,在系列2的“X值”方框与“数值方框”分别输入了x,z数值的范围。在此例中,这些都是Excel已经默认的范围,所以,可忽略第5步,直接单击“下一步”即可。6.填写图表标题为“X-Y与X-Z散点图”,X轴坐标名称为“X”与Y轴坐标名称“Y/Z”,单击“下一步”。7.选择图表输出的位置,然后单击“完成”按扭即生成图附-4的图表。(三)结果说明:如图附-4所示,Excel中可同时生成两个序列的散点图,并分为两种颜色显示。通过散点图可观察出两个变量的关系,为变量之间的建立模型作准备。四、数据透视表工具(一)简介:数据透视表是Excel中强有力的数据列表分析工具。它不仅可以用来作单变量数据的次数分布或总和分析,还可以用来作双变量数据的交叉频数分析、总和分析和其它统计量的分析。(二)操作步骤:如图附-5所示,表中列出学生两门功课评定结果,可按如下步骤建立交叉频数表:1.选中图附-5中表格中有数据的任一单元格,然后选择“数据”菜单的“数据透视表”子菜单,进入数据透视表向导。2.选择“MicrosoftExcel数据清单或数据库”为数据源。单击“下一步”。3.选择待分析的数据的区域,一般情况下Excel会自动根据当前单元格确定待分析数据区域,因此你只要直接单击“下一步”按扭即可。4.确定数据透视表的结构,在此例中,要建立的是一个交叉频数表,分别按语文和数学的成绩对学生的人数进行交叉频数分析,因此可按图附-6将三个按扭“学号”、“语文”、“数学”分别拖放到表格的指定部位,并且双击“求和项:学号”,将其改为记数项,结果如图附-6所示,然后单击“下一步”按扭。图附-65.选择数据透视表的显示位置之后,单击“完成按扭”,可出现如图附-7所示的数据透视表。图附-7(三)结果说明:如图附-7的结果所示,数据透视表可以作为一个交叉频数分析工具。完成数据透视表之后,可按需要修改数据表的显示格式。例如,如果想要把表格中的频数替换成为百分比数。可以用鼠标右击频数的任一单元格,选择“字段”子菜单,单击“选项”按扭,将“数据显示方式”替换成为“占总和的百分比”,然后单击“确定”按扭即可。按同样方式,可将数据透视表修改成为其它不同样式。五、排位与百分比工具(一)简介:此分析工具可以产生一个数据列表,在其中罗列给定数据集中各个数值的大小次序排位和相应的百分比排位。用来分析数据集中各数值间的相互位置关系。(二)操作步骤:1.用鼠标点击表中待分析数据的任一单元格。2.选择“工具”菜单的“数据分析”子菜单。3.用鼠标双击数据分析工具中的“排位与百分比”选项。4.填写完“排位与百分比”对话框,单击“确定”按扭即可。(三)结果说明:输出的结果可分为四列,第一列“点”是数值原来的存放位置,第二列是相应的数值,第三列是数值的排序号,第四列是数值的百分比排位,它的计算方法是:小于该数值的数值个数/(数值总个数-1)。Excel在推断统计中的应用一、由样本推断总体(一)简介:利用Excel的几个函数,如求平均函数AVERAGE、标准差函数STDEV、T分布函数TINV等的组合使用可以构造出一个专门用于实现样本推断总体的Excel工作表。以下例子先计算样本的平均数和标准差,然后在一定置信水平上估计总体均值的区间范围。(二)操作步骤:1.构造工作表。如图附-13所示,首先在各个单元格输入以下的内容,其中左边是变量名,右边是相应的计算公式。2.为表格右边的公式计算结果定义左边的变量名。选定A4:B6,A8:B8和A10:B15单元格(先选择第一部分,再按住CTRL键选取另外两个部分),选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“最左列”选项,然后点击“确定”按扭即可。3.输入样本数据,和用户指定的置信水平0.95,如图附-13所示。4.为样本数据命名。选定D1:D11单元格,选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“首行”选项,然后点击“确定”按扭,得到图附-14所示的计算结果。图附-13(三)结果说明:以上例子说明如何交叉组合使用Excel的公式和函数,以构造出一个能实现样本推断总体有关计算的Excel工作表。实际上,在用Excel进行数据统计处理之时,许多统计功能可以使用和上例类似的方法,通过组合使用Excel的各类统计函数和公式加以实现的。图附-14二、假设检验(一)简介:假设检验是统计推断中的重要内容。以下例子利用Excel的正态分布函数NORMSDIST、判断函数IF等,构造一张能够实现在总体方差已知情况下进行总体均值假设检验的Excel工作表。(二)操作步骤:1.构造工作表。如图附-15所示,首先在各个单元格输入以下的内容,其中左边是变量名,右边是相应的计算公式。2.为表格右边的公式计算结果定义左边的变量名。选定A3:B4,A6:B8,A10:A11,A13:A15和A17:B19单元格,选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“最左列”选项,然后点击“确定”按扭即可。3.输入样本数据,以及总体标准差、总体均值假设、置信水平数据。如图附-16所示。4.为样本数据命名。选定C1:C11单元格,选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“首行”选项,然后点击“确定”按扭,得到如图附-16中所示的计算结果。图附-15图附-16(三)结果说明:如图附-16所示,该例子的检验结果不论是单侧还是双侧均为拒绝Ho假设。所以,根据样本的计算结果,在5%的显著水平之下,拒绝总体均值为35的假设。同时由单侧显著水平的计算结果还可以看出,在总体均值是35的假设之下,样本均值小于等于31.4的概率仅为0.020303562。三、双样本等均值假设检验(一)简介:双样本等均值检验是在一定置信水平之下,在两个总体方差相等的假设之下,检验两个总体均值的差值等于指定平均差的假设是否成立的检验。我们可以直接使用在Excel数据分析中提供双样本等均值假设检验工具进行假设检验。以下通过一例说明双样本等均值假设检验的操作步骤。例子如下,某工厂为了比较两种装配方法的效率,分别组织了两组员工,每组9人,一组采用新的装配方法,另外一组采用旧的装配方法。18个员工的设备装配时间图附-17中表格所示。根据以下数据,是否有理由认为新的装配方法更节约时间?(二)操作步骤:以上例子可按如下步骤进行假设检验。1.选择“工具”菜单的“数据分析”子菜单,双击“t-检验:双样本等方差假设”选项,则弹出图附-18所示对话框。2.分别填写变量1的区域:$B$1:$B$10,变量2的区域:$D$1:$D$10,由于我们进行的是等均值的检验,填写假设平均差为0,由于数据的首行包括标志项选择标志选项,所以选择“标志”选项,再填写显著水平α为0.05,然后点击“确定”按扭。则可以得到图附-19所示的结果。(三)结果分析:如图附-19中所示,表中分别给出了两组装配时间的平均值、方差和样本个数。其中,合并方差是样本方差加权之后的平均值,Df是假设检验的自由度它等于样本总个数减2,t统计量是两个样本差值减去图附-19假设平均差之后再除于标准误差的结果,“P(T<=t)单尾”是单尾检验的显著水平,“t单尾临界”是单尾检验t的临界值,“P(T<=t)双尾”是双尾检验的显著水平,“t双尾临界”是双尾检验t的临界值。由下表的结果可以看出t统计量均小于两个临界值,所以,在5%显著水平下,不能拒绝两个总体均值相等的假设,即两种装配方法所耗时间没有显著的不同。假设平均差之后再除于标准误差的结果,“P(T<=t)单尾”是单尾检验的显著水平,“t单尾临界”是单尾检验t的临界值,“P(T<=t)双尾”是双尾检验的显著水平,“t双尾临界”是双尾检验t的临界值。由下表的结果可以看出t统计量均小于两个临界值,所以,在5%显著水平下,不能拒绝两个总体均值相等的假设,即两种装配方法所耗时间没有显著的不同。Excel中还提供了以下类似的假设检验的数据分析工具,它们的名称和作用如下:1.“t-检验:双样本异方差假设”:此分析工具可以进行双样本studentt-检验,与双样本等方差假设检验不同,该检验是在两个数据集的方差不等的前提假设之下进行两总体均值差额的检验,故也称作异方差t-检验。可以使用t-检验来确定两个样本均值实际上是否相等。当进行分析的样本个数不同时,可使用此检验。如果某一样本组在某次处理前后都进行了检验,则应使用“成对检验”。2.“t-检验:成对双样本均值分析”:此分析工具可以进行成对双样本学生氏t-检验,用来确定样本均值是否不等。此t-检验并不假设两个总体的方差是相等的。当样本中出现自然配对的观察值时,可以使用此成对检验,例如,对一个样本组进行了两次检验,抽取实验前的一次和实验后的一次。3.“z-检验:双样本均值分析”:此分析工具可以进行方差已知的双样本均值z-检验。此工具用于检验两个总体均值之间存在差异的假设。例如,可以使用此检验来确定两种汽车模型性能之间的差异情况。四、线性回归分析(一)简介:线性回归分析通过对一组观察值使用“最小二乘法”直线拟合,用来分析单个因变量是如何受一个或几个自变量影响的。例子如图附-34所示,表中是我国1987年至1997年的布匹人均产量和人均纱产量,试用线性回归分析的方法分析两组数据之间的关系。(二)操作步骤1.选择“工具”菜单的“数据分析”子菜单,双击“回归”选项,弹出回归分析对话框。其中主要选项的含义如下:Y值输入区域,在此输入对因变量数据区域,该区域必须由单列数据组成;X值输入区域,在此输入对自变量数据区域,Excel将对此区域中的自变量从左到右按升序排列,自变量的个数最多为16;置信度,如果需要在汇总输出表中包含附加的置信度信息,则选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度,95%为默认值;常数为零,如果要强制回归线通过原点,则选中此复选框;输出区域,在此输入对输出表左上角单元格的引用。汇总输出表至少需要有七列的宽度,包含的内容有anova表、系数、y估计值的标准误差、r2值、观察值个数,以及系数的标准误差;新工作表,单击此选项,可在当前工作簿中插入新工作表,并由新工作表的A1单元格开始粘贴计算结果,如果需要给新工作表命名,则在右侧的编辑框中键入名称;新工作簿,单击此选项,可创建一新工作簿,并在新工作簿中的新工作表中粘贴计算结果;残差,如果需要以残差输出表的形式查看残差,则选中此复选框;标准残差,如果需要在残差输出表中包含标准残差,则选中此复选框;残差图,如果需要生成一张图表,绘制每个自变量及其残差,则选中此复选框;线形拟合图,如果需要为预测值和观察值生成一个图表,则选中此复选框;正态概率图,如果需要绘制正态概率图,则选中此复选框。2.按如下方式填写对话框:X值输入区域为$B$1:$B$12,Y值输入区域为$C$1:$c$12,并选择“标志”和“线性拟合图”两个复选框,然后单击“确定”按扭即可。(三)结果分析按照如上的操作步骤即可得到图附-35下表的计算结果。结果可以分为四个部分,第一部分是回归统计的结果包括多元相关系数、可决系数R2、调整之后的相关系数、回归标准差以及样本个数。第二部分是方差分析的结果包括可解释的离差、残差、总离差和它们的自由度以及由此计算出的F统计量和相应的显著水平。第三部分是回归方程的截距和斜率的估计值以及它们的估计标准误差、t统计量大小双边拖尾概率值、以及估计值的上下界。根据这部分的结果可知回归方程为Y=8.46433*X-18.288。第四部分是样本散点图,其中蓝色的点是样本的真实散点图,红色的点是根据回归方程进行样本历史模拟的散点。如果觉得散点图不够清晰可以用鼠标拖动图形的边界达到控制图形大小的目的。用相同的方法可以进行多元线性方程的参数估计,还可以在自变量中引入虚拟变量以增加方程的拟合程度。对于非线性的方程的参数估计,可以在进行样本数据的线性化处理之后,再按以上步骤进行参数估计。五、相关系数分析工具(一)简介:此分析工具可用于判断两组数据之间的关系。可以使用“相关系数”分析工具来确定两个区域中数据的变化是否相关,即,一个集合的较大数据是否与另一个集合的较大数据相对应(正相关);或者一个集合的较小数据是否与另一个集合的较小数据相对应(负相关);还是两个集合中的数据互不相关(相关系数为零)。(二)操作步骤:采用图附-3表中的数据,可按如下步骤计算变量x,y,z之间的相关系数。1.用鼠标点击表中待分析数据的任一单元格。2.选择“工具”菜单的“数据分析”子菜单。3.用鼠标双击数据分析工具中的“相关系数”选项。4.填写完“相关系数”对话框,单击“确定”按扭即可得到各个变量的相关系数矩阵,结果如图附-36所示。(三)结果说明:以上下三角矩阵计算出三个变量x,y,z两两之间的相关系数,如变量x,y之间的相关系数为:0.929167,所以可以判断x,y之间存在着较高的正线性相关关系。
实验部分实验一常用计算方法及描述统计量分析实验目的:了解相关统计软件,掌握用EXCEL和SPSS等软件计算描述统计量并作统计分析图。一、用EXCEL软件实现统计描述【相关软件介绍,见前面内容(略),上机演示,学生练习。】二、用EXCEL中的数据分析工具计算描述统计量的具体步骤:1、选择“工具”下拉菜单2、选择“数据分析”选项3、在分析工具中选择“描述统计”4、当出现对话框时在“输入区域”方框内键入A1:A50在“输出选项”中选择输出区域(在此选择“新工作表”)选择“汇总统计”(该选项给出全部描述统计量)选择“确定”三、用SPSS软件实现统计描述四、用EXCEL作频数分布表和图形的步骤:一)、直方图:1、在第一列中输入全部分析数据2、选择“工具”下拉菜单3、选择“数据分析”选项4、在分析工具中选择“直方图”5、当出现对话框时在“输入区域”方框内键入B2:B101在“接收区域”:C14在“输出区域”方框内键入E3选择“累计百分率”选择“图表输出”选择“确定”二)、箱体图:步骤1:准备要绘图原始数据于Excel工作表上[A1:C11]ABC1noY1Y22115.6317.223217.4418.194317.8320.715419.4021.706519.5322.547620.4922.768722.1922.919822.4023.0710922.5523.82111023.4725.50
步骤二:制作绘制Boxplot所需数据组,工作表上[A13:C18],注意顺序内容不可更改
ABC13统计量Y1Y214Q118.2220.9615Q015.6317.2216Q220.0122.6517Q423.4725.5018Q322.3523.03
表中Q0~Q4的Q为四分位数,0~4分别代表第0~4分位数,可用函数求得,如Y1的Q0~Q4如表所示Q1第1分位数第25%点值=Quartile(B2:B11,1)Q0第0分位数第0点值(最小值)=Quartile(B2:B11,0)Q2第2分位数第50%点值(中位值)=Quartile(B2:B11,2)Q4第4分位数第100%点值(最大值)=Quartile(B2:B11,4)Q3第3分位数第75%点值=Quartile(B2:B11,3)
步骤三:开始制作绘制Boxplot1选取[B13:C18]2点[图表向导]选[折线图]的第一个折线图(不要数据点,通常默认为数据点折线图),
点[下一步],在[数据区域]卷标下,自[系列产生在]点[行]←重点3进入图表选项后取消勾选[网络线],取消勾选[图例]后完成[图表向导],此图表显示五条线4用鼠标点图中的任一线后取右键,叫出[数据系列格式],在[选项]卷标下,勾选[高低点连线]与[涨/跌柱线],此后原为灰色的[分类间距]变黑,内有数字默认为150,不必更动(有需要时可变更此数改变箱线图的箱宽),点击[确定]后就会出现箱线图。
步骤四:开始润饰Boxplot图此为Excel图表操作基本功夫故不详述,润饰内容1更改刻度为15~28,主要刻度为2.52更改中位数的[数据标记]为『-』,因为无数据点的折线图看不到中位数,故需要让其显示,作法是点击联结Y1与Y2间五条线的中线(正常操作是黄色线),鼠标右键叫出[数据点格式],在[图案]卷标下[线形]点[无],[数据标记]点[自订义],[样式]选『-』(较长横线),[前颜色]请自订鲜艳颜色如蓝色,[大小]取5(最高14)3取消Y1与Y2间的4条连结线练习:1、箱图制作安慰剂D10mgD20mgP252.322.212.23P1004.404.385.23P01.101.261.12P502.792.722.77P753.353.223.492、误差条图表四种营养素喂养小白鼠三周后所增体重(g)营养素均数标准差A33.908.69B54.689.65C59.8211.25D75.6616.663、雷达图指标医院1医院2医院3治疗有效率%88.193.694.0重患收治率%医疗制度执行率%74.761.950.0护理制度执行率%54.727.420.0膳食供应优良率%41.334.020.0病床使用率%95.089.495.64、直方图,《生物统计学》书中例题,作业题2.9,练习题1和2。
试验二假设检验一、单样本假设检验1、方差检验的计算方法设H0:μ=μ0,且原始数据在A1:A20位置。①在空单元(设为B1)中输入公式:“=Var(A1:A20)*19/σ0^2↙”其中Var为EXCEL的内部函数,功能为求指定数据的方差.“↙”为回车键。②在B2格中输入:“=Chidist(B1,19)”这一步是计算统计量所对应的概率,相当于查表。注意函数Chidist返回的是单尾概率,而不是分布函数。③将B2中数据与α比较来确定是否接受H0:双边检验:若α/2<B2<1-α/2,则接受H0,否则接受HA;单边检验:若HA为σ>σ0:当B2>α时接受H0;若HA为σ<σ0:当B2<1-α时接受H0。一般地,在实际应用中都是将上述步骤可通过一次输入如下公式来完成:“=Chidist(Var(A1:A20)*19/σ0^2,19)↙”注意:大小写没有区分。2、均值检验方法设H0:μ=μ0,且原始数据在A1:A20位置。(1)总体方差σ0已知的情况①在空单元格(设为C1)中输入:“=ZTEST(A1:A20,μ0,σ0)↙”内部函数ZTEST可以直接算出u统计量所对应的单尾开率值。注意它返回的也是单尾概率,而不是分布函数。②仍按前面讲的比较B1与α的同样方法比较C1与α,并决定是否接受H0。(2)总体方差σ0未知——t检验①在空单元格D1-D20中均匀填充上μ0。②在空单元格E1中输入:“=TTEST(A1:A20,D1:D20,tails,1)↙”其中tails为一参数,当进行单尾检验时,把它换成1;进行双尾检验时,换成2。最后的1也是一个参数,一般配对检验为1,方差相等为2,方差不等为3。③把E1格中计算出来的值与α比较,E1>α时,接受H0。E1<α时,拒绝H0。例1、已知某种玉米平均穗重μ0=300g,标准差σ=9.5g,喷药后,随机抽取9个果穗,重量分别为(单位g):308,305,311,298,315,300,321,294,320。问这种药对果穗重量是否有影响?解:如表1-1,把果穗重原始数据填入A2:A10单元。检验方差是否变化:在B4单元里输入:“=Chidist(Var(A4:A12)*8/9.5^2,8)”回车后显示数字0.414234,由于这一数字在0.025和0.975之间,因此接受H0,认为方差没有变化。检验均值是否变化:由于方差已知,可采用ZTEST,在B8中输入:“=ZTEST(A2:A10,300,9.5)”回车后显示数字0.005763。由于这一数字小于0.025,大于0.005,因此拒绝H0,喷药前后果穗重差异显著,但未达到极显著。也可以当作方差未知,直接进行T检验:在C2:C10单元格中填充数字300。在D4单元格中输入:“=TTEST(A2:A10,C2:C10,2,1)”回车后显示数字0.037208,由于这一数字小于0.05,大于0.01,因此拒绝H0,喷药前后果穗重差异仍为显著,但未达到极显著水平。表1-1例1计算结果(μ0=300,σ0=9.5)果穗重308300305Chi-test300T-test3110.4142343000.037208298300315300300Z-test3003210.005763300294300320300二、双样本假设检验1、方差检验的计算方法-F检验原假设H0:σ=σ0,备择假设HA:σ≠σ0假设两组数据分别位于A1:A10,B1:B10。①在空单元格C1中输入:“=FTEST(A1:A10,B1:B10)↙”注意FTEST返回的是双尾概率,因此可以直接与α比较。②比较:C1>α时,接受H0。C1<α时,拒绝H0。2、均值检验方法(1)两总体方差已知——u检验①在空单元格D1中输入:“=(AVERAGE(A1:A10)-AVERAGE(B1:B10))/SQRT(σ12/count(A1:A10)+σ22/count(B1:B10))↙”这一步计算统计量的值,用了以下几个函数:AVERAGE计算平均数;SQRT计算平方根;count计算指定区域中数字的个数。σ12,σ22应直接输入数值。②在D2中输入:“=Normsdist(D1)↙”③将D2的数值与α比较:双边检验:若α/2<D2<1-α/2,则接受,否则接受HA;单边检验:上尾检验;若HA为μ1>μ2:当D2<1-α时接受H0;下尾检验:若HA为μ1<μ2:当D2>α时接受H0。注意:由于Normsdist函数返回的是分布函数,而不是尾区概率,因此这里单边检验的接受域与使用Chidist和Ztest函数时正好相反。使用时请特别注意所用函数返回的到底是分布函数还是尾区概率,否则单边检验时很容易出错误。(2)两总体方差未知由于Ttest函数中已考虑了方差未知时的各种可能,因此使用中很方便,只需改变以下参数的取值就可以了。①在空格E1中输入:“=TTEST(A1:A10,B1:B10,tails,type)↙”其中tails为一参数,当进行单尾检验时,把它换成1;进行双尾检验时,换成2。type也是一个参数,一般配对检验为1,方差相等为2,方差不等为3。使用时直接把参数换为相应的数值即可。由于函数返回的数值为尾区概率,因此可直接与α相比。②把E1的数值与α比较,E1>α时,接受,否则拒绝H0。注意:单尾检验中不管两个均值谁大Ttest给出的概率都是相同的,因此在上尾检验(HA:μ1>μ2)中第一个样本均值偏小,或下尾检验(HA:μ1<μ2)中第一个样本均值偏大,都有错误拒绝H0的可能,使用时需要特别注意。例2两发酵法生产青霉素的工厂,其产品收率的方差分别为σ12=0.46,σ22=0.37,现甲工厂测得25个数据,=3.71g/L,乙工厂测得30个数据,=3.46g/L,问它们的收率是否相同?解:由于两总体方差已知,可采用正态分布进行检验,在空格E3中输入“=Normsdist((3.71-3.46)/SQRT(0.46/25+0.37/30))”回车后显示数字0.923073,由于这一数字在0.025和0.975之间,因此接受H0,认为这两个工厂的收率相同。练习:1、验证课本上的例题。2、课本中的作业题4.6、4.10、4.11。3、练习题3、5、8
试验三方差分析方差分析是重要的统计方法之一,它主要用于比较多组数据的平均数是否相同。利用EXCEL的统计函数可以手工进行方差分析,也可以利用宏进行自动计算。本实验首先介绍方差分析的手工计算方法,然后再介绍利用宏进行自动计算的方法。一、方差分析的手工计算方法:我们通过例题来学习:一)、单因素方差分析例3-1用四种不同配合饲料饲养30日龄小鸡,10天后计算平均日增重,得到如下表中的数据,4钟饲料效果是否相同?表3-110天后小鸡的平均日增重饲料日增重xij/g15549624551261585268703716556735948590767869解:把数据输入EXCEL,得到表3-2。H0:各饲料无显著差异。表3-2计算结果(A2)饲料1饲料2饲料3饲料4重复155617185重复249586590重复362525676重复445687378重复551705969平均52.461.864.879.6方差41.854.254.266.3S2146.02895SST2774.55MSA636.18333F11.753965127.23667SSA1908.55MSe54.125P0.00025556SSe866计算步骤为:(1)计算各饲料日增重平均值:在B8中输入:“=Average(B3:B7)”回车后,显示数字52.4。然后把B8复制到C8:E8,得到各平均值。(2)计算SST:在B10中输入:“=Var(B3:E7)”回车后,显示数字146.02895。这是全部原始数据的样本方差。在D10中输入:“=19*B10回车后,显示数字2774.55。这就是总平方和SST。公式中19=ab-1,a=4,b=5。(3)计算SSA:在B11中输入:“=Var(B8:E8)”回车后,显示数字127.23667。这是各平均值的样本方差。在D11中输入:“=15*B11回车后,显示数字1908.55。这就是总平方和SSA。公式中15=b(a-1)。(4)计算SSe:在D12中输入:“=D10-D1回车后,显示数字866。这是平方和SSe。(5)计算MSA,MSe:在F10中输入:“=D11/3”回车后,显示数字636.18333。这就是MSA。其中3=a-1;在F11中输入:“=D12/16回车后,显示数字54.125。这就是MSe。公式中16=a(b-1)。(6)计算统计量及对应概率:在H10中输入:“=F10/F11回车后,显示数字11.753965。这就是F统计量。在H11中输入:“=Fdist(H10,3,16)”回车后,显示数字0.0002556。这就是F统计量对应的概率值。其中3为统计量分子的自由度a-1,16为分母自由度a(b-1)。由于H11<α=0.01,应拒绝H0,各饲料有极显著差异。多重比较:本题属于固定模型,因此可进一步进行多重比较,结果见表2-3,表2-3多重比较结果饲料4饲料3饲料2饲料179.664.861.852.4饲料152.42.48314E-050.0169433850.060429饲料261.80.0014902890.528225191饲料364.80.005807619具体步骤为:(7)复制平均数,并进行排序:把B8:E8复制到K3:N3,用“选择性粘贴”、“数值”。把B2:E2复制到K2:N2。用鼠标选择K2:N3区域,然后对它进行排序:用“数据”菜单下的“排序”命令,点击“选项”,在出现的菜单中选择“按行排序”,点击“确定”关闭“选项”菜单;并指定关键字为“行3”,“降序”,点击“确定”后,就完成了对平均数从大到小的排序。排序过程中,平均数和它对应的处理是连在一起排序的,这样有助于判断是哪些处理之间有显著差异。再把L2:N3复制到I4:J6,用“选择性粘贴”,“转置”命令,用鼠标选择I4:J6区域,再按J递增排序。(8)计算各平均数间T统计量所对应的概率,在K4中输入:“=TDIST((K$3-$J4)/SQRT(2*$F$12/5),16,2)”上式中有些列或行号前有“$”号,目的是为了在以后的复制中使相应的行号或列号不变化;SQRT为求平方根函数;$F$12为MSe的存贮地址;它前边的数字2为公式中的常数;后边的5为本例题中的常数b,再后边的16为MSe的自由度;最后的2表示为双尾检验。把K4复制到K5,K6,L4,M4;再把K5复制到L5。(9)把上面计算出的各概率与0.05比较,小于0.05的为差异显著;再与0.01比较,小于0.01的为差异极显著。本例题中饲料4与饲料1,2,3差异均达极显著;而饲料3与饲料1差异显著,其它差异不显著。从以上分析结果看,饲料4的增重最大,应是最好的。二)、双因素方差分析例3-2为选择合适的发酵条件,用三种原料、三种温度进行了试验,得到的结果列于下表,请进行统计分析。原料种类(A)温度(B)3035401414923251113252462226182475950404338333682214183355350433847445533262930解:把数据输入EXCEL表。并排列如下。按以下步骤进行计算:(1)计算各处理平均数:回车后,显示数字34.5。然后把B8复制到C8:E8,得到各平均值。(2)计算因素A,即温度的各水平平均值:在B9中输入:“=Average(B8:D8)”回车后,显示数字42.9167。再用鼠标标记B9:D9,点击“跨列居中“键,再把B9复制到E9,H9。这样就得到了各温度的平均值。(3)计算因素B,即原料各水平平均值:在B10中输入:“=Average(B8,E8,H8)”回车后,显示数字25.5833。再把B10复制到C10,D10。这样就得到各原料的平均值。(4)计算总平方和SST:在B12中输入:“=35*Var(B3:J6)”回车后,显示数字7000.556。其中35=abn-1,由于本题中a=b=3,n=4,故总自由度为35。(5)计算次总平方和SSST:在B13中输入:“=32*Var(B8:J8)”回车后,显示数字5513.5。其中35=n(ab-1)。(6)计算SSA:在B14中输入:“=24*Var(B9,E9,H9)”回车后,显示数字3150.5。其中24=bn(a-1)。(7)计算SSB:在B15中输入:“=24*Var(B10:D10)”其中24=an(b-1)。(8)计算SSAB:在B16中输入:“=B13-B14-B15”回车后,显示数字808.8333。(9)计算误差平方和SSe:在B17中输入:“=B12-B13”回车后,显示数字1656.5。(10)计算各个均方:在D14中输入:“B14/2”。回车后,显示数字1575.25,为MSA。其中2=(a-1)。在D15中输入:“B15/2”。回车后,显示数字777.083,为MSB。其中2=(b-1)。在D16中输入:“B16/4”。回车后,显示数字202.208,为MSAB。其中4=(a-1)(b-1)。在D17中输入:“B17/27”。回车后,显示数字61.35185,为MSe。其中27=ab(n-1)。(11)计算统计量及对应的尾区概率:在F14中输入:“=Fdist(D14/D17,2,27)”回车后,显示数字5.67×10-7,为统计量FA对应的概率值。其中D14/D17为FA统计量的值,2,27分别对应分子分母的自由度。在F15中输入:“=Fdist(D15/D17,2,27)”回车后,显示数字0.000132,为统计量FB对应的概率值。其中D15/D17为FB统计量的值,2,27分别对应分子分母的自由度。在F16中输入:“=Fdist(D16/D17,4,27)”回车后,显示数字0.025322,为统计量FAB对应的概率值。其中D16/D17为FAB统计量的值,4,27分别为其分子分母的自由度。(12)将F14,F15,F16中的数值分别与α比较,若大于α,则接受H0,认为该因素影响不显著;否则影响显著,对于本题来说,A,B两因素均达极显著水平,它们的交互作用也达到显著水平。以上认为A,B均为固定因素的检验方法,若认为有一个或两个因素为随机因素,则应相应改变统计量及自由度:若认为两因素均为随机因素,则应在检验主效应时改用MSAB为分母,即将F14,F15中输入的公式分别改为:“=Fdist(D14/D16,2,4)”“=Fdist(D15/D16,2,4)”其他不变。若只有一个因素为随机,设A固定,B随机,则在F14,F15中输入的公式分别改为:“=Fdist(D14/D16,2,4)”“=Fdist(D15/D17,2,27)”比较方法仍然不变。多重比较在各处理的平均数之间进行,方法同单因素方差分析,在这里只给出结果。因素A温度30℃温度35℃温度40℃因素B原料1原料2原料3原料1原料2原料3原料1原料2原料3重复14147351143386833重复2495953133847222226重复3235050253344261429重复4254043243655181830平均34.54945.2518.2537.5461815.529.5温度平均42.916733.916721.0000原料平均23.583334.000040.2500SST7000.555556SSST5429.055556SSA2912.722222MSA1456.361111FA7.12E-07SSB1701.39MSB850.694FB0.000050SSAB814.94MSAB203.736FAB0.019933SSe1571.5MSe58.20370二、采用EXCEL中的宏进行方差分析:采用宏进行方差分析的特点是计算都可自动完成,但它只能进行交叉分组固定模型的分析,如果是其他模型可利用其中间结果再重新计算。要用这种方法首先要加载宏:点击“工具”菜单下的“加载宏”命令,出现一对话框,在其中选取“分析工具库”和“分析工具库、VBA函数”,再点击“确定”钮;然后,在“工具”菜单下就会出现“数据分析”命令,点击后出现对话框,其中有方差分析,相关分析,协方差分析,指数平滑等多种分析工具可用。1、单因素方差分析在单因素方差分析中,因素类型对分析过程没有影响,因此不必重新计算,只需把数据输入EXCEL,就可利用宏进行计算。例3-3仍采用3-1相同的数据:用4种不同的配合饲料饲养30日龄小鸡,10天后计算平均日增重,得以下数据。问4种饲料效果是否相同?计算过程:(1)把原始数据输入B3:E7区域。(2)点击“工具”菜单下就会出现“数据分析”命令,点击后出现对话框,在对话框中选择“单因素方差分析”,然后点击“确定”。(3)在出现的对话框中,指定输入区域为B3:E7,分组方式为列,选定“标志位置位于第一行”,再指定输出区域为A9,然后点击“确定”。(4)结果解释:结果包括两个表,第一个SUMMARY表中有各水平的重复数,总和,平均数,方差等数据;第二个方差分析表中,给出组内和组间平方和,自由度,均方,F统计量,尾区概率,F分位数值等数据。尾区概率(表中标记为“P-value”)小于α时拒绝,大于时接受H0。本题中尾区概率为0.000256<0.01,应拒绝H0,表明差异极显著,与前面手工计算相同。2、双因素方差分析例3-4以例3-2的数据为例。(1)把原始数据输入B2:J6区域。(2)点击“工具”菜单下就会出现“数据分析”命令,点击后出现对话框,在对话框中选择“方差分析:有重复的双因素方差分析”,然后点击“确定”。(3)在出现的对话框中,在“数据区域”方框内键入B2:J6,在“α”框内输入0.05,在“输出选项”中选择输出区域D22,然后点击“确定”。(4)结果解释:结果包括两个表,第一个SUMMARY表中有各水平的重复数,总和,平均数,方差等数据;第二个方差分析表中,给出组内和组间平方和,自由度,均方,F统计量,尾区概率,F分位数值等数据。尾区概率(表中标记为“P-value”)小于α时拒绝,大于时接受H0。本题中尾区概率为0.000256<0.01,应拒绝H0,表明差异极显著,与前面手工计算相同。练习:1、验证课本上的例题。2、课本中的作业题6.6、6.7。3、练习题4、7、9、10、11
试验四回归与相关分析实验目的:了解回归分析与相关分析的操作过程,并对其结果进行分析。要求能独立完成相关与回归的上机操作。一、线性回归分析1、操作步骤选择“工具”菜单的“数据分析”子菜单,双击“回归”选项,弹出回归分析对话框。按如下方式填写对话框:X值输入区域为$B$1:$B$12,Y值输入区域为$C$1:$c$12,并选择“标志”和“线性拟合图”两个复选框,然后单击“确定”按扭即可。2、结果分析按照如上的操作步骤即可得到图附-35下表的计算结果。结果可以分为四个部分,第一部分是回归统计的结果包括多元相关系数、可决系数R2、调整之后的相关系数、回归标准差以及样本个数。第二部分是方差分析的结果包括可解释的离差、残差、总离差和它们的自由度以及由此计算出的F统计量和相应的显著水平。第三部分是回归方程的截距和斜率的估计值以及它们的估计标准误差、t统计量大小双边拖尾概率值、以及估计值的上下界。根据这部分的结果可知回归方程为Y=8.46433*X-18.288。第四部分是样本散点图,其中蓝色的点是样本的真实散点图,红色的点是根据回归方程进行样本历史模拟的散点。如果觉得散点图不够清晰可以用鼠标拖动图形的边界达到控制图形大小的目的。二、相关系数(一)、操作步骤:采用图附-3表中的数据,可按如下步骤计算变量x,y,z之间的相关系数。1.用鼠标点击表中待分析数据的任一单元格。2.选择“工具”菜单的“数据分析”子菜单。3.用鼠标双击数据分析工具中的“相关系数”选项。4.填写完“相关系数”对话框,单击“确定”按扭即可得到各个变量的相关系数矩阵,结果如图附-36所示。(二)结果说明:以上下三角矩阵计算出三个变量x,y,z两两之间的相关系数,如变量x,y之间的相关系数为:0.929167,所以可以判断x,y之间存在着较高的正线性相关关系。练习:1、验证课本上的例题。2、课本中的作业题7.4、7.5、7.6。3、练习题12、13
试验五生物信息学研究与分析实验目的:主要介绍专业相关的一些文献检索资料网站。要求学生能够独立地进行相关文献检索。一、常用的中英文文献数据库简介1、中文文献数据库(1)中国期刊网全文数据库CNKI(/index.htm)(2)重庆维普全文数据库(/)(3)万方数据库(/)(4)中国科学引文数据库()(5)中国专利数据库(中国知识产权局的官方网站:;中国知识产权网:)等等。2、外文文献数据库(1)荷兰Sciencedirect数据库()荷兰ElsevierScience公司出版的期刊是世界上公认的高质量学术期刊。Elsevier学术期刊覆盖的学科范围很广,包括生命科学、材料科学、自然科学、基础科学、医学、工程技术及社会科学等学科领域,它拥有约1672种电子全文期刊数据库,其中被SCI收录的有1289种。目前,我们学校的图书馆有ElsevierScience公司镜像链接。ScienceDirectOnline网址:/(2)德国springer数据库德国施普林格(Springer-Verlag)是世界上著名的科技出版集团,通过SpringerLink系统提供其学术期刊及电子图书的在线服务。2002年7月开始,Springer公司和EBSCO/Metapress公司在国内开通了SpringerLink服务。目前,SpringerLink所提供的全文电子期刊共包括以下11个“在线图书馆”:生命科学、医学、数学、化学、计算机科学、经济、法律、工程学、环境科学、地球科学、物理学与天文学,是科研工作人员的重要信息来源之一。目前,我们学校的图书馆也有其链接。网址:http://www.S(3)美国EBSCOEBSCO数据库是EBSCO公司出版的全世界多学科综合型全文数据库。是一个综合性的全文数据库包括数学、物理、化学、生物科学、工商经济、资讯科技、通讯传播、工程、教育、艺术、文学、社会科学、语言学和医学等领域的2860种期刊(含1250种全文刊),其中被SCI和SSCI收录的有约990种(约350种全文刊)。网址:(4)美国WileyInterScienceWileyInterScience是JohnWiely&Sons公司创建的动态在线服务数据库,1997年开始在网上开通。通过InterScience,Wiley公司可以许可协议形式向用户提供在线访问全文内容的服务。WileyInterScience收录了360多种科学、工程技术、医疗领域及相关专业的期刊,30多种大型专业参考书,13种实验室手册,WileyInterScienceOnlineBooks还提供4个专业领域的500多个题目的Wiley学术图书的全文,这四个专业为:化学、电子工程和通讯、生命科学和医学、数理和统计。网址:(5)美国HighWirePressHighWirePress是提供免费全文的、全球最大的学术文献出版商之一,收录的期刊覆盖以下学科:生命科学、医学、物理学、社会科学。按字母顺序浏览刊名时,刊名后标注为“Freeissues”的刊可以免费获得过刊的全文,时间从3个月前到两年前,各刊情况不同。标注为“Freetrial”的刊可以在试用期内获得全文。标注为“Freesite”的刊可以获得所有全文。网址:/或/(6)英国BlackwellBlackwell出版公司是世界上最大的期刊出版商之一(总部设在英国伦敦牛津),以出版国际性期刊为主,包含很多非英语地区出版的英文期刊。它所出版的学术期刊在科学技术、医学、社会科学以及人文科学等学科领域享有盛誉。Blackwell出版期刊总数已超过700种,其中理科类期刊占54%左右,其余为人文社会科学类。涉及学科包括:农业、动物学、医学、工程、数学统计、计算机技术、商业经济、生命科学、物理学、人文科学、艺术、社会及行为科学等。Blackwell出版期刊的学术质量很高,很多是各学科领域内的核心刊物,据最新统计,其中被SCI收录的有239种,被SSCI收录的有118种。网址:二、生物信息数据库及其相关网址1、PubMedPubMed是美国国家医学图书馆(NLM)所属的国家生物技术信息中心(NCBI)开发的因特网生物医学信息检索系统,位于美国国立卫生研究院(NIH)的平台上。网址及主页:/pubmed/;2、GenbankGenbank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。由美国国立生物技术信息中心(NCBI)建立和维护的。数据直接来源于测序工作者提交的序列;由测序中心提交的大量EST序列和其它测序数据;以及与其它数据机构协作交换数据而来。Genbank每天都会与欧洲分子生物学实验室(EMBL)的数据库,和日本的DNA数据库(DDBJ)交换数据,使这三个数据库的数据同步。NCBI的网址是:。Entrez的网址是:/entrez/。3、EMBL核酸序列数据库EMBL核酸序列数据库由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成,由于与Genbank和DDBJ的数据合作交换,它也是一个全面的核酸序列数据库。该数据库由Oracal数据库系统管理维护,查询检索可以通过因特网上的序列提取系统(SRS)服务完成。数据库网址是:http://www.ebi.ac.uk/embl/。SRS的网址是:http://srs.ebi.ac.uk/。4、DDBJ数据库日本DNA数据仓库(DDBJ)也是一个全面的核酸序列数据库,与Genbank和EMBL核酸库合作交换数据。可以使用其主页上提供的SRS工具进行数据检索和序列分析。可以用Sequin软件向该数据库提交序列。DDBJ的网址是:http://www.ddbj.nig.ac.jp/。5、GDB基因组数据库(GDB)为人类基因组计划(HGP)保存和处理基因组图谱数据。GDB的网址是:。GDB的国内镜像是:/gdb/。6、蛋白质数据库1)、PDB(Proteindatabank)PDB数据库网址是:/pdb/。2)、SCOP(Prosite)SCOP的网址是:http://scop.mrc-lmb.cam.ac.uk/scop/。3)、Prodom是一个能自动产生蛋白质结构域家族的数据库。网址:http://protein.toulouse.inra.fr/prodom/doc/prodom.html7、蛋白质组数据库COG蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。COG库的网址是:/COG。8、功能数据库1)、KEGG网址:http://www.genome.ad.jp/kegg/。2)、DIP网址:/。3)、ASDB网址:/asdb。4)、TRRD网址:http://wwwmgs.bionet.nsc.ru/mgs/dbases/trrd4/。5)、TRANSFAC网址:http://transfac.gbf.de/TRANSFAC/。除了以上提及的数据之外,还有许许多多的专门生物信息数据库,涉及了目前生物学研究的各个层面和领域,由于篇幅所限无法一一详述。国内也有一些大数据库的镜像站点和自己开发的有特色的数据库,如欧洲分子生物学网络组织EMBNet中国节点北京大学分子生物信息镜像系统,上海博容基因公司与上海嘉瑞软件公司合作开发的国产汉化基因数据库及分析管理系统,同时国家级的生物信息学中心也在筹建之中。我们期待国内能有更多高质量和使用便利的数据库资源,推动我国生物信息学和整个生命科学的发展。清华大学生物信息学研究所网址:北京大学生物信息镜像系统网址:练习:结合自己所选的毕业设计课题或自己感兴趣的课题,检索10篇外文文献和10篇中文文献。
练习作业1.由某人工幼龄林中,随机抽取500株林木组成样本,得其胸径资料如下表(单位:cm)试求样本在胸径标志上的平均数,样本标准差及样本变异系数。胸径(cm)2.83.03.84.04.85.05.2频数415204763788869593510842.对某种苗重复抽得100株,测量苗高资料如下(单位:cm):127,118,121,113,145,125,87,94,118,111,102,72,113,76,101,134,107,118,114,128,118,114,117,120,128,94,124,87,88,105,115,134,89,141,114,119,150,107,126,95,137,108,129,136,98,121,91,111,134,123,138,104,107,121,94,126,108,114,103,129,103,127,93,86,113,97,122,86,94,118,109,84,117,112,125,94,79,93,112,94,102,108,158,89,127,115,112,94,118,114,88,111,111,104,101,129,144,128,131,142。将样本资料分组整理,列出频率分布表,绘出样本频率分布图。3.做药剂防治棉铃虫试验,使用药剂A,共查600头虫,得死虫552头,活虫48头;使用药剂B,共查400头虫,得死虫376头,活虫24头。检验两种杀虫剂是否同质(效果是否一致)?4.对玉米的4个不同品种进行产量对比试验,假设试验各小区其他条件相同,得下表(单位:kg),问玉米的不同品种产量间有无显著差异?若显著再用LSD方法作多重比较。(α=0.01)品种小区(重复)12345A147.545.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年太阳能电池生产专用设备项目建议书
- 2025年汽车车速传感器项目合作计划书
- 2025年应急救生系统项目建议书
- 贵州省黔东南苗族侗族自治州2024-2025学年高一上学期1月期末考试 语文 含解析
- 2025年新型分子筛系列产品项目建议书
- 客户服务层次化响应体系构建
- 娱乐行业演出安全协议书
- Rebaudioside-E-Standard-生命科学试剂-MCE
- 伊索寓言小动物的故事解读
- 监控采购安装合同
- 硫酸分公司30万吨硫磺制酸试车方案
- 高压氧科工作总结高压氧科个人年终总结.doc
- 电子电路基础习题解答
- 《政治学概论》教学大纲
- 食品生物化学习题谢达平(动态)
- 保安员工入职登记表
- 断路器控制回路超详细讲解
- 签证户口本完整翻译模板
- 睿达RDCAM激光雕刻切割软件V5.0操作说明书
- 变电设备运行与维护培训课件(共102页).ppt
- 机械设计基础平面连杆机构课件
评论
0/150
提交评论