Stata实验指导、统计分析与应用chap05_第1页
Stata实验指导、统计分析与应用chap05_第2页
Stata实验指导、统计分析与应用chap05_第3页
Stata实验指导、统计分析与应用chap05_第4页
Stata实验指导、统计分析与应用chap05_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主要内容:1、单个总体的假设检验2、两个总体的假设检验实验5.1单个总体的假设检验一、实验基本原理一、实验基本原理二、实验数据和实验内容二、实验数据和实验内容实验数据来源于某砖厂的生产车间对砖的抗断强度的测量,完整的数据在本书附带光盘的data文件夹的“brick.dta”工作文件中。利用此数据进行假设检验分析,分析一下其总体均值是否为32.5。利用此数据进行假设检验分析,分析一下其总体标准差是否为1.1。三、实验操作指导三、实验操作指导1.正态分布、方差已知的均值检验正态分布、方差已知的均值检验在这种情形下,由于Stata没有提供直接的命令进行检验,所以需要用户自行构建正态分布的统计量进行检

2、验,命令语句为:quietly summarize scalar crit=invnormal(1-0.05/2)scalar p=(1-normal(abs(z)/2scalar list z crit p在这一组命令语句中,第一个命令语句是为了求出样本的均值的大小,并且不显示计算的结果;第二个命令语句是输入了正态分布统计量的计算公式,目的是为了算出正态分布统计量的大小;第三个命令语句是为了求出置信度为95%的正太分布临界值的大小;第四个命令语句输入了p值的计算公式,是为了求出p值的大小;第五个命令语句是为了列出这些统计量的大小,以便进行判断。例如,根据长期经验和观测,某砖厂砖的抗断强度服从

3、正态分布,方差为1.21,从中随机抽取六块的数据存储在数据文件brick.dta中,分析一下这批砖抗断强度的均值是否为32.5。进行这个分析所用到的命令语句为:quietly summarize scalar z=(r(mean)-32.5)/(1.1/sqrt(6)scalar crit=invnormal(1-0.05/2)scalar p=(1-normal(abs(z)/2scalar list z crit p其实这组命令就是将假设均值32.5,标准差1.1和样本容量6填入所对应的位置即可得到如图5.1所示的结果。2.正态分布、方差未知的均值检验正态分布、方差未知的均值检验当正态分布

4、、方差未知时进行均值的检验,应该使用t统计量,Stata中有相应的命令进行检验,具体命令语句如下:ttest varname = # if in , level(#)在这个命令语句中,ttest是进行t检验的命令语句,varname = #用来设置某一变量的均值的检验,if是条件语句,in是范围语句,level(#)用来设置置信水平。有时候t检验也能用到如下命令语句:ttesti #obs #mean #sd #val , level(#)这个命令语句是在缺失样本的具体数据,只通过样本的统计指标进行t检验,其中ttesti是进行检验的命令语句,#obs用来指明样本容量,#mean用来指明样本均

5、值,#sd用来指明样本标准差,#val用来进行检验的均值的设定,level(#)用来指明置信度。例如,在检验砖的抗断强度的例子中,假设并不知道方差为1.21,而进行检验其均值为32.5,这时就需要用到ttest命令了,具体命令如下:ttest kdqd=32.5这时就可以得到如图5.2所示的检验结果,在结果图中,可以看到表格中显示了样本的特性,主要包括样本容量、样本均值、标准误差、标准差、置信区间。表格下面是进行的t检验的内容,其中最重的的指标是“Ha: mean != 32.5”的部分,不难发现检验得到的p值为0.0302,所以应当拒绝原假设,即不能认为这批砖的平均抗断强度为32.5。假如,

6、并不知道这些样本的具体数值,只知道以下信息:有6个样本,样本均值时31.13,样本标准差为1.12,依据这些信息检验总体均值是否为32.5。这时就需要使用ttesti命令了,具体命令语句如下:ttesti 6 31.13 1.12 32.5在这个命令语句中,在ttesti之后,依次输入代表样本容量、样本均值、样本标准差、待检验均值的数字6、31.13、1.12、32.5即可,这时将会得到如图5.3所示的结果图,根据这个图形,我们也可以拒绝原假设。3.期望未知、检验方差期望未知、检验方差方差检验一般只提供实验原理中所述的第三种情况的检验,并且方差检验所要检验的实际值为标准差而不是方差,所使用到的

7、命令语句为:sdtest varname = # if in , level(#)在这个命令语句中,sdtest是进行标准差检验的命令语句,varname = #是将所要检验的变量的标准差的数值填入,if是条件语句,in是范围语句,level(#)用来设置置信水平。如果不知道样本的具体数值,只有相关统计量,也可以进行标准差的检验,所使用到的命令语句如下:sdtesti #obs #mean | . #sd #val , level(#)在这个命令语句中,sdtesti是进行标准差检验的命令语句,#obs代表样本容量,#mean | .代表样本均值,若未知以“.”代替,#sd代表样本标准差,#v

8、al代表将要检验的标准差,level(#)代表置信度。例如,在brick.dta数据中,如果根据样本数据检验总体标准差是否为1.1。这时所使用到的命令语句为:sdtest kdqd=1.1执行命令后,将会得到如图5.4所示的结果图,标准差检验的结果图与均值检验的结果图结构基本一致,从检验结果可以看到原假设“sd != 1.1”的检验p值为0.7823,即不能拒绝原假设,可以接受原假设,认为总体的标准差为1.1。如果在检验中并没有brick.dta数据库,只知道样本的容量为6,样本均值为31.13,样本标准差为1.12,以这些样本特征值来检验总体方差为1.1。进行这项检验所使用到的命令语句为:s

9、dtesti 6 31.13 1.12 1.1在这个命令语句中,在sdtesti之后,依次输入代表样本容量、样本均值、样本标准差、待检验标准差的数字6、31.13、1.12、1.1即可,这时将会得到如图5.5所示的结果图,根据这个图形,我们也可以接受原假设。实验5.2两个总体的假设检验一、实验基本原理一、实验基本原理二、实验数据和实验内容二、实验数据和实验内容实验数据来源于某学校对两个班的某次英语成绩的记录,其中score1代表一班的英语成绩,score2代表二班的英语成绩。完整的数据在本书附带光盘的data文件夹的“english.dta”工作文件中。利用english数据,进行两个正态总体

10、的方差和均值检验,检验两个班英语成绩的方差和均值是否相等。三、实验操作指导三、实验操作指导1.两个正态总体的方差检验两个正态总体的方差检验两个正态总体方差检验的命令与单个正态总体方差检验的命令较为相似,都是sdtest命令,具体格式有以下三种:(1)两个样本方差检验的命令为:sdtest varname1 = varname2 if in , level(#)(2)两组样本方差检验的命令为:sdtest varname if in , by(groupvar) level(#)(3)仅利用样本特征值进行方差检验的命令为:sdtesti #obs1 #mean1 | . #sd1 #obs2 #

11、mean2 | . #sd2 , level(#)这些命令的具体解释与一个正态总体的基本一致,这里不再赘述。例如,利用english.dta数据库中的数据,分析两个班的英语成绩方差是否相等,所使用到的命令为:sdtest score1=score2执行这一命令,可得到如图5.6所示的结果,这个图中的表格展示了数据的情况,包括两个变量及其总体的样本容量、均值、标准误、标准差、置信区间的信息。在表格的下方展示了方差检验的结果,从中不难看出,检验的p值为0.3362,不能拒绝原假设,即认为两个班英语成绩的方差相等。2.两个正态总体的均值检验两个正态总体的均值检验两个正态总体均值检验的命令与单个正态总

12、体均值检验的命令较为相似,都是ttest命令,具体格式有以下四种:(1)非配对样本的均值检验命令为:ttest varname1 = varname2 if in, unpaired unequal welch level(#)(2)配对样本的均值检验命令为:ttest varname1 = varname2 if in , level(#)(3)分组的均值检验命令为:ttest varname if in , by(groupvar) options(4)仅利用样本特征值进行均值检验的命令为:ttesti #obs1 #mean1 #sd1 #obs2 #mean2 #sd2 , optio

13、ns这些命令的具体解释与一个正态总体的基本一致,这里不再赘述,需要解释的有两点:一是所谓配对样本数据是指对同一部分样本进行追踪调查所取得的数据,二是这些命令的options选项的具体内容在表5.1中。例如,利用english.dta数据库中的数据,分析两个班的英语成绩均值是否相等,所使用到的命令为:ttest score1=score2, unpaired因为这是两个班的英语成绩,并不是对一个班英语成绩的追踪记录,所以是非配对数据,应当使用unpaired选项,执行的结果如图5.7所示。这个图中的表格展示了数据的情况,包括两个变量、二者总体和二者之差的样本容量、均值、标准误、标准差、置信区间的信息。在表格的下方展示了均值检验的结果,从中不难看出,检验的p值为0.5721,不能拒绝原假设,即认为两个班英语成绩的均值相等。习题1.利用usaauto.dta数据库中的数据,检验变量price的均值是否为6300。2.利用usaau

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论