版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章统计量与假设检验 案例 1 序列的描述性统计量用 Eviews 软件对工作文件htwtl.wfl中序列 X(身高)的完成以下任务:1、计算描述性统计量;2、绘制直方图;3、在显著性水平 0.05 下,判断是否服从正态分布。 分析1、相关概念与公式直方图显示了序列中数据的频数分布, 它将序列的范围 (最大值与最小值之间的距离)按相等的组距进行划分,并显示落入每一组距中的观测值的个数。常用的描述性统计量主要包括:均值、中位数、最大值、最小值、标准差、偏度与峰度。 均值( Mean)x1 x2xnxn 中位数( Median)当把序列按从小到大的顺序排列时, 序列的中间值 (当序列有奇数项时)
2、 或两个中间值的平均数(当序列有偶数项时)为该序列的中位数。 最大值( Maximum)与最小值 (Minimum) 标准差( Std.Dev. )1ns( xi x)2n1 i 1这里 s 为样本标准差( sample standard deviation ),是变量(总体)标准差的无偏估计,函数命令为 stdev(x,s) 。 偏度(Skewness) 衡量序列分布围绕其均值的非对称性。S1 n( xix ) 3n i 1s (n 1) n , 是 变 量 标 准 差 的 有 偏 估 计 , 函 数 命 令 为这 里 ,stdevp(x,s)(population standard dev
3、iation)。如果序列的分布是对称的, S 值为 0。正的 S 值意味着序列分布有长的右拖尾,负的S 值意味着序列分布有长的左拖尾。 峰度( Kurtosis ) 度量序列分布的凸起或平坦程度,计算公式如下K1n( xix) 4n i1正态分布的 K 值为 3。如果 K 值大于 3,分布的凸起程度大于正态分布;如果 K 值小于 3,序列分布相对于正态分布是平坦的。 JB 统计量用来检验序列是否服从正态分布,统计量的计算由下式给出:JBn k S21(K 3)2 2 (2)64对于一个正常的序列, k 值取零;如果该序列是某一回归方程的残差序列,则 k 是解释变量的个数。在原假设( 该序列服从
4、正态分布 )成立的条件下, JB 统计量服从自由度为 2 的卡方分布。2、Eviews 的相关操作 打开工作文件 htwtl.wfl,打开序列 X; 在序列 X 窗口的工具栏中选择 View/Descriptive Statistics & Tests/ Histogram and Stats, 将生成如下图形:图 2.1序列的直方图与描述性统计量从图 2.1 可以看出, JB 统计量的值为 0.292922 ,概率值为 0.863759 ,两者之间的关系可通过下述命令解释 ( 见第一章表 1.2)scalar p=chisq(0.292922,2)则在Eviews窗口左下角的状态栏显示sca
5、lar p=0.863759。上述概率值 0.863759 表示自由度为2 的卡方统计量大于0.292922值。因为 0.863759 0.05 (单侧检验),所以不能拒绝原假设,即认为序列的概率x 服从正态分布。 案例 2 组的描述性统计量用 Eviews 软件对工作文件htwtl.wfl中组 GROUP01完成以下任务:1、计算序列 X, Y 的描述性统计量;2、求序列 X,Y 的方差、协方差和相关系数。 分析用 x , y , xy2 分别表示 X,Y 的标准差和协方差, r 表示 X,Y 的皮尔逊相关系数,则x( x x) 2ny1( yy) 2nr2xy2xyxy1x)( yy)(
6、xn( x x)( yy)( xx)2( y y)21、计算序列 X, Y 的描述性统计量 打开工作文件 htwtl.wfl,建立包含序列X,Y 的组对象 GROUP01; 打开组对象 GROUP01,在组窗口的工具栏中选择 View/Descriptive Stats/ commonsample, 则出现以下图 2.2 窗口,图中显示了序列 X,Y 的描述性统计量。图 2.2组对象的描述性统计量2、求序列 X,Y 的方差、协方差和相关系数在组窗口的工具栏中选择View/CovarianceAnalysis,在随后出现的对话框中选择 Covariance 和 correlation,点击 OK
7、,则出现图 2.3 窗口。图 2.3 序列间的协方差和相关系数图 2.3 中的对角线是 X,Y 的方差,左下角是 X,Y 的协方差和相关系数。从图 2.3 可知 X,Y 之间的相关系数为 0.862045 0.8 ,属于高度相关。这一点也可通过散点图获得, 如图 2.4 所示,散点图在观察两个变量相关性方面具有直观的优点,但无法从数量上把握两个变量之间的线性相关程度。210200190180Y17016015014013046810121416X图 2.4 x与 y 之间的散点图 案例 3单总体假设检验1、单总体均值的假设检验某糖厂用自动打包机装糖,每包糖的重量均服从正态分布,其标准重量为10
8、0 千克 , 某日开工后测得9 包重量如下 :93.3, 98.7, 100.5, 101.2, 98.3, 99.7, 99.5, 102.1, 100.5 当显著性水平0.05时, 判断该日打包机工作是否正常? 求平均每包糖重量置信系数为0.95 的置信区间,该区间是否包括100?你能由此得出什么结论? 分析 假设检验建立假设H0:0 ,H1:0构造小样本统计量TXH 01)0 t (ns.d.n在显著性水平为时,接受域为t 2 (n1), t2 ( n1) , 从而拒绝域为, t2 ( n1 )t2 ( n 1 ),对本例而言 , 已知样本容量n=9 为小样本,样本均值 x =99.31
9、11 ,样本标准差s.d.=2.546784,99.31111100t9=-0.81148 -2.31=- t0.025 (8) , 落入接受域内,2.546784接受原假设,认为当显著性水平0.05 时, 该日打包机工作正常。Eviews 的操作步骤建立工作文件 test.wfl,文件页为 case3-1,建立序列 X;打开序列 X,在序列 X 窗口的工具栏中选择 View/Descriptive Statistics &Tests/Simple HypothesisTests , 出现图 2.5, 在 mean后填入 100,点击 OK,则出现图 2.6 。图 2.5单总体均值的假设检验设
10、定窗口图 2.6单总体均值假设的T 检验结果从图 2.6 可知 t 统计量的值为 -0.811481 ,与上面分析中的计算结果一致;可以用两种方法判断原假设是否成立方法一, scalar s1=qtdist(0.025,obs(x)-1)=-2.31 , -0.811481 大于 -2.31 ,t 统计量落入接受域内,故原假设成立。或者 scalars1=qtdist(0.975,obs(x)-1)=?方法二, scalar s2=tdist(-0.811481, obs(x)-1)=0.4406,0.4406大于0.025 ,故不能否定原假设。注:若总体标准差已知,则把样本标准差s.d. 换
11、成,相应的 T 统计量成为 Z 统计量, Z 服从标准正态分布。比如,对于本例若已知总体标准差=2.3 ,则在图 2.5 选项“ Enter s.d. if knowm”中填入 2.3 ,其它操作不变,点击 OK,则出现图 2.7 ,从图 2.7 得出与图 2.6 相同的结论,即不能否定原假设。图 2.7 单总体均值假设的Z 检验结果 为求置信区间,构造变量X t (n1)s.d .nXt2 (n 1) 1,或者所以, P( t 2 ( n 1)s.d . /nP( Xt2 (n1)s.d .Xt 2 (n1)s.d.) 1nn所以,的置信系数为 1的置信区间为 Xt2 (n1)s.d. ,
12、X t 2 ( n 1) s.d. nnEviews 的操作步骤打开工作文件test.wfl的文件页 case3-1 ;计算置信区间的上界,在命令窗口输入scalar CI_X_HIGH=mean(x)+qtdist(0.975,obs(x)-1)*(stdev(x)/(obs(x).5),并回车,双击工作文件窗口中的图标CI_X_HIGH ,可以看到在屏幕左下角的状态栏出现 scalar CI_X_HIGH=101.268742947 。计算置信区间的下界,在命令窗口输入scalar CI_X_LOW=mean(x)-qtdist(0.975,obs(x)-1)*(stdev(x)/(obs
13、(x).5),并回车,双击工作文件窗口中的图标 CI_X_LOW,可以看到在屏幕左下角的状态栏出现 scalar CI_X_LOW =97.3534792752 。所以,平均每包糖重量置信系数为0.95 的置信区间为 97.3534792752 ,101.268742947 ,该区间包含 100。由此可见 0.95 的置信区间就是显著性水平为 0.05 的接受域, 100 落入了接受域内,故不能否定原假设。2、单总体方差的假设检验某车间生产钢丝, 生产过程一向比较稳定, 今从产品中随机抽取10 根,测得折断力数据如下:578,572 ,570 ,568 ,572, 570, 570,572,
14、596, 584已知折断力X 服从正态分布,问折断力方差2=64 是否可信(取显著性水平0.05 ) 分析根据已知,样本容量n=10, 样本方差 S2 =75.7建立假设: H:264,H :264012( n1) S2H0构造统计量:2( n1)2在显著性水平为时,接受域为212 (n1),22 ( n 1) , 从而拒绝域为0, 212 (n1)22 (n 1),对本例而言,20.975 (9)2.70, 20.025 (9)19.02(101)75.710.65(2.70,19.0) ,即落入接受域内,认为折断力总体的方差64与 64 无显著性差异。卡方检验的 Eviews 操作如下打开
15、工作文件 test.wfl, 新建文件页为 case3-2, 建立序列 Y;打开序列 Y,在序列 Y 窗口的工具栏中选择 View/Descriptive Statistics &Tests/Simple Hypothesis Tests , 出现图 2.7, 在 Variance 后填入 64,点击 OK,则出现图 2.8 。图 2.7单总体方差的假设检验设定窗口图 2.8单总体方差的假设检验结果从图 2.8 可知卡方统计量的值为 10.65 ,与上面分析中的计算结果一致;概率值为 0.3005 大于 0.025 ,故不能否定原假设。 案例 4 两总体均值差异的显著性检验国家统计调查队在两个
16、地区分别调查了 10 个家庭的收入(单位:人民币元),数据见工作文件。 根据历史资料知两地区家庭收入的方差相同。 给定显著性水平0.05 ,检验该两地区家庭的平均收入有无显著性差异? 分析建立假设: H:120,H:12001构造统计量:因为本例数据属于小样本,且总体方差未知,所以应该使用t统计量:( XY )(12 )H 0T t ( n1 n 2 2)( n1 1) S121)S22( n22( 11 )n1n 2n1n2在显著性水平为时,接受域为t2 (n1 n2 1),t2 (n1n2 1) , 从而拒绝域为, t 2(n1 n2 1)t 2 (n1 n2 1),对于本例 x 1514
17、4.09, y 16820 .91, s14401.44 ,s25437.44t15144 .0916820 .910.75801)( 4401.44) 21)( 5437 .44 ) 2(10(10( 11 )101021010t=-0.7580 -2.10=-t0.025 (18),所以接受原假设,即认为两地区家庭收入的均值没有显著性差异。Eviews 的操作步骤打开工作文件test.wfl,新建文件页为 case4, 建立序列对象 X,Y,建立包含序列 X,Y 的组对象GROUP01,并输入数据;打开组对象GROUP01,在组窗口的工具栏中选择View/Tests of Equality
18、,出现图 2.9 窗口;在图 2.9 窗口选择 mean,点击 OK,出现 2.10 窗口。图 2.9两总体均值的假设检验设定窗口图 2.10两总体均值的假设检验结果从图 2.10 方法( Method)一栏中,可以看出 t 统计量的值为 -0.757987 ,概率值为 0.4583 大于 0.025 ,故接受原假设。注意,因为两总体均值差异的显著性检验就是单因素多水平均值方差分析退化成两个水平情形,所以输出结果的中间部分也给出了方差分析( Analysis of Variance )的结果。 案例 5单因素方差分析某饮料公司生产出一种新型饮料,该饮料瓶的包装颜色共有红、橙、黄、绿四种,各种瓶
19、中装的是同一饮料,其他因素都相同。现随机从规模大致相同的5家超市收集了前一期的销售资料,如下表所示, 运用方差分析的理论, 说明饮料的颜色对销售量有没有显著影响。 (取显著性水平0.05 )表 2.1某种饮料在5 家超市的销售量资料表单位:箱超市序号红色橙色黄色绿色126.531.227.930.8228.728.325.129.6325.130.828.532.4429.127.924.231.7527.229.626.532.8 分析在研究中如果同时有多个子总体时, 应用 t 检验需要两两加以比较, 显得十分繁琐,并且信息没有得到充分利用。 因此,我们往往应用综合性更强的方差分析( Ana
20、lysis of Variances, 简略表示为 ANOVA)方法取而代之。方差分析的思路为, 将来自各子总体抽样样本汇合在一起, 先假设它们来自一个总体(即假设无差异),然后将这个汇合样本的总变动 (用离差平方和表示)分解为两部分,一部分是组内变动( within ),代表本组内各案例值关于组平均值的分布离散程度。 另一部分是组间变动 (between),代表各组平均值关于总平均值的分布离散程度。 将这两部分变动各自除以它们对应的自由度, 即得到均方差。组间变动均方差除以组内变动均方差以后的统计量服从 F 分布。于是我们可以根据统计值对应的显著性水平决定接受或拒绝无差异的原假设。对于本案例
21、,首先建立假设0yellow1,orange,yellow,green 不全相等H: redorangegreen , H:redEviews 的操作步骤打开工作文件test.wfl,新建文件页为ANOVA,建立序列对象RED,ORANGE,YELLOW,GREEN,建立包含序列 RED,ORANGE,YELLOW,GREEN的组对象 GROUP01,并输入数据;打开组对象GROUP01,在组窗口的工具栏中选择View/Tests of Equality,出现和图 2.9 相同的窗口;在出现的窗口中选择mean,点击OK,出现2.11 窗口。图 2.11单因素方差分析从图 2.11 得知, A
22、NOVA F-test 的值为 10.48620 ,相应的概率值为 0.0005 小于 0.05 ,故拒绝原假设,认为饮料颜色对销售量有高度显著的影响。 作业 用 Eviews 软件解决以下问题1、某种沐浴用肥皂制造程序的设计规格中要求每批平均生产120 块肥皂,高于或低于该数量标准则被认为是不合理的。现由 10 批产品所组成的一个样本中,每批肥皂的产量如下:108, 118, 120,122,119, 113,124,122,120, 123在 0.05 的显著性水平下,检验该样本结果能否说明制造过程运行良好?2、某大学管理学院考虑专业设置情况,现已知会计专业与财务专业皆为市场所需求,但似乎
23、会计专业的毕业生年薪高于财务专业。现在某地区随机抽取会计与财务专业的毕业生各11 名调查其参加工作第一年的年薪情况,数据见表2.2 ,试在 0.05 的显著性水平下,判断会计专业毕业生的年薪是否与财务专业毕业生年薪下相同?表 2.2某大学对某地区会计与财务专业的毕业生第一年年薪情况调查表单位万元会计财务5.645.065.245.585.405.245.624.945.045.845.945.264.725.004.605.584.905.805.484.705.385.243、某调查公司调查了市场专业人员的公司伦理价值观,调查结果间表2.3 ,高分值表示伦理价值观念程度高。表 2.3某公司市
24、场专业人员公司伦理价值观调查资料市场专业人员市场管理人员市场研究人员广告人员656分值557446545656446在 0.05 的显著性水平下,检验 3 个专业人员群体之间的伦理价值观念有无显著差异。4、已知班同学身高与体重的数据如表2.4 所示。表 2.4班同学身高与体重序身高体重号( Height )( Weight )1169502170603168544170665163526172507162488165559175521017575111705512162551317560141645815172601617555171807018170851916048201625121169482215745
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 石油化工行业保安工作计划
- ABB机器人基础培训课件
- 消防安全宣传日培训模板18
- 中医学模拟试题与答案
- 二年级数学上册加减混合运算课件
- 中学岗位职责
- 语文开学第一课
- 幼师基本乐理知识培训
- 幼儿园后勤厨房管理培训
- 中医专科护士培训结业汇报
- 电视摄像PPT教案
- 家装业务培训(共60页).ppt
- 消防器材知识讲解(课堂PPT)
- 英语教学中让学生当“小老师”的尝试-精选教育文档
- 机械密封工作原理演示版
- 血气分析全解ppt课件
- 二年级 Thelifeofabutterfly蝴蝶的生长过程
- 入网申请表模板
- 48个国际音标对应的字母组合及例词(WORD可打印版)
- 安装工程质量通病及消除通病措施(安八)
- 标化工地安全文明施工管理细则
评论
0/150
提交评论