第五章 置信区间_第1页
第五章 置信区间_第2页
第五章 置信区间_第3页
第五章 置信区间_第4页
第五章 置信区间_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 置信区间5-28、2003年,在一项对高校扩招的态度调查中,10所北京市院校对高校扩招的态度数据如下表(分数越高态度越积极):院校名态度平均值标准差人数北京外国语学院中国人民公安大学中国青年政治学院北京农学院北京大学清华大学北方交通大学北京航空航天大学对外经济贸易大学北京医学院3.814.324.083.983.583.784.264.123.884.070.670.550.680.650.640.710.660.740.570.6348505250504950424844求:1 中国人民公安大学、清华大学、北京大学的总体平均态度分的95置信区间;2 中国人民公安大学和北京大学的总体平

2、均态度分之差的95置信区间;3 清华大学和北京大学的总体平均态度分之差的95置信区间。(提示:要先从S求得 解:(1)因为表中样本数都大于30,所以认为样本均值的抽样分布服从正态分布。N(u,),用s近似代替,根据样本数据的样本均值和标准差:置信水平1-=95%,查标准正态分布表=1.96中国人民公安大学总体态度分的95置信区间为(x1-* , x1+* ),将表中数据代入(4.32-1.96*,4.32+1.96*)=(4.17,4.47)清华大学总体态度分的95置信区间为(x2-* , x2+* ),同理计算求得(3.58,3.98)。北京大学总体态度分的95置信区间为(x3-* , x2

3、+* ),同理计算求得(3.40,3.76)。(2)两个样本都为大样本,所以根据抽样分布的知识可知,两样本均值之差(-)的抽样分布服从(u1- u2)、方差为(+)的正态分布。中国人民公安大学和北京大学的总体平均态度分之差的95置信区间为(-)-*,(-)+*。用样本方差代替总体方差。所以求得两者总体均值方差的置信区间(0.51,0.97)。(3)同(2),可以求得清华大学和北京大学的总体平均态度分之差的95置信区间为(-0.066,0.466)。 第六章 假设检验6-6、从死于汽车碰撞事故的司机中抽取2000名司机的随机样本,根据他们的血液中是否含有酒精以及他们是否对事故负有责任,

4、将数据整理如下表所示。在整个总体中,血液中含有酒精和不含酒精的司机之间在对事故负有责任方面有差异吗?为了回答这一问题:1 叙述并计算概值;2 计算适当的置信区间(95来说明差异有多大;3 从这一数据如何说明“酒精增加了事故的发生率”。 解:设 为含酒精中有责任的概率,无酒精中有责任的概率。提出假设:血液中含酒精和不含酒精的司机之间对事故富有的责任无差异。即= :。依据样本数据:=650/(650+150=13/16 =700/(700+500=7/12构造统计量:P=- 又因为N(,),N(,)所以- N(-,+) 记+为-的95%的置信区间为(-*s,-+*s)=(0.19,0.2

5、7)。不包括0 ,所以拒绝零假设。可见含酒精的对事故负责任的概率远大于不含酒精的。即酒精增加了事故的而发生率。有酒精吗有责任吗有无有650150无7005006-9、1974年,美国盖洛普公司的一次调查表明,在750名美国男子的样本中,有45抽烟;在另一个相互独立的750名女子的样本中,36抽烟,1 构造男性总体和女性总体中抽烟比例之差的95单侧置信区间;2 计算没有差异这一原假设的概值;3 在错误水平 =005下,45与36之差在统计上是可以分辨的吗?(或是显著的吗?即,能拒绝吗?用两种方式回答,并说明两种答案是一致的:1 是否没有落入95的置信区间之内?2 对的概值是否小于0.05?

6、60;解:设男性抽烟比例为,女性抽烟比例为。构造统计量:P=- 又因为N(,),N(,)所以- N(-,+)记+为P(<=1-,所以-的95单侧置信区间为(0,-+(2): = 在此条件下N(0,1。Z= (1.452=0.927。所以没有差异这一原假设的概率为0.927。(3 在错误水平=005下,45与36之差在统计上是不可以分辨。即不能拒绝。从以下角度来分析:1 因为-=9%,落在95%的置信区间。所以不能拒绝原假设。2由(2)可知拒绝出错的概率为0.073,大于0.05,所以不能拒绝原假设。第七章 回归分析7-7、假定一个4家庭的随机样本的年收入和年节余如下表所示(单位:千元:1

7、 估计总体回归直线家庭编号收入X节余Y12344.87.28.59.51.23.03.53.52 构造斜率的95置信区间;3 作图画出4个样本点和拟合的直线,然后尽你所能在图中表示由2)的置信区间所给出的可接受的斜率(范围。解:(1 方法1因为,=(4.8+7.2+8.5+9.5/4=7.5 =(1.2+3.0+3.5+3.5/4=2.8 记=-,=-所以=0.513732(代入数值计算过程略), -*= -1.052989即估计总体回归方程为:Y=-1.052989+0.513732X.方法2 :直接在Eviews中求解(OLS)VariableCoefficientStd. Errort-

8、StatisticProb.X0.5137320.1123744.5716370.0447C-1.0529890.865679-1.2163730.3479R-squared0.912663Mean dependent var2.800000Adjusted R-squared0.868995S.D. dependent var1.092398S.E. of regression0.395389Akaike info criterion1.288962Sum squared resid0.312666Schwarz criterion0.982109Log likelihood-0.57792

9、3F-statistic20.89987Durbin-Watson stat1.962585Prob(F-statistic0.044666即估计总体回归方程为:Y=-1.052989+0.513732X.说明结果一致。(2 =-=0.156333。(n =4)Se(=0.11237。所以的95置信区间为(-* Se(,+* Se(,)=(0.0304,1.0027)(自由度为2)(3)在Eviews中作X-Y 图如下:7-11、从某单位随机地抽取了相互独立的两个样本(男、女职工收入,其月收入数据如下:男:2300,2500,3000,2800,2600; 女:2400,2200,2000,2

10、500,2700用表示收入,用哑变量表示性别:其中对于男性 =1,对于女性 =0。1 画出对的图形;2 用眼睛拟合一条对的回归线;3 计算对的回归线;与2中用眼睛拟合的相比,后者的精度如何?4 构造一个斜率为95的置信区间,用简单的语言解释一下它的意义;5 在 5的错误水平下,检验收入是否与性别无关;6 4和5的结果是否度量了该单位对女性的歧视? 解:(1)在Eviews中作X-Y 图如下:(2)由上图用眼睛拟合拟合一条对的回归线:Y=2390+200X(3 利用Eviews 进行回归:VariableCoefficientStd. Errort-StatisticProb.X280

11、.0000170.88011.6385760.1399C2360.000120.830519.531500.0000R-squared0.251282Mean dependent var2500.000Adjusted R-squared0.157692S.D. dependent var294.3920S.E. of regression270.1851Akaike info criterion14.21295Sum squared resid584000.0Schwarz criterion14.27347Log likelihood-69.06474F-statistic2.684932

12、Durbin-Watson stat1.278082Prob(F-statistic0.139935即回归方程为:Y=2380+280X与(2)中直观看到的:我们发现在斜率差距较大。(4)依据Sum squared resid584000.0即=584000.0 所以=73000(n=10)Se(=170.88(易知=10*0.25=2.5所以的95置信区间为(-* Se(,+* Se(这一区间包括零,说明不能拒绝零假设。即认为男女性别对工资多少没有影响。(5)因为F-statistic2.684932Prob(F-statistic0.139935所以在在 5的错误水平下,不能拒绝零假设。即

13、认为性别与收入无关。(6)4和5的结果都认为性别与收入无关,所以没有度量了该单位对女性的歧视。第八章 方差分析8-4、1977年,美国的某项调查从三种受过不同教育类型的妇女中各分别抽取了50位全日制工作的妇女样本,她们的年收入(单位:千美元)数据整理后归纳如下:完成的学历年数收入平均值初中(8年)高中(12年)大学(16年)7.89.714.0183524424707解: = :三组收入均值有显著差异F = ,即组间均方/组内均方其中,组间自由度=3-1=2,组内自由度=(50-13=147由于样本均值=(7.8+9.7+14.0/3=10.5所以组间偏差平方和=50=50*(+=1009组内

14、偏差平方和=1835+2442+4707=8984所以,F = 8.2548419 > (2,147=3.07拒绝原假设;认为不同学历的妇女收入存在差异。8-9、月收入数据:男:2500,2550,2050,2300,1900女:2200,2300,1900,2000,1800如果用Y表示收入,哑变量X表示性别(X=1为女性),计算Y对X的回归方程,并在5的水平下检验收入是否与性别无关(先求回归系数的置信区间)。解:令Y=+X+根据最小二乘法,可知= (1VAR(= (2= (3计算如下:收入与性别无关收入与性别不完全无关Y25002550205023001900220023001900

15、20001800X0000011111240290-21040-360160260-140-40-240=2150=0.5根据公式1,得=-220;,即Y=-220X+根据公式2、3,得VAR(=156.3549577n=10.,n-2=8;当df=8时,=2.306的0.05置信区间求解方法如下:-2.036<=<=2.306,得140.57769.由于原假设=0落入了这个置信区间,所以接受原假设,认为系数不显著,收入与性别无关。第九章 相关分析9-1、10对夫妇的一个随机样本给出了如下的结婚年龄数据结婚时丈夫的年龄24 22 26 20 23 21 24 25 22 23 结婚

16、时妻子的年龄24 18 25 22 20 23 19 24 23 22 1 计算样本相关系数r;2 求总体相关系数的95置信区间;3 以5的水平,检验“夫妻的结婚年龄之间没有什么线性联系”这一原假设。 解:(1 =由于=22,=23;=0.3426(2由于se(=,n=10,df=8=2.306,所以:se(=0.332-2.036<=<=2.306得1.062072(3:夫妻的结婚年龄之间没有线性相关,夫妻的结婚年龄之间不完全没有线性相关,0根据第(2题的计算结果,1.062072由于的原假设落入了该置信区间,所以接受原假设,认为夫妻的结婚年龄之间没有线性相关关系。第十章 卡方检验和交互分析10-14、为了研究性别和“最希望看到的有关奥运会的电视节目类型”之间的关系,2004年在10城市调查了1000个样本,调查数据如下:别性频次希望看到的节目类型男女赛事直播261235新闻报道6942专题报道3340精彩赛事集锦3642开幕式和闭幕式87

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论