版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、一元线性回来模型有哪些基本假定?答:1.说明变量 日 EMBED Equation. 3 0 囚 EMBED Equation. 3 区是 非随机变量,观测值区 EMBED Equation. 3 臼 因是常数。.等方差及不相关的假定条件为这个条件称为高斯-马尔柯夫()条件,简称条件。在此条件下,便可以得到关于回来系数的最小二乘 估计及误差项方差区估计的一些重要性质,如回来系数的最小二乘估计是回来系数的最小方差线性无偏 估计等。.正态分布的假定条件为在此条件下便可得到关于回来系数的最小二乘估计及因估计的进一步结果,如它们分别是回来系数 的最及凶的最小方差无偏估计等,并且可以作回来的显著性检验及
2、区间估计。.通常为了便于数学上的处理,还要求 目 及样本容量的个数要多于说明变量的个数。在整个回来分析中,线性回来的统计模型最为重要。一方面是因为线性回来的应用最广泛;另一方面 是只有在回来模型为线性的假设下,才能的到比拟深入和一般的结果;再就是有很多非线性的回来模型可 以通过适当的转化变为线性回来问题进行处理。因此,线性回来模型的理论和应用是本书探讨的重点。.如何依据样本三三求出 1 x 及方差S的估计;.对回来方程及回来系数的种种假设进行检验;.如何依据回来方程进行预料和限制,以及如何进行实际问题的结构分析。考虑过原点的线性回来模型一1误差 匚三1 仍满意基本假定。求0的最小二乘估计。答:
3、0因为Q (s而Q (0 即-2(I X IEMBED Equation. KSEE3EMBED Equation. KSEE3解得即口的最小二乘估计为证明:q (回,)=e( EMBED Equation. KSEE3 的 EMBED Equation. KSEE3 可)20 冈田)Q ( U, U )非负且在山上可导,当Q取得最小值时,有EMBEDEMBED0 )=0-2( 0 EMBED Equation. KSEE3EMBED Equation. KSEE3EMBED Equation. KSEE3EMBEDEquat i on. KSEE3 可)目=o由图1可见图形略呈右偏,由图2可
4、见正态概率图中的各个散点基本呈直线趋势,残差在0旁边波动,以 认为残差听从正态分布。Equation. KSEE3四)二日 EMBED Equation. KSEE3 目可 EMBEDEquation. KSEE3Equation. KSEE3EMBED Equation. KSEE3(即残差的期望为0,残差以变量x的加权平均值为零)(即残差的期望为0,残差以变量x的加权平均值为零)2.4解:参数2 0,B 1的最小二乘估计及最大似然估计在8 (0, 2 ) 1,2,n的条件下等价。证明:因为所以其最大似然函数为使得(L)最大的凶使得(L)最大的凶口就是, 的最大似然估计值。所以,在 然估计等
5、价。0 冈2. 5.证明口是口的条件下,参数B0,B1的最小二乘估计及最大似证明:假设要证明的无偏估计。国 冈冈 冈口是口的无偏估计,那么只需证明E(口)二口冈U的最小二乘估计为其中冈 X E()(11 其中)(KI由于)=0,所以)即使得下式最小:因为恰好就是最小二乘估计的目标函数相同。又因为一元线性回来模型为所以E(国)=0所以E()()(所以,是口的无偏估计。2. 6解:因为,联立式,得到因为因为;(2)又因为国,所以故(2)2.9 验证(2. 63)得证。式:2.7证明平方和分解公式: 证明:2. 8验证:(1)证明:(1)因为证明:其中:注:各个因变量是独立的随机变量2. 10用第9
6、题证明3 0是的无偏估计量证明:注:2. 11验证 证明:所以有以上表达式说明r 2及F等价,但我们要分别引入这两个统计量,而不是只引入其中一个。理由如 下:2及f, n都有关,且当n较小时,r较大,尤其当n趋向于2时,趋向于1,说明x及y的相关 程度很高;但当n趋向于2或等于2时; 可能回来方程并不能通过F的显著性检验,即可能x及y都不存 在显著的线性关系。所以,仅凭r较大并不能断定x及y之间有亲密的相关关系,只有当样本量n较大时 才可以用样本相关系数r判定两变量间的相关程度的强弱。F检验检验是否存在显著的线性关系,相关系数的显著性检验是推断回来直线及回来模型拟合的优劣,只有二者结合起来,才
7、可以更好的回来结果的好坏。12假如把自变量观测值都乘以2,回来参数的最小二乘法估计口和口会发生什么变化?假如把自变量观测值都加上2,回来参数的最小二乘估计U和口会发生什么变化? 解:解法(一):我们知道当J1,11 时,用最小二乘法估计的,和口/人人岛=y - x后ntO. 05/2(3),所以接受原假设,说明x和Y有显著的线(9)做相关系数r的显著性检验:因为所以, 的置信区间为(-21.21, 19.21),的置信区间为(0.91,13.09)。(6)确定系数(7)计算得出,方差分析表如下:方差来源平方和自由度均方F值490149013.364110336. 6676004查表知,F0.
8、05(1,3)=10. 13, F值F0.05(l,3),故拒绝原假设,说明回来方程显著。(8)做回来系数B 1的显著性检验所以,相关系数因为查表知,2等于3时, 3 的值为0.959, 日 %的值为0.878。所以, 目 % 目 %,故x及y有显著的线性关系。(10)残差表为:残差图为:序号0回冈残差111064221013-33320200442027-75540346(11)当 XO4.2 时,,即为:(17. 1, 39. 7)0其95%的置信区间近似为2. 15 解:(1)画散点图;图形一旧对话框一散点图,得到散点图(表1)如下:(2) x及y之间是否大致呈线性关系?由上面(1)散点
9、图可以看出,x及y之间大致呈线性关系。用最小二乘估计求出回来方程;分析一回来一线性,得到“回来系数显著性检验表(表2) ”如 下:tB*10.118.355.333每周签发的新保单数目X.004.000.9498. 509a.:每周加班工作时间y由上表可知:00=0. 118=0. 004所以可得回来方程为:=0. 118+0. 004x0(4)求回来标准误差;分析一回来线性,得到“方析分析表(表3) ”如下:EMBED Equation. KSEE3EMBED由上表可得,F116. 682116. 68272.396.000a1.8438.23018.5259a. : 0,每周签发的新保单数
10、目x b.:每周加班工作时间y1.84310故回来标准误差为:田区Equat i on. KSEE3o. 23习 EMBED Equation. KSEE3 o.480 S(5)给出 及 的置信度为95%的区间估计;由表2可以看出,当置信度为95%时,3的预料区间为:0.9370的预料区间为:0.003, 0. 005(6)计算x及y确实定系数;分析一回来线性,得到“模型概要表(表4) ”如下:RRR1.949a.900.888.4800a. : 0,每周签发的新保单数目x b.:每周加班工作时间y由上表可知,x及y确实定系数为0.9,可以看到很接近于1,这就说明此模型的拟合度很好。(7)对回
11、来方程作方差分析;由“方差分析表(表3) ”可得,值二72.396,我们知道,当原假设 EMBED Equation. KSEE3成立时,f听从自由度为(1, 2)的F分布(见 日),临界值 区(1, 2)= 目 (1, 8) =5. 32因为值=72. 3965, 32,所以拒绝原假设,说明回来方程显著,即x及y有显著的线性关系。(8)做回来系数因显著性的检验;由“回来系数显著性检验表(表2) ”可得,的t检验统计量为8. 509,对应值近似为0, p国,说明每周签发的新报单数目x对每周加班工作时间y有显著的影响。(9)做相关系数的显著性检验;分析一相关一双变量,得到“相关分析表(表5) ”
12、如下:每周签发的新保单 数目x每周加班工作时间y每周签发的新保单数目x1.949*.(2).000N1010每周加班工作时间y. 949*1.(2).000N1010*.0.01 (2).由上表可知,相关系数为0.949,说明x及y显著线性相关。(10)对回来方程作残差图并作相应的分析;从上图可以看出,残差是围绕0随即波动的,满意模型的基本假设。(11)该公司预料下一周签发新保单区=1000张,须要的加班时间是多少?当 国=1000 张时 因 0. 118+0. 004X1000=4. 118 小时。(12)给出区的置信水平为95%的精确预料区间和近似预料区间。(13)给出E (冈)置信水平为
13、95%的区间估计。最终两问一起解答:在计算回来之前,把自变量新值区输入样本数据中,因变量的相应值空缺,然后在对话框中点选和计算因变量单个新值和计算因变量单个新值国和因变量平均值(国)的置信区间。结果显示在原始数据表中,如下列图所示(由于排版问题,中间局部图省略):的精确预料区间为:2.519, 4. 887E (口)的区间估计为:3.284, 4. 123而 回的近似预料区间那么依据 EMBED Equation. KSEE3回2手动计算,结果为: 4, 118-2X0. 48, 4. 118+2X0. 48 = 3. 158, 5. 0782. 16解答:(1)绘制y对x的散点图,可以用直线
14、回来描述两者之间的关系吗?如下图:(2)由上图可以看出,y及x的散点分布大致呈直线趋势,所以可以用直线回来描述两者之间的关系。 (3)建立y对x的线性回来。利用建立y对x的线性回来,输出结果如下:表1表2方差分析表模型汇总模型RR方调整R方标准估计的误差1. 835a.697.6912323.256a.预料变量:(常量),X。模型平方和均方F1回来6.089E816.089E8112.811. 000a残差2.645E8495397517.938总计8.734E850a.预料变量:(常量),Xo b.因变量:y表3系数表(a)由表1可知,x及y确定系数为 =1,说明模型的拟合效果一般。x及y线性相关系数系数a模型非标准化系数标准系数t*B标准误差试用版1(常量)12112.6291197. 76810. 113.000X
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中班语言教案详案及教学反思《猜一猜》
- 中班语言活动教案及教学反思《五指兄弟的争吵》
- 乘法分配律(教案)人教版四年级下册数学
- 大班数学教案及教学反思《6的加减》
- 中班科学活动教案:美丽的彩虹
- 中班社会详案教案:生命之源――水
- 中班教案找朋友8篇
- 中班安全教育活动教案:阳台上的安全
- 烟草物流中心信息化建设方案
- 二年级上册数学素材:6.3 8的乘法口诀 导学案和校本作业苏教版无答案
- 2024二十届三中全会知识竞赛题库及答案
- 消化系统常见疾病课件(完美版)
- 医院检验外包服务项目招标文件
- 档案整理及数字化服务方案
- 《正确认识缓解焦虑》调节考试焦虑正确迎考主题班会课件
- 枸杞多糖的提取与分离
- 机构编制重要法规文件汇编
- 人教版八年级地理(上册)期中试卷及答案(完整)
- 新课标高中生物全套思维导图
- 九年级第一学期数学期中考试试卷细目表(沈军)
- 60万吨MTO装置中交发言稿
评论
0/150
提交评论