数理统计课后习题答案.doc_第1页
数理统计课后习题答案.doc_第2页
数理统计课后习题答案.doc_第3页
数理统计课后习题答案.doc_第4页
数理统计课后习题答案.doc_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

习题一、基本概念1解:设为总体的样本1) 2)3)所以 4)2.解: 由题意得:i01234个数67322fxi0.30.3因为,所以01 0.9 0.8 0.7 0.60.5 0.4 0.30.2 0.1 1 2 3 4xy3解:它近似服从均值为172,方差为5.64的正态分布,即4解:因k较大5解:6解:7.解: 查卡方分位数表 c/4=18.31,c=73.248解:由已知条件得:由互相独立,知也互相独立,所以9.解:1) 2) 3) 4) 10.解:1) 2) 11.解:12.解:1) 2) 3) 13.解: 14解:1)且与相互独立2)15.解: 设,即 16解:17.证明:1)2)3)18. 解:19.解20.解:21. 解:1)因为,从而 ,所以2)因为,所以3)因为,所以,故 22.解:由th1.4.1 (2) 查表:23.解:由推论1.4.3(2) 24.解: 1)2)25. 解:1)2) 26.解:1)2) 3) 27解:28.解:数学词汇:数理统计 mathematical statistics 总体 population样本 sample 分布函数 distribution function独立事件 independent event 简单样本 simple sample样本概率空间 sample probability space 样本分布 sample distribution样本均值 sample mean 样本空间 sample space样本矩 sample moment 样本方差 sample variance样本k阶矩 sample moment of order k样本标准差 sample standard deviation顺序统计量 order statistic经验分布函数 empirical distribution function抽样分布 sampling distribution习题二、参数估计1 解:矩估计 所以,2解:1)无解,依定义:2)矩法: 极大似然估计:3 1)解:矩法估计:最大似然估计:2)解:矩估计:最大似然估计:3)解: 矩估计: 联立方程: 极大似然估计:依照定义,4) 解: 矩估计:,不存在,无解;故,依照定义,5)解: 矩法: 即极大似然估计:无解,依定义有:7)解:矩法:极大似然估计:8)解:矩法:极大似然估计:4解:记则;5.解:6解:因为其寿命服从正态分布,所以极大似然估计为:根据样本数据得到:。由此看到,这个星期生产的灯泡能使用1300小时的概率为07.解:由3.2)知所以平均每升氺中大肠杆菌个数为1时,出现上述情况的概率最大。8 1)解:2)解:,9解:由极大似然估计原理得到10解: 应该满足:结果取决于样本观测值11.解:无偏,方差最小所以:12、1)解:2)13解:14证明:151)解:是的无偏估计2)解:可以看出最小。16解:比较有效17.解:18.解:是有效估计量,19.解:注意: t是有效估计量,201)解:2)t是有效估计量,是相合估计量。21.解:t是有效估计量22.1)解:2)所以是有效估计量3) 所以,t也是相合估计量。23.解:24. 解:所以(1)(2)25.解:所以26解:27.解:28.解:服从正态分布,按照正态分布均值的区间估计,其置信区间为 ;由题意,从总体x中抽取的四个样本为:其中,代入公式,得到置信区间为2),得到置信区间为29.解:所以30.解: 所以31解:32解: 所以33解:设,先验分布密度,当时,样本的概率密度分布为关于参数的后验分部为的后验分部为 ,关于的bayes估计量34解:设,先验分布密度当时,样本的概率密度分布为关于参数的后验分部为的后验分部为 ,关于的bayes估计量35解:设,先验分布密度 当时,样本的概率密度分布为:关于参数的后验分部为 ,这是因为的后验分部为 关于的bayes估计量36解:(1) 解出,(2)设先验分布密度 当时,样本的概率密度分布为关于参数的后验分部为 的后验分部为 ,关于的bayes估计量(3)比较估计量,有: 当时,所以,t2优于t1第二章 常用统计术语(1)statistic inference 统计推断(2)parameter statistical inference 参数统计推断(3)parametric assumption 参数假定(4)point estimate 点估计(5)interval estimation 区间估计(6)method of moments 矩法(7)maximum likelihood estimation 最大似然估计(8)unbiased estimator 无偏估计量(9) unbiased estimate 无偏估计(9)unbiased ness 无偏型(10)efficient estimate 有效估计(11)effective error mean square 有效均方误差(12) mean square error 均方误差(13)consistent estimate 相合估计(14)convergence with probability 以概率1收敛(15)convergence in probability 依概率收敛(16)confidence interval 置信区间(17)confidence level 置信水平(18)confidence limit 置信界限(19)confidence lower limit 置信下限(20)confidence upper limit 置信上限(21)confidence probability 置信概率(22)prior/posterior distribution 先验/后验分布(23)prior/posterior error bound 先验/后验误差界(24)prior/posterior estimate 先验/后验估计(25)prior/posterior probability 先验/后验概率(26)loss function 损失函数(27)loss of information 信息的损失(28)loss of significance 精度损失(29)loss probability 损失概率习题三、假设检验1.解: 拒绝,总体的均值有显著性变化拒绝,总体的方差有显著性变化2.解:拒绝,元件不合格3.解:接受,机器工作正常4解:拒绝,当前的鸡蛋售价明显高于往年5.解:拒绝,明显变大6.解:接受,合格接受,合格7.解:8.解:9.解:10.解:11.解:12解:13. 解:14解:15解:接受,认为甲比乙强度要高16解:接受,认为乙的精度高17解:: 接受,认为无显著差别18.解: 19.解:20.解:21.解:22.解:23.解:24.解:25解:26.解:27.解:28.解:29.解:30解由题意知, 代入式子选用式子计算求得 ,于是抽查方案是:抽查66件产品,如果抽得的不合格产品,则接受这批产品,否则拒绝这批产品。31.解:(1)解方程组 得 (2)若未知,用估计,从而得出公式数学词汇:假设检验 hypothesis testing参数假设检验 parameter hypothesis testing非参数假设检验 non-parameterical hypothesis testing原假设 null hypothesis备择假设 alternative hypothesis显著性水平 level of significance拒绝域 rejection region接受域 acceptance region第一类错误 type i error第二类错误 type ii error统计假设 statistical hypothesis正态分布 normal distribution 频数 frequency秩 rank秩和检验 rank sum test接受概率 probability of acceptance统计过程控制 statistical process control控制下线 lower control line控制上线 upper control line控制中心线 control line习题四 回归分析1解:利用最小二乘法得到正规方程:其中代入样本数据得到:用r分析可以直接得到call:lm(formula = y 1 + x)residuals: 1 2 3 4 5 6 -2.28571 1.82857 0.94286 0.05714 1.17143 -1.71429 coefficients: estimate std. error t value pr(|t|) (intercept) 24.628571 2.554415 9.642 0.000647 *x 0.058857 0.004435 13.270 0.000186 *-signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 residual standard error: 1.855 on 4 degrees of freedommultiple r-squared: 0.9778, adjusted r-squared: 0.9722 f-statistic: 176.1 on 1 and 4 df, p-value: 0.0001864所以:样本线性回归方程为:2证明:1) 由于,所以,。,命题得证。2)同理得证。3解:利用最小二乘法得到正规方程:其中代入样本数据得到: 用r分析得:call:lm(formula = y 1 + x)residuals: min 1q median 3q max -0.049553 -0.025164 0.002805 0.023843 0.051012 coefficients: estimate std. error t value pr(|t|) (intercept) 0.314464 0.027074 11.615 2.45e-05 *x -0.047172 0.009839 -4.795 0.00302 * -signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 residual standard error: 0.03746 on 6 degrees of freedommultiple r-squared: 0.793, adjusted r-squared: 0.7585 f-statistic: 22.99 on 1 and 6 df, p-value: 0.003017 所以:样本线性回归方程为:拒绝域形式为:,所以是显著。4解:1)利用最小二乘法得到正规方程:其中用r分析得call:lm(formula = y 1 + x)residuals: min 1q median 3q max -0.074323 -0.025719 -0.002468 0.025209 0.083125 coefficients: estimate std. error t value pr(|t|) (intercept) 3.03318 0.03871 78.35 2e-16 *x -2.06979 0.05288 -39.14 2e-16 *-signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 residual standard error: 0.04454 on 15 degrees of freedommultiple r-squared: 0.9903, adjusted r-squared: 0.9897 f-statistic: 1532 on 1 and 15 df, p-value: |t|) (intercept) -15.93836 3.85644 -4.133 0.00166 * x1 0.52227 0.08532 6.121 7.51e-05 *x2 0.47383 0.12243 3.870 0.00261 * -signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 residual standard error: 1.81 on 11 degrees of freedommultiple r-squared: 0.9905, adjusted r-squared: 0.9887 f-statistic: 570.5 on 2 and 11 df, p-value: 7.757e-12同样得到:10解:用r分析得call:lm(formula = y x1 + x2, data = demand)residuals: min 1q median 3q max -8.4750 -5.3674 -0.4031 4.1193 9.9523 coefficients: estimate std. error t value pr(|t|) (intercept) 111.69182 23.53081 4.747 0.00209 *x1 0.01430 0.01113 1.284 0.24000 x2 -7.18824 2.55533 -2.813 0.02603 * -signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 residual standard error: 7.213 on 7 degrees of freedommultiple r-squared: 0.8944, adjusted r-squared: 0.8643 f-statistic: 29.65 on 2 and 7 df, p-value: 0.0003823 得到回归方程:11解: 2)12解:1)令,用r分析得:call:lm(formula = y x1 + x2, data = demand)residuals: 1 2 3 4 5 6 7 8 1.18333 -1.55238 -0.80714 0.61905 0.92619 0.01429 -0.21667 -0.16667 coefficients: estimate std. error t value pr(|t|) (intercept) 3.41667 0.90471 3.777 0.01294 * x1 2.72619 0.60377 4.515 0.00631 *x2 -0.39048 0.08293 -4.708 0.00530 *-signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 residual standard error: 1.075 on 5 degrees of freedommultiple r-squared: 0.816, adjusted r-squared: 0.7424 f-statistic: 11.08 on 2 and 5 df, p-value: 0.01453求得回归方程为:2) 拒绝域形式为:,所以是显著。3)将代入回归方程,得到13 解,得到常用统计术语:(1) regression analysis 回归分析(2)regression equation 回归方程(3)regression forecasting 回归预测(4)regression variance 回归方差(5)linear regression 线性回归 (6)non-linear regression 非线性回归(7)sample regression line 样本回归直线(8)least square estimation 最小二乘估计(9)linear model 线性模型(10)regression diagnostic 回归诊断(11)residual sum of squares 残差平方和(12)residual variance 剩余方差(13)influence case 强影响点(14)outlier 异常点习题五 方差分析与试验设计1.解:用r单因素方差分析表如下: df sum sq mean sq f value pr(f) a 4 227680 56920 3.9496 0.02199 *residuals 15 216175 14412 -signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1方差来源自由度平方和均方f值p值因素a误差41522768021617556920144123.94960.02199 *因为p=0.021990.05,所以认为不同日期生产的质量有显著差异。用spss分析得: anova质量sum of squaresdfmean squarefsig.between groups227680.000456920.0003.950.022within groups216175.0001514411.667total443855.00019因为p=0.022f)a 3 0.0083467 0.0027822 2.4264 0.1089residuals 14 0.0160533 0.0011467 方差来源自由度平方和均方f值p值因素a误差3140.00834670.01605330.00278220.00114672.42640.1089 因为p=0.10890.05,所以认为不同日期生产的质量无显著差异。用spss分析得:anova得率sum of squaresdfmean squarefsig.between groups.0083.0032.426.109within groups.01614.001total.02417因为p=0.1090.05,所以认为不同催化剂下平均得率无显著差异。3. 解:用spss双因素方差分析表如下:tests of between-subjects effectsdependent variable:冲击值sourcetype i sum of squaresdfmean squarefsig.model1127.938a6187.990213.962.000x1067.1574266.789303.649.000y60.782230.39134.590.001error5.2726.879total1133.21012a. r squared = .995 (adjusted r squared = .991)因为0.0000.05,0.001f)m 3 2.750 0.917 0.5323 0.6645282b 2 27.167 13.583 7.8871 0.0023298 *m:b 6 73.500 12.250 7.1129 0.0001922 *residuals 24 41.333 1.722-signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1方差来源自由度平方和均方f值p值因素m因素b相互效应a*b误差326242.75027.16773.541.3330.91713.58312.2501.7220.53237.88717.11290.66450.002330.00192因为所以操作工之间的差异显著;机器之间的差异不显著;它们的交互作用显著。5.解:根据题意选择正交表来安排试验,随机生成正交试验表如下:abcd硬度合格率(%)123411212100221214531122854221170由此可见第三号试验条件为:上升温度800、保温时间6h、出炉温度500。abcd硬度合格率(%)123411212100221214531122854221170185130170115k=300p=22500q=24150=32501151701301852372522900229002372512254004001225方差分析表:方差来源平方和自由度均方差f值a1225112251b40014000.33c40014000.33误差122511225总和32504所以认为三个因素对结果影响都显著。由方差分析表看出:本例较好的水平搭配是:即最佳搭配为:上升温度820、保温时间6h、出炉温度400.6.解:根据题意选择正交表来安排试验随机生成正交试验表如下: a1b2c3实验结果 产量(kg/m2%)111162.925212257.075313351.6421255.05522358.05623156.55731363.225832150.7933254.45第8号实验的条件:品种(a3)珍珠矮11号,插值密度(b2)3.75棵/100m2 ,施肥量(c1)0.75kg/100m2纯氨;对正交实验进行方差分析,直接用r软件求解df sum sq mean sq f value pr(f)a 2 1.759 0.879 0.0223 0.9782b 2 65.861 32.931 0.8361 0.5446c 2 6.660 3.330 0.0845 0.9220residuals 2 78.776 39.388 ,所以认为三个因素对结果影响都不显著。由方差分析表看出:本例较好的水平搭配是: 7*.解根据题意选择均匀设计表来安排试验第7号实验的条件为:原配料比2.6,吡啶量16ml,反应时间0.5h 第五章常用统计术语:方差分析 analysis of variance因子 factor水平 level单因素 single factor单因素方差分析 simple factorial anova双边量相关分析 bivariate correlations卡方检验 chi-square test交互效应 interaction effect正交设计 orthogonal design均匀分布 uniform distribution描述统计分析 descriptive statistical analysis假设方差相等 equal variances assumed假设方差不等 equal variance not assumed因子分析 factor analysis线性回归分析 linear regression习题六 多元分析与数据挖掘1. 解由r软件,用最短距离(左)和差离平方和法(右)对题目进行聚类分析如下图:agglomeration schedulestagecluster combinedcoefficientsstage cluster first appearsnext stagecluster 1cluster 2cluster 1cluster 21165.00000221210.00010434813.00000741713.00020551313.00040661517.00050771429.000630agglomeration schedulestagecluster combinedcoefficientsstage cluster first appearsnext stagecluster 1cluster 2cluster 1cluster 21162.5000042489.00000735717.50000641326.33310551244.750406615106.833537714257.375620agglomeration schedule21)解:最短距离法的聚类步骤如下:a :,最长距离法与最短距离法类似,步骤如下: a) (2)最短距离法的聚类步骤如下a 由于本题数据的特殊性,最长距离法与最短距离法结果相同。(3)最短距离法的聚类步骤如下a 由于本题数据的特殊性,最长距离法与最短距离法结果相同。3解: 由r软件得到重心法聚类分析的结果:stagecluster combinedcoefficientsstage cluster first appearsnext stagecluster 1cluster 2cluster 1cluster 2118.0010022110.002104369.005006415.010207524.010008667.027307716.048468812.4597599132.5728004解:由r软件分析得到如下结果:importance of components: comp.1 comp.2 comp.3 comp.4standard deviation 1.6103349 0.9890848 0.53407741 0.37854199proportion of variance 0.6482947 0.2445722 0.07130967 0.03582351cumulative proportion 0.6482947 0.8928668 0.96417649 1.00000000loadings: comp.1 comp.2 comp.3 comp.4x1 0.291 0.871 0.332 -0.214x2 -0.506 0.425 -0.742 -0.111x3 0.577 0.136 -0.418 0.688x4 -0.571 0.205 0.404 0.685其中standard deviation表示的是主成分的标准差,即主成分的方差开方,也就是相应的特征值的开方,proportion of variance表示方差的贡献率,cumulative proportion表示方差的累积贡献率。所以,将特征值平方还原,得到四个特征值为2.593,0.978,0.285,0.143,由于前两个主成分对应的累积贡献率已经达到89.287,另外两个主成分可以舍去,达到降维的目的。5解:,此矩阵为样本相关阵。v = 0.0600 -0.7060 0.5333 0.4620 0.7317 0.1743 -0.3404 0.5642 -0.6057 -0.1932 -0.6040 0.4806 -0.3069 0.6587 0.4846 0.4870d = 0.0546 0 0 0 0 0.3126 0 0 0 0 0.9647 0 0 0 0 2.6681四个特征值依次为:2.6681,0.9647,0.3126,0.0546前两个主成分的累计贡献率为:90.8471%6答: (1)提取公因子的方法主要有主成份法和公因子法。若采取主成份法,则主成分分析和因子分析基本等价,该法从解释变量的变异的角度出发,尽量使变量的方差能被主成分解释;而公因子法主要从解释变量的相关性角度,尽量使变量的相关程度能被公因子解释,当因子分析目的重在确定结构时则用到该法。 (2)主成分分析和因子分析都是在多个原始变量中通过他们之间的内部相关性来获得新的变量,达到既减少分析指标个数,又能概括原始指标主要信息的目的。但他们各有其特点:主成分分析是将n个原始变量提取m个支配原始变量的公因子,和1个特殊因子,各因子之间可以相关或不相关。 (3)统用降维的方法,但差异也很明显:主成分分析把方差划分为不同的正交成分,而因子分析则把方差化分为不同的起因因子;因子分析中的特征值的计算只能从相关系数矩阵出发,且必须把主成分划分为因子。 (4)因子分析提取的公因子比主成分分析提取的主成分更具有可解释性。 (5)两者分析的实质及重点不同。主成分的数学模型为y=ax,因子分析的数学模型为x=af+。因而可知主成分分析是实际上是线性变换,无假设检验,而因子分析是统计模型,某些因子模型是可以得到假设检验的;主成分分析主要综合原始数据的信息,而因子分析重在解释原始变量之间的关系。 (6)spss数据的实现:两者都通过“analyze data reductionfactor”过程实现,但主成分分析主要使用“descriptires,extraction,stores对话框,而因子分析处使用这些外,还可使用“rotaction”对话框进行因子旋转。7解:用r分析得:loadings: factor1x1 -0.302 x2 0.762 x3 -0.854 x4 0.950 factor1ss loadings 2.304proportion var 0.576test of the hypothesis that 1 factor is sufficient.the chi square statistic is 2.41 on 2 degrees of freedom.the p-value is 0.299用spss分析:factor /variables 前一年11月12日的降水量 当年7月均温 当年7月降雨量 月日辐射 /missing listwise /analysis 前一年11月12日的降水量 当年7月均温 当年7月降雨量 月日辐射 /print initial extraction /criteria mineigen(1) iterate(25) /extraction pc /rotation norotate /method=correlation .communalities initialextraction前一年11月12日的降水量1.000.219当年7月均温1.000.665当年7月降雨量1.000.864月日辐射1.000.845extraction meth

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论