版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《概率论与数理统计》课程设计PAGEPAGEIII摘要数理统计是具有广泛应用的数学分支,而区间估计和假设检验问题在其中占有很重要的地位。对于正态总体期望和方差的区间估计和假设检验问题已有完备的结论;对于非正态总体期望和方差的区间估计和假设检验问题,在大样本的情况下,可利用中心极限定理转化为正态总体来解决。但实际问题中常常碰到非正态总体,而且是小样本的情况,因此对它的区间估计和假设检验是一个值得研究的问题。本文利用概率论与数理统计基本原理对小样本常用分布参数置信区间和假设检验问题,进行了深入研究,提出了小样本常用分布参数的置信区间与假设检验的解决方法。本文利用小样本情形的统计量法解决离散型的0-1分布、二项分布以及连续型的指数分布参数的置信区间与假设检验,对于泊松分布的参数的置信区间与假设检验则采用数学方法进行分析。对于均匀分布,利用两个参数的最大似然估计求出联合概率密度进行求解。关键词:小样本;最大似然估计;统计量法;置信区间;假设检验目录1设计目的 12设计问题 13设计原理 24设计程序 24.1设计步骤 24.2设计结果 34.3结果分析 65设计总结 7致谢 8参考文献 9PAGE8鞋的销售量与鞋单价和购买者月收入的回归分析1设计目的为了更好的学习概率论与数理统计,利用非线性回归的计算软件学习非线性回归问题的分析方法。学会如何用Matlab、Excel来进行非线性回归问题的检验及预测。2设计问题为了研究鞋的销售量与鞋单价和购买者月收入三者之间的关系,随机抽出30个样品进行分析,得到如图所示的结果,试确定三者之间的关系数据表实验号鞋需求量购买者月收入鞋单价13012007222511007232112007242090073.352395073.362695073.3716100073.3819105073.392711007410241050741126115074122811007113221000711421120072152012007216197807217188907218168507219158007220179007221149507322179607323101100732491000732513990732614980732712890742818870732915850733016800733设计原理本题是一道确定这三种组分含量与玻璃析晶上限温度的关系问题,首先做出该组数据的散点图,由图分析该数据属于线性回归问题,可以利用Excel解决这种类型的问题。数据的处理时通过使用“最小二乘法”做直线拟合,然后再进行一元线性回归。在整个过程中直接使用Excel进行数据处理,得出结论,然后队所得数据进行分析。4设计程序为了研究这些数据中所蕴含的规律,将温度T看做因变量,X1,X2,X3看做自变量,画出它们的散点图(图一),可见这些点分布在一条直线附近,所以两组分的百分比之间可能符合一元线性模型。下面用Excel“分析工具库”提供的“回归”工具,找出线性回归方程,并检验其显著性。4.1设计步骤在【工具】菜单中选中【数据分析】,则会弹出【数据分析】对话框,然后在“分析工具”中选择“回归”选项,如图二所示。单击【确定】后,则弹出【回归】对话框,如图二所示。填写【回归】对话框。如图三所示,该对话框的内容较多,可以根据需要,选择相关项目。在“Y值输入区域”内输入队因变量数据区域的引用,该区域必须有单列数据组成,如本题中三种成分的含量;在“X只输入区域”输入对自变量数据区域的引用,如本题中温度T。该区域必须是连续的,Excel将对此区域中的自变量从左到右按升序排列,自变量的个数最多是25个。“标志”:如果输入区域的第一行中包含标志项,则选中此复选框,本题中的输入区域包含标志项;如果在输入区域中没有标志项,则应清楚此复选框,Excel将在输出表中生成合适的数据标志。“置信度”:如果需要在汇总输出表中包含附件的置信度信息,则选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度。Excel默认的置信度为95%,相当于显著性水平a=0.05。“常数为零”:如果要强制回归线通过原点,则选中此复选框。“输出选项”:选择“输出区域”,在此输出对输出表左上角单元格的引用。“残差”:如果需要以残差输出表形式查看残差,则选中此复选框。“标准残差”:如果需要在残差输出表中包含标准残差,则选中此复选框。“残差图”:如果需要生成一张图表,绘制每个自变量及其残差,则选中此复选框。“线性拟合图”:如果需要为预测值和观察值生成和观测值生车一个图表,则选中此复选框。“正态概率图”:如果需要绘制正态概率图,则选中此复选框。4.2设计结果0020040060080010001200051015202530T/℃(X1)Na2O/%(X2)SiO2/%(X3)CaO/%图一散点图图二数据分图三回归分析工具界面SUMMARYOUTPUT回归统计MultipleR0.999711RSquare0.999422AdjustedRSquare0.951748标准误差25.21578观测值24方差分析dfSSMSFSignificanceF回归分析323088960769632012104.269.45E-33残差2113352.54635.8355总计2423102313图四回归分析工具运行结果1Coefficients标准误差tStatP-valueLower95%Upper95%下限95.0%上限95.0%Intercept0#N/A#N/A#N/A#N/A#N/A#N/A#N/A14-5.528968.770542-0.63040.535232-23.768312.71038-23.768312.710387213.53771.7679267.657391.65E-079.86109817.21439.86109817.21439.110.559145.3705461.966120.062643-0.6095221.7278-0.6095221.7278图四回归分析工具运行结果2RESIDUALOUTPUTPROBABILITYOUTPUT观测值预测1029残差标准残差百分比排位10291982.83828.161981.1939522.0833339252972.278943.721121.8535956.2594031007.828-1.82842-0.0775210.416679564986.71016.289850.26666414.5833395651000.4373.5629720.15105518.759656989.8779-22.8779-0.9699322.916679677979.318819.681250.83440427.0833396781006.746-14.7457-0.6251631.259689999.3543-19.3543-0.8205435.4166797910988.7951-8.79514-0.3728839.5833398011958.741225.258821.0708743.7598012942.653122.346920.94741747.9166798413987.868218.131810.76871452.0833398414966.749921.250080.90091656.2598715987.8682-3.86819-0.16460.4166798816977.3091-10.3091-0.4370664.5833398817966.749920.250080.8585268.7599218977.30911.6909460.07168972.9166799319956.190831.809221.3485877.0833399920990.8468-22.8468-0.9686181.25100421980.2876-40.2876-1.7080385.41667100622969.7285-13.7285-0.5820389.58333100623990.8468-34.8468-1.4773693.75101124969.7285-44.7285-1.896397.916671016图四回归分析工具运行结果34.3结果分析由图四知,若保留两位有效数字,该回归方程的截距是0.7316,斜率为944.3,所以回归方程的表达式为:y=0.7316x+944.3;根据回归统计结果,知决定系数=0.9264,即相关系数r=0.9625,说明自变量与因变量之间有较高的相关性;根据方差分析的结果,F=44.2,SignificanceF<0.01,所以建立的回归方程非常显著。在图四的第三个表中,除了列出了回归系数,还有标准误差等项目。其中“标准误差”表示的事对应回归系数的标准误差,其中偏回归系数的标准误差。“tStat”就是t检验时的统计量t;如果多元线性回归,则可直接根据“tStat”的大小,判断因素的主次顺序。“P-value”表示t检验偏回归系数不显著的概率,如果P-value<0.01,则可认为该系数对应的变量对试验结果影响非常显著(**),如果0.01<P-value<0.05,则可认为该系数对应的变量对试验结果影响显著(*);对于常数项,P-value则表示常数项为零的几率。5设计总结通过对概率论与数理统计的这道实际问题的解决,不仅使我更加深刻的理解了概率论与数理统计的基础知识,而且使我对这些知识在实际中的应用产生了浓厚的兴趣,同时对我学习好概率论与数理统计这门课有很大帮助。在实现这道题的过程中我应用了Excel软件,学会了该软件的一些新的应用,更加熟练的操作该软件进行一些数据上的处理。参考文献[1]沈恒范.概率论与数理统计教程[M].第四版.北京:高等教育出版社,2003.4:140-196[2]MorrisH.DeGroot,MarkJ.Schervish[美].概率统计[M].叶中行,王蓉华,徐晓岭.第三版.人民邮电出版社,2007.3,175-333[3]徐传胜.贝塔分布的有关性质及应用探讨[J].临沂师范学院学报,2001,23(4):6-8[4]陈家鼎,孙山泽.数理统计讲义[M].高等教育出版社,1993:37-52[5]陈希孺.数理统计引论[M].科学出版社,1981:96-97[6]苑诗松,王静龙.数理统计[M].华龙师范大学出版社,1987:42-45,142-160[7]杨虎等.数理统计[M].高等教育出版社,2004[8]H.L.阿尔德,E.B.罗斯勒[美].概率论与数理统计[M].北京大学出版社,1984[9]廖仲春.概率统计课程教学方法探索[J].大学时代(B版),2006,(01):[10]StuartA.Klugman.,HarryH.panjer,GordenE.willmot.LossModelsFromDatatoDecisions,SecondEdition[M].AJOHNWITEY&SONS,INC,PUBLICATION,2004,81-392[11]潘承毅,何迎辉.数理统计的原理与方法[M].同济大学出版社,1993[12]李贤平.概率论基础[M].高等教育出版社,1996:153-130[13]范金城,吴可法.统计推断导引[M].北京科学出版社,2001[14]方世祖.概率论与数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论