华中科技大学数理统计第二次作业_第1页
华中科技大学数理统计第二次作业_第2页
华中科技大学数理统计第二次作业_第3页
华中科技大学数理统计第二次作业_第4页
华中科技大学数理统计第二次作业_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华中科技大学数理统计第二次作业华中科技大学数理统计第二次作业华中科技大学数理统计第二次作业资料仅供参考文件编号:2022年4月华中科技大学数理统计第二次作业版本号:A修改号:1页次:1.0审核:批准:发布日期:学院:机械工程学院1、收集到26家保险公司人员构成的数据,现希望对目前保险公司从业人员受高等教育的程度和年轻化的程度进行推断,具体来说就是推断具有高等教育水平的员工平均比例是否低于80%,35岁以下的年轻人的平均比例是否为。(数据见练习2数据.xls—练习)解:希望通过分析这26家保险公司人员构成的数据,研究目前保险公司从业人员受高等教育的程度和年轻化的程度。(1)推断高等教育水平的员工平均比例是否低于80%设原假设:保险公司具有高等教育水平的员工比例平均值不低于,即Hμ=μ≥备择假设:H:μ<n=26,属于小样本,由于σ2未知,选用t检验,检验统计量,取α=计算的=,s2=拒绝域:,查t检验分布表知临界值t=显然,t=<-t=,因此在α=的水平上拒绝原假设,选择备择假设结论:保险公司具有高等教育水平的员工比例平均值低于(2)推断35岁以下的年轻人的平均比例是否为设原假设:年轻人比例的平均值与无显著性差异,即Hμ=μ=备择假设H:μ≠.n=26,属于小样本,由于σ2未知,选用t检验,检验统计量,取α=计算的=,s2=拒绝域:,查表知α=的双尾t检验临界值t(25)=。故超出[,]的值均在拒绝域内由于t=不在拒绝域[,]范围内,因此在α=的水平上拒绝原假设,选择备择假设结论:保险公司35岁以下年轻人比例平均值不等于2、练习1中保险公司的类别分为:1.全国性公司;2.区域性公司;3.外资和中外合资公司。试分析公司类别1与3的人员构成中,具有高等教育水平的员工比例的均值是否存在显著性的差异。(数据见练习2数据.xls—练习)解:设原假设H:μ-μ=0,即公司类别1与3具有高等教育水平的员工比例均值无显著性差异备择假设H:μ-μ≠0,α=.利用双尾t检验,选择统计量为由数据可得=,=,SX2=,SY2=查表知t(8+16-2)=,所以接收域为[,]由两个样本(1类和3类公司受高等教育人数比例)均值和标准差求得检验统计量t=超出接收域,故拒绝原假设,接收备择假设。结论:具有高等教育水平的员工比例的均值存在显著性的差异3、欲研究不同收入群体对某种特定商品是否有相同的购买习惯,市场研究人员调查了4个不同收入组的消费者共527人,购买习惯分别为:经常购买,不购买,有时购买。要求:(1)提出假设;(2)计算x2值;(3)以99%的显著性水平进行检验。(数据见练习2数据.xls—练习)解:(1)设原假设H:不同收入人群对该商品有相同购买习惯,即μ=μμ=μ备择假设H:不同收入人群对该商品购买习惯不同,即μ、μμ、μ(2)根据公式算出对应的期望值f使用EXCLE进行运算得x为17.自由度为(4-1)*(3-1)=6(3)自由度为=(R-1)(r-1)=(4-1)*(3-1)=6α=时,可以查表得:X2()(6)=拒绝域为;,+X2>X2α,故拒绝原假设H0,即认为不同收入群体对某种特定商品,没有相同的购买习惯结论:不同收入人群对该商品购买习惯不同4、由我国某年沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据,采用各种非参数检验方法进行检验,判断它们的分布是否存在显著性差异,并进行评价。(数据见练习2数据.xls—练习)解:(1)曼-惠特尼U检验设原假设H:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据的分布不存在显著性差异备择假设H:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据的分布存在显著性差异沿海样本数量m=12,非沿海样本数量n=18,故WilcoxonW=W=180U=(n+1)=9大样本,Z=<-3,拒绝原假设,选择备择假设结论:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据的分布存在显著性差异。(2)K-S检验设原假设H:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据的分布不存在显著性差异备择假设H:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据的分布存在显著性差异将这两组样本混合并按升序排序,分别计算两组样本秩的累计频数和累计频率,计算累计频率之差,得到秩的差值序列并得到D=查表得p>>(1-α)=结论:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据的分布存在显著性差异。(3)游程检验设原假设H:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据的分布不存在显著性差异备择假设H:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据的分布存在显著性差异由上表可知游程r=6μr=2mnm+n=σr2=2mn(2mn−m−n)(m+n)2(m+n−1)=Z=r-μrσr=p=<α=,拒绝H0结论:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据的分布存在显著性差异。5、某企业在制定某商品的广告策略时,收集了该商品在不同地区采用不同广告形式促销后的销售额数据,希望对广告形式和地区是否对商品销售额产生影响进行分析,以商品销售额为因变量,广告形式和地区为自变量,通过单因素方差分析方法分别对广告形式、地区对销售额的影响进行分析;试进一步分析,究竟哪种广告形式的作用较明显,哪种不明显,以及销售额和地区之间的关系等。试分析广告形式、地区以及两者的交互作用是否对商品销售额产生影响。(数据见练习2数据.xls—练习,其中广告形式为:1.报纸;2.广播;3.宣传品;4.体验)解:a)设4种不同的广告形式后的销售额均值分别为μ、μ、μ、μ,则原假设H及备择假设H分别为:H:4种不同的广告形式对销售额无显著性影响,即μ=μ=μ=μ。H:4种不同的广告形式对销售额有显著性影响,即μ、μ、μ、μ不全相等。利用Excel数据分析中单因素方差分析可得,当α=时,F=>F(3,140)=,所以拒绝H,即有证据表明4种不同的广告形式对销售额有显著性影响。设18个地区的销售额均值为μ(i=1,2,3,···18),则原假设H及备择假设H分别为:H:地区对销售额无显著性影响,即μ=μ=μ=μ=···=μ=μ=μ=μ。H:地区对销售额有显著性影响,即μ、μ、μ、μ···μ、μ、μ不全相等。利用Excel数据分析中单因素方差分析可得,当α=时,F=>F(17,126)=,所以拒绝H,即有证据表明地区对销售额有显著性影响。b)利用最小显著差异方法LSD进行分析,原假设H及备择假设H分别为:H:μ=μ(第i个总体的均值等于第j个总体的均值)H:μ≠μ(第i个总体的均值不等于第j个总体的均值)由公式,n1=n2=n3=n4=36,MSE=,α=,得LSD=。根据前面表中的计算结果x̅1=,x̅2=,x̅3=,x̅4=,计算统计检验量。|x̅1-x̅2|=–=<所以广告形式1和广告形式2对销售额无显著性影响。|x̅1-x̅3|=–=>所以广告形式1和广告形式3对销售额有显著性影响。|x̅1-x̅4|=–=>所以广告形式1和广告形式4对销售额有显著性影响。|x̅2-x̅3|=–=>所以广告形式2和广告形式3对销售额有显著性影响。|x̅2-x̅4|=–=<所以广告形式2和广告形式4对销售额无显著性影响。|x̅3-x̅4|=–=>所以广告形式3和广告形式4对销售额有显著性影响。广告形式与销售额的关系强度R=地区与销售额的关系强度R=结论:广告形式和地区相比,广告形式与销售额的关系强度较低,地区与销售额的关系强度较高。c)对因素A提出的假设为H:4种不同的广告形式对销售额无显著性影响,即μ=μ=μ=μ。H:4种不同的广告形式对销售额有显著性影响,即μ、μ、μ、μ不全相等。对因素B提出的假设为H:地区对销售额无显著性影响,即μ=μ=μ=μ=···=μ=μ=μ=μ。H:地区对销售额有显著性影响,即μ、μ、μ、μ···μ

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论