版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章统计数据的概括性度量4.1一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:24710101012121415要求:1)计算汽车销售量的众数、中位数和平均数。根据定义公式计算四分位数。计算销售量的标准差。说明汽车销售量分布的特征。解:Statistics汽车销售数量NValidMissingMeanMedianModeStd.DeviationPercentiles255075Histogram32ycneuqerF1Mean=9.6Std.Dev.=4.169N=1002.5 5 7.5 10 12.5 15汽车销售数量4.2 随机抽取 25个网络用户,得到他们的年龄数据如下:1915292523213822302019192327223441203117要求;计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄
10010单位:周岁2418162423FrequencyPercentCumulativeFrequencyCumulativePercent151116121713181419372029211102221223315Valid242172511827119291203012131122341233812441125Total25从频数看出,众数 Mo有两个:19、23;从累计频数看,中位数 Me=23。根据定义公式计算四分位数。Q1位置=25/4=,因此Q1=19,Q3位置=3×25/4=,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+×2=。计算平均数和标准差;Mean=;Std.Deviation=计算偏态系数和峰态系数:Skewness=;Kurtosis=对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=、呈右偏分布。如需看清楚分布形态,需要进行分组。为分组情况下的直方图:32tnuoC1015 16 17 18 19 20 21 22 23 24 25 27 29 30 31 34 38 41网络用户的年龄为分组情况下的概率密度曲线:3.02.5tnu 2.0oC1.51.0151617181920212223242527293031343841网络用户的年龄分组:1、确定组数:K1lg(n)1lg2511.398lg(2)lg25.64,取k=60.301032、确定组距:组距=(最大值-最小值)÷组数=(41-15)÷6=,取53、分组频数表网络用户的年龄(Binned)FrequencyPercentCumulativeFrequencyCumulativePercent<=151116-208921-25918Valid26-3032131-3522336-4012441+125Total25分组后的均值与方差:MeanStd.DeviationVarianceSkewnessKurtosis分组后的直方图:108y 6cneuqerF42Mean=23.30Std.Dev.=7.024N=25010.00 15.00 20.00 25.00 30.00 35.00 40.00 45.00 50.00组中值4.3某银行为缩短顾客到银行办理业务等待的时间。准备采用两种排队方式进行试验:一种是所有颐客都进入一个等待队列: 另—种是顾客在三千业务窗口处列队 3排等待。为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取 9名顾客。得到第一种排队方式的平均等待时间为 7.2分钟,标准差为 1.97分钟。第二种排队方式的等待时间 (单位:分钟)如下:5.56.66.76.87.17.37.47.87.8要求:画出第二种排队方式等待时间的茎叶图。第二种排队方式的等待时间 (单位:分钟 )Stem-and-LeafPlotFrequency Stem&LeafExtremes (=<6.6787.1347.88Stemwidth:Eachleaf: 1case(s)计算第二种排队时间的平均数和标准差。Mean7Std.DeviationVariance比较两种排队方式等待时间的离散程度。第二种排队方式的离散程度小。如果让你选择一种排队方式,你会选择哪—种?试说明理由。选择第二种,均值小,离散程度小。4.4某百货公司6月份各天的销售额数据如下:单位:万元257276297252238310240236265278271292261281301274267280291258272284268303273263322249269295要求:计算该百货公司日销售额的平均数和中位数。按定义公式计算四分位数。计算日销售额的标准差。解:Statistics百货公司每天的销售额(万元)NValid30Missing0MeanMedianStd.DeviationPercentiles2550754.5甲乙两个企业生产三种产品的单位成本和总成本资料如下:产品单位成本总成本(元)名称(元)甲企业乙企业A1521003255B2030001500C3015001500要求:比较两个企业的总平均成本,哪个高,并分析其原因。产品名称单位成本(元)甲企业乙企业总成本(元)产品数总成本(元)产品数A1521001403255217B203000150150075C30150050150050平均成本(元)19.18.调和平均数计算,得到甲的平均成本为;乙的平均成本为。甲的中间成本的产品多,乙的低成本的产品多。4.6在某地区抽取120家企业,按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)200~30019300~40030400~50042500~60018600以上11合计120要求:计算120家企业利润额的平均数和标准差。计算分布的偏态系数和峰态系数。解:Statistics企业利润组中值 Mi(万元)N Valid 120Missing 0MeanStd.DeviationSkewnessStd.ErrorofSkewnessKurtosisStd.ErrorofKurtosisHistogramycneuqerF
50403020100
Mean=426.67Std.Dev.=116.484N=120200.00 300.00 400.00 500.00 600.00 700.00企业利润组中值Mi(万元)Casesweightedby 企业个数4.7 为研究少年儿童的成长发育状况, 某研究所的一位调查人员在某城市抽取 100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了 1000名7~17岁的少年儿童作为样本。请回答下面的问题,并解释其原因。(1)两位调查人员所得到的样本的平均身高是否相同 ?如果不同,哪组样本的平均身高较大 ?(2)两位调查人员所得到的样本的标准差是否相同 ?如果不同,哪组样本的标准差较大 ?(3)两位调查人员得到这 l100名少年儿童身高的最高者或最低者的机会是否相同 ?如果不同,哪位调查研究人员的机会较大 ?解:(1)不一定相同,无法判断哪一个更高,但可以判断,样本量大的更接近于总体平均身高。2)不一定相同,样本量少的标准差大的可能性大。3)机会不相同,样本量大的得到最高者和最低者的身高的机会大。4.8 一项关于大学生体重状况的研究发现.男生的平均体重为 60kg,标准差为 5kg;女生的平均体重为50kg,标准差为 5kg。请回答下面的问题:是男生的体重差异大还是女生的体重差异大?为什么?女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。以磅为单位(1ks=2.2lb),求体重的平均数和标准差。都是各乘以,男生的平均体重为 60kg×=132.6磅,标准差为 5kg×=11.05磅;女生的平均体重为50kg×=110.5磅,标准差为 5kg×=11.05磅。(3)粗略地估计一下,男生中有百分之几的人体重在 55kg一65kg之间?计算标准分数:Z1= x x=5560=-1;Z2=xx=6560=1,根据经验规则,男生大约有 68%的人体重在 55kgs 5 s 565kg之间。(4)粗略地估计一下,女生中有百分之几的人体重在 40kg~60kg之间?计算标准分数:Z1= x x=4050=-2;Z2=xx=6050=2,根据经验规则,女生大约有 95%的人体重在 40kgs 5 s 560kg之间。4.9 一家公司在招收职员时,首先要通过两项能力测试。在 A项测试中,其平均分数是 100分,标准差是15分;在B项测试中,其平均分数是 400分,标准差是 50分。一位应试者在 A项测试中得了 115分,在B项测试中得了 425分。与平均分数相比,该应试者哪一项测试更为理想 ?解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。xx115100xx425400Z===1;Z===A15Bs50s因此,A项测试结果理想。4.10一条产品生产线平均每天的产量为3700件,标准差为50件。如果某一天的产量低于或高于平均产量,并落人士2个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生产线哪几天失去了控制?时间周一周二周三周四周五周六周日产量(件)3850367036903720361035903700时间周一周二周三周四周五周六周日产量(件)3850367036903720361035903700日平均产量3700日产量标准差50标准分数Z30标准分数界限-2-2-2-2-2-2-22222222周六超出界限,失去控制。4.11对10名成年人和10名幼儿的身高进行抽样调查,结果如下:成年组166169l72177180170172174168173幼儿组686968707l7372737475要求:(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么?均值不相等,用离散系数衡量身高差异。(2)比较分析哪一组的身高差异大?成年组幼儿组平均平均标准差标准差离散系数离散系数幼儿组的身高差异大。4.12一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量:单位:个方法A方法B方法C164129125167130126168129126165130127170131126165]30128164129127168127126164128127162128127163127125166128126167128116166125126165132125要求:(1)你准备采用什么方法来评价组装方法的优劣 ?均值不相等,用离散系数衡量身高差异。(2)如果让你选择一种方法,你会作出怎样的选择 ?试说明理由。解:对比均值和离散系数的方法,选择均值大,离散程度小的。方法A方法B方法C平均 平均 平均标 准标 准标 准差 差 差离散系数: VA=,VB=,VC=均值A方法最大,同时 A的离散系数也最小,因此选择 A方法。4.13在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。(1)你认为该用什么样的统计量来反映投资的风险 ?标准差或者离散系数。(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票 ?选择离散系数小的股票,则选择商业股票。(3)如果进行股票投资,你会选择商业类股票还是高科技类股票 ?考虑高收益,则选择高科技股票;考虑风险,则选择商业股票。第五章 概率与概率分布略P(AB)=P(A)+P(B)-P(A+B)=50%+60%-85%=35%因为PABPABP(AB)=1/3;PBP(A(B+B))=P(AB)PAB=1/3PAP(A(B+B))=P(AB)PAB=1/3-1/9=2/9QPABPABP(AB)P(AB)=1;QPA|BPAB/P(B)1/6;PAB1/6*1/31/18PAP(A(B+B))=P(AB)PAB;PAB1/31/185/18同理PBP(B(A+A))=P(AB)PAB;PAB=5/18QPA|BPAB/P(B)11/185/185/187/1211/3(1)P(A)PB0.8*0.70.56;(2)PA+BP(A)+P(B)-P(AB)=0.8+0.7-0.8*0.7=0.94(3)PA+BP(A)+P(B)-2P(AB)=0.8+0.7-2*0.8*0.7=0.38P(B)P(A)PB|A96%*75%=0.72PA|BPAB1/22/3/P(B)3/4贝叶斯公式:PAkPAk)P(B|Ak10%*20%3.63%|B10%*20%50%*50%PAPB|A40%*70%PAkPAk)P(B|Ak50%*50%45.45%|B10%*20%50%*50%PAPB|A40%*70%PAkPAk)P(B|Ak40%*70%50.9%|B10%*20%50%*50%PAPB|A40%*70%贝叶斯公式:PAkPAk)P(B|Ak30%*0.10.249|B30%*0.127%*0.0525%*0.2PAPB|A18%*0.15PAkPAk)P(B|Ak27%*0.050.112|B30%*0.127%*0.0525%*0.2PAPB|A18%*0.15P(x=0)=;P(x=1)=;P(x=2)=P(x=1)=;P(x=10)=;P(x=100)=(2)Ex=1*+10*+100*=27,323x4dx0.15(1)3x3dx2(2)Ex23xdx1.5;Dx181818x:B(5,0.25),学生凭猜测至少答对4道的概率为:P(x4)4415501P(x5)=C50.250.75C50.250.75=P(x=k)=λ^k×e^(-λ)/k!①64P(x=k+1)=λ^(k+1)×e^(-λ)/(k+1)!②/①得P(x=k+1)/P(x=k)=λ/(k+1)令P(x=k+1)/P(x=k)>1, 则λ>k+1,k<λ-1令P(x=k+1)/P(x=k)<1, 则λ<k+1,k>λ-1若λ<2,则P(x=k)随着k增大而减小,∴k=1时最大若λ>2,则P(x=1)<⋯⋯<P(x=[λ-1])<P(x=[λ-1]+1)>P(x=[λ-1]+2)>⋯⋯,k=[λ-1]+1=[λ]是最大综上, λ<2时,k=1;λ>2时,k=[λ](写成分段的形式 ,[] 是取整符号)(2)(2)第六章统计量及其抽样分布调节一个装瓶机使其对每个瓶子的灌装量均值为盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差1.0盎司的正态分布。随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。试确定样本均值偏离总体均值不超过盎司的概率。解:总体方差知道的情况下,均值的抽样分布服从N,2的正态分布,由正态分布,标准化得到n标准正态分布:x~N0,1,因此,样本均值不超过总体均值的概率P为:z=nPxx0.30.3x0.30.3=Pn=P19n19n=P0.9z0.9=20.9-1,查标准正态分布表得0.9=因此,Px0.3=PYY0.30.3x0.30.3=Pn=Pn1nn1n=P|z|0.3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度环境监测系统采购与安装合同
- 2024年建筑工程混凝土材料供应合同
- 2024年度广告媒体采购服务合同
- 农业干旱课件教学课件
- 2024年度智能交通系统集成合同
- 2024屋顶停车设施设计与施工合同
- 2024电视媒体广告合同
- 2024年度自然人汽车租赁合同
- 2024年建筑工程施工质量检测协议
- 2024年度大型设备搬迁安全合同
- 人文地理与城乡规划专业职业生涯规划书
- GB 6514-2023涂装作业安全规程涂漆工艺安全及其通风
- 工程伦理 课件第8、9章 工程、健康与可持续发展;全球化视野下的工程伦理
- 汽车防盗系统维修从入门到精通
- 云服务门禁管理系统
- 2024医药行业政策分析
- 雨污分流监理实施细则
- DD 2022-1.2 岩心数字化技术规程 第2部分:表面图像数字化
- 全国优质课一等奖初中物理九年级《科学探究:欧姆定律》课件
- 中医外科乳房疾病诊疗规范诊疗指南2023版
- 2023-2024年抖音直播行业现状及发展趋势研究报告
评论
0/150
提交评论