版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
众数的确定(分组数据)众数=25众数的确定(分组数据)众数=251众数的确定(分组数据)组距频数10–14515–19720–241225–291830–342235–391640–441045–498众数为31.5Line1Line2Line3众数的确定(分组数据)组距频数10–14515–12众数的确定(分组数据)L—众数组的真实下限值d1—众数组频数-众数组前一组频数d2—众数组频数-众数组后一组频数i—每组数据的组距个数△众数的确定(分组数据)△3中位数(位置的确定)奇数个数的数据:偶数个数的数据:中位数(位置的确定)奇数个数的数据:偶数个数的数据:4中位数的确定(分组数据)根据位置公式确定中位数所在的组采用下列近似公式计算:L–中位数组的真实组下限的值N–整组数据的总数量Sm-1–中位数组为止以上的累积频数fm–中位数组的频数i–组距的个数中位数的确定(分组数据)根据位置公式确定中位数所在的组5某车间50名工人月产量的资料如下:
月产量(件)工人人数(人)向上累计次数(人)200以下200~400400~600600以上373283104250合计50—某车间50名工人月产量的资料如下:
月产量(件)工人人数(人6简单平均数(SimpleMean)设一组数据为:X1,X2,…,Xn
适用于总体资料未经分组整理、尚为原始资料的情况总体均值
样本均值式中:,μ为均值;N(n)为总体(样本)单位总数;Xi为第i个单位的变量值。简单平均数(SimpleMean)设一组数据为:X1,7算术平均数的计算方法案例分析4.10某售货小组5个人,某天的销售额分别为520元、600元、480元、750元、440元,则平均每人日销售额为:算术平均数的计算方法某售货小组5个人,某天的销售额分别为58加权平均数(WeightedMean)设一组数据为:
x1,x2,…,xn相应的频数为:f1,f2,…,fk
适用于总体资料经过分组整理形成变量数列的情况总体均值
样本均值(未分组)公式中:为均值;f为相应频数;Xi为第i个单位的变量值。加权平均数(WeightedMean)设一组数据为:9加权平均数的计算方法
案例分析4.11某企业某日工人的日产量资料如下:日产量(件)工人人数(人)101112131470100380150100合计800
计算该企业该日全部工人的平均日产量。加权平均数的计算方法
案例分析4.11某企业某日工人的日产10加权平均数的计算方法
案例分析4.11若上述资料为分组数列,则应取各组的组中值作为该组的代表值用于计算;此时求得的算术平均数只是其真值的近似值。加权平均数的计算方法
案例分析4.1111简单平均数与加权平均数
(SimpleMean/WeightedMean)设一组数据为:
x1,x2,…,xn各组的组中值为:M1,M2,…,Mk相应的频数为:
f1,f2,…,fk简单平均数加权平均数(分组数据)表示各组的变量值(分组数列的组中值);表示各组变量值出现的频数(即权数)。简单平均数与加权平均数
(SimpleMean/Wei12
例:根据某电脑公司在各市场上销售量的分组数据,计算电脑销售量的均值。
按销售量分组(台)组中值(Mi)市场个数(fi)Mifi
140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084558013952640472537003315205017209001175合计—
∑fi=
120∑Mifi
=22200例:根据某电脑公司在各市场上销售量的分组数据,计算电脑销售13样本方差和标准差
(SampleVarianceandStandardDeviation)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!样本方差和标准差
(SampleVarianceand14样本标准差
例题分析
4.18某电脑公司销售量数据平均差计算表按销售量分组组中值(Mi)频数(fi)140—150150—160160—170170—180180—190190—200200—210210—220220—230230—240145155165175185195205215225235491627201710845160090040010001004009001600250064008100640027000170040007200640012500合计—120—55400样本标准差例题分析4.18某电脑公司销售量数据平均差计15样本标准差例题分析
4.18
结论:每一天的销售量与平均数相比,平均相差21.58台样本标准差例题分析4.1816练习题4.1某百货公司6月份各天的销售额数据如下(单位:万元):(1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。
练习题4.1某百货公司6月份各天的销售额数据如下(单位:17解答4.1均值:中位数:位置为第15位和第16位四分位数:中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15个数据的中间位置(第8位)靠上四分之一的位置上后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273。标准差:21.17解答4.1均值:18练习题4.2在某地区抽取的120家企业按利润额进行分组,结果如下:计算120家企业利润额的均值和标准差。练习题4.2在某地区抽取的120家企业按利润额进行分组,19解答4.2各组平均利润为x,企业数为f,则组总利润为xf,由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:均值:解答4.2各组平均利润为x,企业数为f,则组总利润为x20解答4.2标准差:解答4.221一个总体参数的区间估计总体参数符号表示样本统计量均值比例方差一个总体参数的区间估计总体参数符号表示样本统计量均值比例方差22总体均值的区间估计
(大样本n
30)假定条件总体服从正态分布,且方差(2)
已知如果不是正态分布,可由正态分布来近似(n
30)使用正态分布统计量z总体均值在1-置信水平下的置信区间为总体均值的区间估计
(大样本n30)假定条件23总体均值的区间估计例题分析6.2一家食品生产企业以生产袋装食品为主,为对食品质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%。25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3总体均值的区间估计例题分析6.2一家食品生产企业以生产袋24总体均值的区间估计例题分析6.2解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根据样本数据计算得:。由于是正态总体,且方差已知。总体均值在1-置信水平下的置信区间为因此:食品平均重量的置信区间为101.44g~109.28g总体均值的区间估计例题分析6.2解:已知X~N(,1025总体均值的区间估计例题分析6.3一家保险公司收集到由36个投保人组成的随机样本,得到每个投保人的年龄(单位:周岁)数据如下表。试建立投保人年龄90%的置信区间。36个投保人年龄的数据233539273644364246433133425345544724342839364440394938344850343945484532总体均值的区间估计例题分析6.3一家保险公司收集到由3626总体均值的区间估计例题分析6.3解:已知n=36,1-=90%,z/2=1.645。根据样本数据计算得:,
总体均值在1-置信水平下的置信区间为因此:在置信水平为90%的情况下,投保人平均年龄的置信区间为37.37岁~41.63岁。总体均值的区间估计例题分析6.3解:已知n=36,1-27总体均值的区间估计(小样本)假定条件总体服从正态分布,但方差(2)
未知小样本(n<30)使用t分布统计量总体均值在1-置信水平下的置信区间为总体均值的区间估计(小样本)假定条件28总体均值的区间估计例题分析6.4已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(单位:h)如下。建立该批灯泡平均使用寿命95%的置信区间。16灯泡使用寿命的数据1510152014801500145014801510152014801490153015101460146014701470总体均值的区间估计例题分析6.4已知某种灯泡的寿命服从正29总体均值的区间估计例题分析6.4解:已知X~N(,2),n=16,1-=95%,t/2=2.131根据样本数据计算得:,
总体均值在1-置信水平下的置信区间为:因此,该种灯泡平均使用寿命的置信区间为1476.8h~1503.2h总体均值的区间估计例题分析6.4解:已知X~N(,230总体比例的区间估计假定条件总体服从二项分布可以由正态分布来近似使用正态分布统计量z总体比例在1-置信水平下的置信区间为总体比例的区间估计假定条件31总体比例的区间估计例题分析6.5某城市想要估计下岗职工中女性所占的比例,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间解:已知n=100,p=65%,1-=95%,z/2=1.96因此,该城市下岗职工中女性比例的置信区间为55.65%~74.35%
总体比例的区间估计例题分析6.5某城市想要估计下岗职工中32总体方差的区间估计估计一个总体的方差或标准差假设总体服从正态分布总体方差2的点估计量为s2,且总体方差在1-置信水平下的置信区间为4.总体方差的区间估计估计一个总体的方差或标准差4.33总体方差的区间估计例题分析6.6一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间。
25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3总体方差的区间估计例题分析6.6一家食品生产企业以生产袋34总体方差的区间估计例题分析6.6解:已知n=25,1-=95%,根据样本数据计算得
s2=93.21
2置信度为95%的置信区间为因此,该企业生产的食品总体重量标准差的的置信区间为7.54g~13.43g总体方差的区间估计例题分析6.6解:已知n=25,1-35一个总体参数的区间估计(小结)待估参数均值比例方差大样本小样本大样本2分布2已知2已知Z分布2未知Z分布Z分布Z分布2未知t分布一个总体参数的区间估计(小结)待估参数均值比例方差大样本36练习题
6.1从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。样本均值的抽样标准差等于多少?在95%的置信水平下,允许误差是多少?练习题6.1从一个标准差为5的总体中抽出一个容量为40的样37解答
6.1解答6.138练习题
6.2某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。假定总体标准差为15元,求样本均值的抽样标准误差;在95%的置信水平下,求允许误差;如果样本均值为120元,求总体均值95%的置信区间。练习题6.2某快餐店想要估计每位顾客午餐的平均花费金额,在39解答
6.2解答6.240练习题
6.3某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(公里)分别是:103148691211751015916132求职工上班从家里到单位平均距离95%的置信区间。练习题6.3某居民小区为研究职工上班从家里到单位的距离,抽41解答
6.3解:已知X~N(,2),n=16,1-=95%,t/2=2.131根据样本数据计算得:,
总体均值在1-置信水平下的置信区间为:因此,职工上班从家里到单位平均距离的置信区间为7.153(公里)~11.597(公里).解答6.3解:已知X~N(,2),n=16,1-42练习题
6.4某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。(1)求总体中赞成该项改革的户数比率的置信区间,置信水平为95%;(2)如果小区管理者预计赞成的比率能达到80%,应抽取多少户进行调查?练习题6.4某居民小区共有居民500户,小区管理者准备采取43解答
6.4解答6.444练习题
6.5根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求允许误差不超过4%,应抽取多大的样本?练习题6.5根据以往的生产数据,某种产品的废品率为2%。如45解答
6.5解答6.546检验2
已知均值的检验
例题分析7.1某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05)双侧检验检验2已知均值的检验
例题分析7.1某机床厂加工一种472
已知均值的检验
(小样本例题分析7.2)根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(=0.05)单侧检验2已知均值的检验
(小样本例题分析7.2)根据过去大482
未知大样本均值的检验
(例题分析7.3)某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(=0.05)单侧检验2未知大样本均值的检验
(例题分析7.3)某电子元件492
未知小样本均值的检验
(例题分析7.4)某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。双侧检验2未知小样本均值的检验
(例题分析7.4)某机器制造502
未知小样本均值的检验
(例题分析7.5)一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(=0.05)单侧检验!2未知小样本均值的检验
(例题分析7.5)一个汽车51总体比例的检验
(例题分析7.6)一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(=0.05)双侧检验总体比例的检验
(例题分析7.6)一项统计结果声称,某市52方差的卡方(2)
检验
(例题分析7.7)某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求(=0.05)0.3-0.4-0.71.4-0.6-0.3-1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1双侧检验方差的卡方(2)检验
(例题分析7.7)某厂商生产出53用置信区间进行检验
(例题分析7.8)
一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试确定这批产品的包装重量是否合格?(=0.05)双侧检验!香脆蛋卷用置信区间进行检验
(例题分析7.8)一种袋542
已知均值的检验
例题分析7.1H0:=0.081H1:
0.081=0.05n=200临界值(s):检验统计量:Z01.96-1.96.025拒绝H0拒绝H0.025决策:结论:
因为Z0.025=1.96,-2.83<-1.96在=0.05的水平上,拒绝H0有证据表明新机床加工的零件的椭圆度与以前有显著差异。2已知均值的检验
例题分析7.1H0:=0.552
已知均值的检验
(小样本例题分析7.2)H0:
1020H1:>1020=0.05n=16临界值(s):检验统计量:
因为Z0.05=1.645,2.4>1.645在=0.05的水平上,拒绝H0有证据表明这批灯泡的使用寿命有显著提高。决策:结论:Z0拒绝域0.051.6452已知均值的检验
(小样本例题分析7.2)H0:562
未知大样本均值的检验
(例题分析7.3)H0:1200H1:>1200=0.05n=100临界值(s):检验统计量:因为Z0.05=1.645,1.5<1.645在=0.05的水平上,不拒绝H0不能认为该厂生产的元件寿命显著地高于1200小时。决策:结论:Z0拒绝域0.051.6452未知大样本均值的检验
(例题分析7.3)H0:572
未知小样本均值的检验
(例题分析7.4)H0:=5H1:
5=0.05df=10-1=9临界值(s):检验统计量:
因为t0.025=2.262,3.16>2.262在=0.05的水平上拒绝H0说明该机器的性能不好。
决策:结论:t02.262-2.262.025拒绝H0拒绝H0.0252未知小样本均值的检验
(例题分析7.4)H0:58均值的单侧t检验
(计算结果)
H0:
≤40000H1:
>40000=0.05df=20-1=19临界值(s):检验统计量:因为t0.05=1.729,0.894<1.729在=0.05的水平上不拒绝H0不能认为制造商的产品同他所说的标准不相符。决策:
结论:
-1.7291t0拒绝域.05t0拒绝域0.051.729均值的单侧t检验
(计算结果)H0:≤400059总体比例的检验
(例题分析7.6)H0:=14.7%H1:
14.7%=0.05n=400临界值(s):检验统计量:因为Z0.025=1.96,-0.254>-1.96在=0.05的水平上不拒绝H0该市老年人口比重为14.7%.决策:结论:Z01.96-1.96.025拒绝H0拒绝H0.025总体比例的检验
(例题分析7.6)H0:=14.60方差的卡方(2)
检验
(例题分析7.7)H0:2=1H1:2
1=0.05df=25-1=24临界值(s):统计量:
在=0.05的水平上不拒绝H0不能认为该机器的性能未达到设计要求
2039.3612.40/2=.05决策:结论:方差的卡方(2)检验
(例题分析7.7)H0:261用置信区间进行检验
(例题分析7.8)H0:
=1000H1:
1000=0.05n=16临界值(s):置信区间为决策:结论:
假设的0=1000在置信区间内,不拒绝H0不能认为这批产品的包装重量不合格。Z01.96-1.96.025拒绝H0拒绝H0.025用置信区间进行检验
(例题分析7.8)H0:=162练习题7.1液晶显示屏批量生产的质量标准为平均使用寿命35000小时。某厂商宣称其生产的液晶显示屏的使用寿命远远超过规定标准。现从该厂商生产的一批液晶显示屏中随机抽取了100件样本进行验证,测得平均使用寿命为35250小时,标准差为1380小时,试在(=0.05)的显著性水平下检验该厂商生产的液晶显示屏是否显著的高于规定标准?练习题7.1液晶显示屏批量生产的质量标准为平均使用寿命363练习题7.2某制盐企业用机器包装食盐,假设每袋食盐的净重量服从正态分布,每袋标准净重量为500克。某天开工后,为检验机器工作是否正常,从包装好的食盐中随机抽取了9袋,测得平均净重量为499克,样本标准差为16.03克,试在(=0.05)的显著性水平下检验这天包装机工作是否正常?练习题7.2某制盐企业用机器包装食盐,假设每袋食盐的净重64练习题7.3
某公司计划为每一位员工配股,董事会估计配股方案在全体员工内的支持率为80%。现随机抽查100名员工,其中支持配股方案的有76人。试在(=0.05)的显著性水平下检验董事会的估计是否可靠?练习题7.3某公司计划为每一位员工配股,董事会估计配股65练习题7.4练习题7.466解答7.1解答7.167解答7.2解答7.268解答7.3解答7.369解答7.4解答7.470方差分析练习题8.1某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到如下表:1)完成方差分析表2)若显著性水平为=0.05,检验三种方法组装的产品数量之间是否有显著差异。方差分析练习题8.1某企业准备用三种方法组装一种新的产品71练习题8.2从三个总体中各抽取容量不同的样本数据,得到下表。检验3个总体的均值之间是否有显著差异.(=0.01)练习题8.2从三个总体中各抽取容量不同的样本数据,得到下72练习题8.3某家电制造公司准备购进一批5#电池,现有A,B,C三个电池生产企业愿意供货,为此比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得出其寿命(小时)数据如下表。试分析三个企业生产的电池的平均寿命之间有无差异。(=0.05)如果有差异,用LSD方法建议哪些企业之间有差异。练习题8.3某家电制造公司准备购进一批5#电池,现有A,73解答8.1F=1.478<F0.05(2,27)=3.354131所以不拒绝原假设,表明不认为三种方法组装的产品之间有显著差异。P值也可以直接用来进行统计决策,若P<,则拒绝原假设,P>,则不拒绝原假设。该题中P=0.245946>=0.05,因此不拒绝原假设H0。解答8.174解答8.2F=4.6574<F0.01(2,9)=8.0215所以不拒绝原假设,表明不认为三个总体均值之间有显著差异。P值也可以直接用来进行统计决策,若P<,则拒绝原假设,P>,则不拒绝原假设。该题中P=0.040877>=0.01,因此不拒绝原假设H0。解答8.275解答8.3F=17.0684>F0.05(2,12)=3.88529所以拒绝原假设,表明三个三个企业生产电池的寿命之间有显著差异。P值也可以直接用来进行统计决策,若P<,则拒绝原假设,P>,则不拒绝原假设。该题中P=0.00031<=0.05,因此不拒绝原假设H0。解答8.376解答8.3第1步:提出假设检验1:检验2:检验3:解答8.3第1步:提出假设77解答8.3第2步:计算检验统计量检验1:检验2:检验3:第3步:计算LSD检验1:检验2:检验3解答8.3第2步:计算检验统计量78解答8.3第4步:作出决策
A电池与B电池寿命有显著差异
不认为A电池与C电池寿命有显著差异B电池与C电池寿命有显著差异解答8.3第4步:作出决策79回归练习题9.1某汽车生产商欲了解广告费用x对销售量y的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:方差分析表变差来源dfSSMSFSignificanceF回归2.17E-09残差220158.07--------总计111642866.67------------回归练习题9.1某汽车生产商欲了解广告费用x对销售量y的80解答9.1变差来源dfSSMSFSignificanceF回归11422708.61422708.664.62212.17E-09残差10220158.0722015.807总计111642866.67解:(2)
由此可知,销售量与广告费用之间的相关系数是0.93。解答9.1变差来源dfSSMSFSignificance81解答9.1(3)估计的回归方程:
回归系数表示广告费用每增加一个单位,销售量平均增加1.420211个单位。(4)F=64.6221>,所以这回归方程是显著的。解答9.1(3)估计的回归方程:82众数的确定(分组数据)众数=25众数的确定(分组数据)众数=2583众数的确定(分组数据)组距频数10–14515–19720–241225–291830–342235–391640–441045–498众数为31.5Line1Line2Line3众数的确定(分组数据)组距频数10–14515–184众数的确定(分组数据)L—众数组的真实下限值d1—众数组频数-众数组前一组频数d2—众数组频数-众数组后一组频数i—每组数据的组距个数△众数的确定(分组数据)△85中位数(位置的确定)奇数个数的数据:偶数个数的数据:中位数(位置的确定)奇数个数的数据:偶数个数的数据:86中位数的确定(分组数据)根据位置公式确定中位数所在的组采用下列近似公式计算:L–中位数组的真实组下限的值N–整组数据的总数量Sm-1–中位数组为止以上的累积频数fm–中位数组的频数i–组距的个数中位数的确定(分组数据)根据位置公式确定中位数所在的组87某车间50名工人月产量的资料如下:
月产量(件)工人人数(人)向上累计次数(人)200以下200~400400~600600以上373283104250合计50—某车间50名工人月产量的资料如下:
月产量(件)工人人数(人88简单平均数(SimpleMean)设一组数据为:X1,X2,…,Xn
适用于总体资料未经分组整理、尚为原始资料的情况总体均值
样本均值式中:,μ为均值;N(n)为总体(样本)单位总数;Xi为第i个单位的变量值。简单平均数(SimpleMean)设一组数据为:X1,89算术平均数的计算方法案例分析4.10某售货小组5个人,某天的销售额分别为520元、600元、480元、750元、440元,则平均每人日销售额为:算术平均数的计算方法某售货小组5个人,某天的销售额分别为590加权平均数(WeightedMean)设一组数据为:
x1,x2,…,xn相应的频数为:f1,f2,…,fk
适用于总体资料经过分组整理形成变量数列的情况总体均值
样本均值(未分组)公式中:为均值;f为相应频数;Xi为第i个单位的变量值。加权平均数(WeightedMean)设一组数据为:91加权平均数的计算方法
案例分析4.11某企业某日工人的日产量资料如下:日产量(件)工人人数(人)101112131470100380150100合计800
计算该企业该日全部工人的平均日产量。加权平均数的计算方法
案例分析4.11某企业某日工人的日产92加权平均数的计算方法
案例分析4.11若上述资料为分组数列,则应取各组的组中值作为该组的代表值用于计算;此时求得的算术平均数只是其真值的近似值。加权平均数的计算方法
案例分析4.1193简单平均数与加权平均数
(SimpleMean/WeightedMean)设一组数据为:
x1,x2,…,xn各组的组中值为:M1,M2,…,Mk相应的频数为:
f1,f2,…,fk简单平均数加权平均数(分组数据)表示各组的变量值(分组数列的组中值);表示各组变量值出现的频数(即权数)。简单平均数与加权平均数
(SimpleMean/Wei94
例:根据某电脑公司在各市场上销售量的分组数据,计算电脑销售量的均值。
按销售量分组(台)组中值(Mi)市场个数(fi)Mifi
140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084558013952640472537003315205017209001175合计—
∑fi=
120∑Mifi
=22200例:根据某电脑公司在各市场上销售量的分组数据,计算电脑销售95样本方差和标准差
(SampleVarianceandStandardDeviation)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!样本方差和标准差
(SampleVarianceand96样本标准差
例题分析
4.18某电脑公司销售量数据平均差计算表按销售量分组组中值(Mi)频数(fi)140—150150—160160—170170—180180—190190—200200—210210—220220—230230—240145155165175185195205215225235491627201710845160090040010001004009001600250064008100640027000170040007200640012500合计—120—55400样本标准差例题分析4.18某电脑公司销售量数据平均差计97样本标准差例题分析
4.18
结论:每一天的销售量与平均数相比,平均相差21.58台样本标准差例题分析4.1898练习题4.1某百货公司6月份各天的销售额数据如下(单位:万元):(1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。
练习题4.1某百货公司6月份各天的销售额数据如下(单位:99解答4.1均值:中位数:位置为第15位和第16位四分位数:中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15个数据的中间位置(第8位)靠上四分之一的位置上后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273。标准差:21.17解答4.1均值:100练习题4.2在某地区抽取的120家企业按利润额进行分组,结果如下:计算120家企业利润额的均值和标准差。练习题4.2在某地区抽取的120家企业按利润额进行分组,101解答4.2各组平均利润为x,企业数为f,则组总利润为xf,由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:均值:解答4.2各组平均利润为x,企业数为f,则组总利润为x102解答4.2标准差:解答4.2103一个总体参数的区间估计总体参数符号表示样本统计量均值比例方差一个总体参数的区间估计总体参数符号表示样本统计量均值比例方差104总体均值的区间估计
(大样本n
30)假定条件总体服从正态分布,且方差(2)
已知如果不是正态分布,可由正态分布来近似(n
30)使用正态分布统计量z总体均值在1-置信水平下的置信区间为总体均值的区间估计
(大样本n30)假定条件105总体均值的区间估计例题分析6.2一家食品生产企业以生产袋装食品为主,为对食品质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%。25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3总体均值的区间估计例题分析6.2一家食品生产企业以生产袋106总体均值的区间估计例题分析6.2解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根据样本数据计算得:。由于是正态总体,且方差已知。总体均值在1-置信水平下的置信区间为因此:食品平均重量的置信区间为101.44g~109.28g总体均值的区间估计例题分析6.2解:已知X~N(,10107总体均值的区间估计例题分析6.3一家保险公司收集到由36个投保人组成的随机样本,得到每个投保人的年龄(单位:周岁)数据如下表。试建立投保人年龄90%的置信区间。36个投保人年龄的数据233539273644364246433133425345544724342839364440394938344850343945484532总体均值的区间估计例题分析6.3一家保险公司收集到由36108总体均值的区间估计例题分析6.3解:已知n=36,1-=90%,z/2=1.645。根据样本数据计算得:,
总体均值在1-置信水平下的置信区间为因此:在置信水平为90%的情况下,投保人平均年龄的置信区间为37.37岁~41.63岁。总体均值的区间估计例题分析6.3解:已知n=36,1-109总体均值的区间估计(小样本)假定条件总体服从正态分布,但方差(2)
未知小样本(n<30)使用t分布统计量总体均值在1-置信水平下的置信区间为总体均值的区间估计(小样本)假定条件110总体均值的区间估计例题分析6.4已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(单位:h)如下。建立该批灯泡平均使用寿命95%的置信区间。16灯泡使用寿命的数据1510152014801500145014801510152014801490153015101460146014701470总体均值的区间估计例题分析6.4已知某种灯泡的寿命服从正111总体均值的区间估计例题分析6.4解:已知X~N(,2),n=16,1-=95%,t/2=2.131根据样本数据计算得:,
总体均值在1-置信水平下的置信区间为:因此,该种灯泡平均使用寿命的置信区间为1476.8h~1503.2h总体均值的区间估计例题分析6.4解:已知X~N(,2112总体比例的区间估计假定条件总体服从二项分布可以由正态分布来近似使用正态分布统计量z总体比例在1-置信水平下的置信区间为总体比例的区间估计假定条件113总体比例的区间估计例题分析6.5某城市想要估计下岗职工中女性所占的比例,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间解:已知n=100,p=65%,1-=95%,z/2=1.96因此,该城市下岗职工中女性比例的置信区间为55.65%~74.35%
总体比例的区间估计例题分析6.5某城市想要估计下岗职工中114总体方差的区间估计估计一个总体的方差或标准差假设总体服从正态分布总体方差2的点估计量为s2,且总体方差在1-置信水平下的置信区间为4.总体方差的区间估计估计一个总体的方差或标准差4.115总体方差的区间估计例题分析6.6一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间。
25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3总体方差的区间估计例题分析6.6一家食品生产企业以生产袋116总体方差的区间估计例题分析6.6解:已知n=25,1-=95%,根据样本数据计算得
s2=93.21
2置信度为95%的置信区间为因此,该企业生产的食品总体重量标准差的的置信区间为7.54g~13.43g总体方差的区间估计例题分析6.6解:已知n=25,1-117一个总体参数的区间估计(小结)待估参数均值比例方差大样本小样本大样本2分布2已知2已知Z分布2未知Z分布Z分布Z分布2未知t分布一个总体参数的区间估计(小结)待估参数均值比例方差大样本118练习题
6.1从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。样本均值的抽样标准差等于多少?在95%的置信水平下,允许误差是多少?练习题6.1从一个标准差为5的总体中抽出一个容量为40的样119解答
6.1解答6.1120练习题
6.2某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。假定总体标准差为15元,求样本均值的抽样标准误差;在95%的置信水平下,求允许误差;如果样本均值为120元,求总体均值95%的置信区间。练习题6.2某快餐店想要估计每位顾客午餐的平均花费金额,在121解答
6.2解答6.2122练习题
6.3某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(公里)分别是:103148691211751015916132求职工上班从家里到单位平均距离95%的置信区间。练习题6.3某居民小区为研究职工上班从家里到单位的距离,抽123解答
6.3解:已知X~N(,2),n=16,1-=95%,t/2=2.131根据样本数据计算得:,
总体均值在1-置信水平下的置信区间为:因此,职工上班从家里到单位平均距离的置信区间为7.153(公里)~11.597(公里).解答6.3解:已知X~N(,2),n=16,1-124练习题
6.4某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。(1)求总体中赞成该项改革的户数比率的置信区间,置信水平为95%;(2)如果小区管理者预计赞成的比率能达到80%,应抽取多少户进行调查?练习题6.4某居民小区共有居民500户,小区管理者准备采取125解答
6.4解答6.4126练习题
6.5根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求允许误差不超过4%,应抽取多大的样本?练习题6.5根据以往的生产数据,某种产品的废品率为2%。如127解答
6.5解答6.5128检验2
已知均值的检验
例题分析7.1某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05)双侧检验检验2已知均值的检验
例题分析7.1某机床厂加工一种1292
已知均值的检验
(小样本例题分析7.2)根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(=0.05)单侧检验2已知均值的检验
(小样本例题分析7.2)根据过去大1302
未知大样本均值的检验
(例题分析7.3)某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(=0.05)单侧检验2未知大样本均值的检验
(例题分析7.3)某电子元件1312
未知小样本均值的检验
(例题分析7.4)某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。双侧检验2未知小样本均值的检验
(例题分析7.4)某机器制造1322
未知小样本均值的检验
(例题分析7.5)一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(=0.05)单侧检验!2未知小样本均值的检验
(例题分析7.5)一个汽车133总体比例的检验
(例题分析7.6)一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(=0.05)双侧检验总体比例的检验
(例题分析7.6)一项统计结果声称,某市134方差的卡方(2)
检验
(例题分析7.7)某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求(=0.05)0.3-0.4-0.71.4-0.6-0.3-1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1双侧检验方差的卡方(2)检验
(例题分析7.7)某厂商生产出135用置信区间进行检验
(例题分析7.8)
一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试确定这批产品的包装重量是否合格?(=0.05)双侧检验!香脆蛋卷用置信区间进行检验
(例题分析7.8)一种袋1362
已知均值的检验
例题分析7.1H0:=0.081H1:
0.081=0.05n=200临界值(s):检验统计量:Z01.96-1.96.025拒绝H0拒绝H0.025决策:结论:
因为Z0.025=1.96,-2.83<-1.96在=0.05的水平上,拒绝H0有证据表明新机床加工的零件的椭圆度与以前有显著差异。2已知均值的检验
例题分析7.1H0:=0.1372
已知均值的检验
(小样本例题分析7.2)H0:
1020H1:>1020=0.05n=16临界值(s):检验统计量:
因为Z0.05=1.645,2.4>1.645在=0.05的水平上,拒绝H0有证据表明这批灯泡的使用寿命有显著提高。决策:结论:Z0拒绝域0.051.6452已知均值的检验
(小样本例题分析7.2)H0:1382
未知大样本均值的检验
(例题分析7.3)H0:1200H1:>1200=0.05n=100临界值(s):检验统计量:因为Z0.05=1.645,1.5<1.645在=0.05的水平上,不拒绝H0不能认为该厂生产的元件寿命显著地高于1200小时。决策:结论:Z0拒绝域0.051.6452未知大样本均值的检验
(例题分析7.3)H0:1392
未知小样本均值的检验
(例题分析7.4)H0:=5H1:
5=0.05df=10-1=9临界值(s):检验统计量:
因为t0.025=2.262,3.16>2.262在=0.05的水平上拒绝H0说明该机器的性能不好。
决策:结论:t02.262-2.262.025拒绝H0拒绝H0.0252未知小样本均值的检验
(例题分析7.4)H0:140均值的单侧t检验
(计算结果)
H0:
≤40000H1:
>40000=0.05df=20-1=19临界值(s):检验统计量:因为t0.05=1.729,0.894<1.729在=0.05的水平上不拒绝H0不能认为制造商的产品同他所说的标准不相符。决策:
结论:
-1.7291t0拒绝域.05t0拒绝域0.051.729均值的单侧t检验
(计算结果)H0:≤4000141总体比例的检验
(例题分析7.6)H0:=14.7%H1:
14.7%=0.05n=400临界值(s):检验统计量:因为Z0.025=1.96,-0.254>-1.96在=0.05的水平上不拒绝H0该市老年人口比重为14.7%.决策:结论:Z01.96-1.96.025拒绝H0拒绝H0.025总体比例的检验
(例题分析7.6)H0:=14.142方差的卡方(2)
检验
(例题分析7.7)H0:2=1H1:2
1=0.05df=25-1=24临界值(s):统计量:
在=0.05的水平上不拒绝H0不能认为该机器的性能未达到设计要求
2039.3612.40/2=.05决策:结论:方差的卡方(2)检验
(例题分析7.7)H0:2143用置信区间进行检验
(例题分析7.8)H0:
=1000H1:
1000=0.05n=16临界值(s):置信区间为决策:结论:
假设的0=1000在置信区间内,不拒绝H0不能认为这批产品的包装重量不合格。Z01.96-1.96.025拒绝H0拒绝H0.025用置信区间进行检验
(例题分析7.8)H0:=1144练习题7
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版市政绿化施工合同三方协议(生态宜居版)2篇
- 2025版晚会摄像保密协议(全新版)3篇
- 科技与教育结合利用科技手段辅助孩子阅读经典
- 家庭教育指导服务在特殊儿童教育中的实践
- 科技赋能家庭运动助力孩子健康成长
- 浙江省强基联盟2022-2023学年高三上学期12月联考(一模)政治试题 含解析
- 个人借款合同延期合同范本(2024年版)版B版
- 高效能朗读练习对小学生英语口语能力的促进作用
- 2025版小动物领养及养护责任协议3篇
- 玉溪云南玉溪市公安局红塔分局招聘警务辅助人员41人笔试历年参考题库附带答案详解
- 农产品农药残留检测及风险评估
- 农村高中思想政治课时政教育研究的中期报告
- 20100927-宣化上人《愣严咒句偈疏解》(简体全)
- 4-熔化焊与热切割作业基础知识(一)
- 单元教学评一体化设计的探索与实践以统编语文教材四年级下册第一单元为例
- 个人安全与社会责任的基本知识概述
- 医院标识牌方案设计2
- 移动商务内容运营(吴洪贵)任务二 有效传播模式的设计
- 简易劳务合同电子版
- 明代文学绪论
- 体育赛事的策划、组织与实施 体育赛事利益相关者
评论
0/150
提交评论