版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关于总体分布的估计第1页,共24页,2023年,2月20日,星期四统计的基本思想方法:用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.统计的核心问题:如何根据样本的情况对总体的情况作出一种推断.这里包括两类问题:一类是如何从总体中抽取样本?另一类是如何根据对样本的整理、计算、分析,对总体的情况作出推断.第2页,共24页,2023年,2月20日,星期四用样本的有关情况去估计总体的相应情况,这种估计大体分为两类,一类是用样本频率分布估计总体分布,一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征。
整体介绍:第3页,共24页,2023年,2月20日,星期四
国际奥委会2003年6月29日决定,2008年北京奥运会举办的日期比原定日期推迟两周,改在8月8日至8月24日举行.原因是7月末8月初北京地区得气温高于8月中下旬.下表是随机抽取的近年来北京地区7月25日至8月24日的日最高气温,得到如下样本(单位:ºC)7月25日至8月10日41.937.535.735.437.238.134.733.733.332.534.633.030.831.028.631.528.88月8日至8月24日28.631.528.833.232.530.330.229.833.132.829.425.624.730.030.129.530.3怎样通过上表中的数据,分析比较两时间段的高温(≥33℃)状况呢?问题引入:第4页,共24页,2023年,2月20日,星期四知识新授:1.频数与频率
频数是指一组数据中,某范围内的数据出现的次数;把频数除以数据的总个数,就得到频率.2.频率分布表当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.第5页,共24页,2023年,2月20日,星期四说明:样本频率分布与总体频率分布有什么关系?通过样本的频数分布、频率分布可以估计总体的频率分布.第6页,共24页,2023年,2月20日,星期四7月25日至8月10日41.937.535.735.437.238.134.733.733.332.534.633.030.831.028.631.528.88月8日至8月24日28.631.528.833.232.530.330.229.833.132.829.425.624.730.030.129.530.3时间总天数高温天数频率7月25日至8月10日17110.6478月8日至8月24日1720.118频率分布表:第7页,共24页,2023年,2月20日,星期四3.频率分布条形图时间总天数高温天数频率7月25日至8月10日17110.6478月8日至8月24日1720.118①各长方形长条的宽度要相同.②相邻长条的间距要适当.③长方形长条的高度表示取各值的频率.0.10.20.30.40.50.60.77/25-8/10时间频率8/8-8/24一幅图胜过一千字第8页,共24页,2023年,2月20日,星期四引例从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm).试作出该样本的频率分布表.168165171167170165170152175174165170168169171166164155164158170155166158155160160164156162160170168164174171165179163172180174173159163172167160164169151168158168176155165165169162177158175165169151163166163167178165158170169159155163153155167163164158168167161162167168161165174156167166162161164166第9页,共24页,2023年,2月20日,星期四这个例子与前面问题是不同的,这里的总体可以在一个实数区间取值,称为连续型总体.样本的频率分布表示形式有:
频率分布表和频率分布直方图S1计算数据中最大值与最小值的差(极差),确定全距.S2根据全距,决定组数和组距.S3分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间,且使分点比数据多一位小数.S4登记频数,计算频率,列出频率分布表.算法:1.频率分布表第10页,共24页,2023年,2月20日,星期四168165171167170165170152175174165170168169171166164155164158170155166158155160160164156162160170168164174171165179163172180174173159163172167160164169151168158168176155165165169162177158175165169151163166163167178165158170169159155163153155167163164158168167161162167168161165174156167166162161164166S1计算数据中最大值与最小值的差(极差),确定全距.极差=180-151=29;全距=30;取值区间[150.5,180.5];第11页,共24页,2023年,2月20日,星期四组距和组数与数据的数量有关.一般数据较多,分的组数也多;数据较少,分的组数也少.当数据个数在50以内,分5~8组;当数据个数在50~100之间,分8~12组.应当注意的是如果组内没有数据出现,就应当放宽组距,保证每个组内都有数据,且每个数据只属于确定的一组.在决定组数时,往往不是一次就能成功的,要有一个观察、尝试的过程,一般分点比已知数据多一位小数,并且第一组的起点要稍稍减小.只有合理地确定组距与组数,才能使数据分布的规律性比较明显地呈现出来;S2根据全距,决定组数和组距.组数=10;组距=3;第12页,共24页,2023年,2月20日,星期四S3分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间,且使分点比数据多一位小数.分组频数统计频数频率[150.5,153.5)[153.5,156.5)[156.5,159.5)[159.5,162.5)[162.5,165.5)[165.5,168.5)[168.5,171.5)[171.5,174.5)[174.5,177.5)[177.5,180.5]合计488112219147430.040.080.080.110.220.190.140.070.040.03412203153728693971001001第13页,共24页,2023年,2月20日,星期四练习:1.一个容量为32的样本,已知某组样本的频率为0.125,那么该组样本的频数为()
A.2B.4C.6D.82.为了分析一次数学考试的情况,全班抽了50人,将分数分为5组.第一组到第三组的频数分别是10,23,1,第四组的频率是0.08,那么落在第五组的频数是____,频率是_____,全年级800人中分数落在第五组的约有_____人.(1)频率=,已知其中任意两个量就可以求出第三个量.
(2)各小组的频率和等于样本容量的频率和等于1.
(3)由样本的频率可以估计总体的频率,从而估计出总体的频数.
B120.24192第14页,共24页,2023年,2月20日,星期四3.一个容量为20的样本数据,分组后组距与频数如下:(10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4;(60,70),2。则样本在区间(10,50]上的频率为()
A.5%B.25%C.50%D.70%4.已知样本10,8,6,10,8,13,11,10,12,7,8,9,11,9,11,12,9,10,11,12,那么频率为0.2的范围是()A.5.5-----7.5B.7.5--------9.5C.9.5-----11.5D.11.5-------13.5DD第15页,共24页,2023年,2月20日,星期四S1
作出频率分布表,然后作直角坐标系,以横轴表示数据,纵轴表示“频率/组距”;S2把横轴分为若干段,每一线段对应一个组的组距,S3以此线段为底作一矩形,它的高等于该组的频率/组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.所有矩形的面积和为1.算法:2.频率分布直方图第16页,共24页,2023年,2月20日,星期四177.5身高/cm150.5153.5156.5159.5162.5165.5168.5171.5174.5180.5频率组距0.020.040.060.08第17页,共24页,2023年,2月20日,星期四频率分布的条形图和频率分布直方图的区别两者是不同的概念;横轴:两者表示内容相同.思考:频率分布条形图和频率分布直方图是两个相同的概念吗?有什么区别?纵轴:两者表示的内容不相同.频率分布条形图的纵轴(长方形的高)表示频率;频率分布直方图的纵轴(长方形的高)表示频率与组距的比值.其相应组距上的频率等于该组距上长方形的面积.第18页,共24页,2023年,2月20日,星期四[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)4(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在15.5,24.5)的概率是多少?练习:第19页,共24页,2023年,2月20日,星期四2.一个容量为100的样本,数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格.0.06分组频数频率频率累计[12,15)
6[15,18)
0.08[18,21)
0.30[21,24)
21[24,27)
0.69[27,30)
16[30,33)
0.10[33,36]
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年西师新版九年级地理下册阶段测试试卷含答案
- 2025年沪教版九年级历史上册月考试卷含答案
- 2025年沪教新版选择性必修3化学下册阶段测试试卷
- 2025年沪科版选修一历史下册阶段测试试卷
- 2025年华师大版九年级化学上册阶段测试试卷含答案
- 2025年沪教版九年级历史下册阶段测试试卷
- 2025年外研衔接版九年级地理下册月考试卷含答案
- 2025年农药企业环保责任履行合同4篇
- 二零二五版抵押车借款合同编制指南与实例3篇
- 二零二五年度跨境电商进口货物担保借款合同范本4篇
- 2023年成都市青白江区村(社区)“两委”后备人才考试真题
- 2024中考复习必背初中英语单词词汇表(苏教译林版)
- 海员的营养-1315医学营养霍建颖等讲解
- 《现代根管治疗术》课件
- 肩袖损伤的护理查房课件
- 2023届北京市顺义区高三二模数学试卷
- 公司差旅费报销单
- 我国全科医生培训模式
- 2021年上海市杨浦区初三一模语文试卷及参考答案(精校word打印版)
- 八年级上册英语完形填空、阅读理解100题含参考答案
- 八年级物理下册功率课件
评论
0/150
提交评论