版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计的基本思想方法: 用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本从总体中抽取一个样本,根据样本的根据样本的情况去估计总体的相应情况情况去估计总体的相应情况. .统计的核心问题: 如何根据样本的情况对总体的情况作出一种推断. 这里包括两类问题:一类是如何从总体中抽取样本? 另一类是如何根据对样本的整理、计算、分另一类是如何根据对样本的整理、计算、分析析, ,对总体的情况作出推断对总体的情况作出推断. 用样本的有关情况去估计总体的相应情况用样本的有关情况去估计总体的相应情况, ,这种估计大体分为两类,这种估计大体分为两类,一类是用样本频率分一类是用样本频率分布估计总体分布
2、,布估计总体分布,一类是用样本的某种数字特一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应征(例如平均数、方差等)去估计总体的相应数字特征。数字特征。 整体介绍:整体介绍:国际奥委会国际奥委会2003年年6月月29日决定,日决定,2008年北京年北京奥运会举办的日期比原定日期推迟两周,改在奥运会举办的日期比原定日期推迟两周,改在8月月8日至日至8月月24日举行原因是日举行原因是7月末月末8月初北京地区月初北京地区得气温高于得气温高于8月中下旬月中下旬下表是随机抽取的近年来北京地区下表是随机抽取的近年来北京地区7月月25日至日至8月月24日的日最高气温,得到如下样本日的日最高气温
3、,得到如下样本(单位:单位: C)l怎样通过上表中的数据,分析比较两时间段的高温(怎样通过上表中的数据,分析比较两时间段的高温(33)状)状况呢?况呢?问题引入:问题引入:知识新授:知识新授:1.频数与频率频数与频率 频数频数是指一组数据中,某范围内的数据出现是指一组数据中,某范围内的数据出现的次数;把频数除以数据的总个数,就得到的次数;把频数除以数据的总个数,就得到频率频率.2.频率分布表频率分布表 当总体很大或不便于获得时,可以用样本的当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布频率分布估计总体的频率分布.我们把反映总体我们把反映总体频率分布的表格称为频率分布的表格称为
4、频率分布表频率分布表.说明说明:样本频率分布与总体频率分布:样本频率分布与总体频率分布有什么关系?有什么关系?通过样本的通过样本的频数分布、频率分布频数分布、频率分布可以可以估计总体的频率分布估计总体的频率分布. .频率分布表频率分布表:3.频率分布条形图频率分布条形图 各长方形长条的宽度要相同各长方形长条的宽度要相同. .相邻长条的间距要适当相邻长条的间距要适当.长方形长条的高度表示取各长方形长条的高度表示取各值的频率值的频率.0.10.20.30.40.50.60.77/25-8/10时间时间频率频率8/8-8/24一幅图胜一幅图胜过一千字过一千字引例引例从某校高一年级的从某校高一年级的1
5、002名新生中用系统抽样的方法抽取一名新生中用系统抽样的方法抽取一个容量为个容量为100的身高样本,数据如下(单位:的身高样本,数据如下(单位:cm)试作出该样)试作出该样本的频率分布表本的频率分布表 这个例子与前面问题是不同的,这里的总体可以在一个实这个例子与前面问题是不同的,这里的总体可以在一个实数区间取值,称为连续型总体数区间取值,称为连续型总体.样本的频率分布表示形式有:样本的频率分布表示形式有: 频率分布表频率分布表和和频率分布直方图频率分布直方图S1 计算数据中最大值与最小值的差计算数据中最大值与最小值的差(极差),确定(极差),确定全距全距.S2 根据全距,决定组数和组距根据全距
6、,决定组数和组距.S3 分组:通常对组内数据所在区间取左闭右开区间,最后一组分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间,且使分点比数据多一位小数取闭区间,且使分点比数据多一位小数.S4 登记频数,计算频率,列出频率分布表登记频数,计算频率,列出频率分布表.算法算法:1.频率分布表频率分布表S1 计算数据中最大值与最小值的差(极差),确定全距计算数据中最大值与最小值的差(极差),确定全距. 组距和组数与数据的数量有关一般数据较多,分的组数组距和组数与数据的数量有关一般数据较多,分的组数也多;数据较少,分的组数也少当数据个数在也多;数据较少,分的组数也少当数据个数在50以内,分以
7、内,分58组;当数据个数在组;当数据个数在50100之间,分之间,分812组应当注意的是如果组应当注意的是如果组内没有数据出现,就应当放宽组距,保证每个组内都有数据,组内没有数据出现,就应当放宽组距,保证每个组内都有数据,且每个数据只属于确定的一组在决定组数时,往往不是一次且每个数据只属于确定的一组在决定组数时,往往不是一次就能成功的,要有一个观察、尝试的过程,一般分点比已知数就能成功的,要有一个观察、尝试的过程,一般分点比已知数据多一位小数,并且第一组的起点要稍稍减小只有合理地确据多一位小数,并且第一组的起点要稍稍减小只有合理地确定组距与组数,才能使数据分布的规律性比较明显地呈现出来;定组距
8、与组数,才能使数据分布的规律性比较明显地呈现出来; S2 根据全距,决定组数和组距根据全距,决定组数和组距.S3 分组:通常对组内数据所在区间取左闭右开区间,最后分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间,且使分点比数据多一位小数一组取闭区间,且使分点比数据多一位小数.488112219147430.040.080.080.110.220.190.140.070.040.03412203153728693971001001练习练习 :1.一个容量为一个容量为32的样本,已知某组样本的频率为的样本,已知某组样本的频率为0.125,那么该组样本的频数为(那么该组样本的频数为( )
9、 A2 B4 C6 D82.为了分析一次数学考试的情况,全班抽了为了分析一次数学考试的情况,全班抽了50人,将分人,将分数分为数分为5组第一组到第三组的频数分别是组第一组到第三组的频数分别是10,23,1,第四组的频率是第四组的频率是0.08,那么落在第五组的频数是,那么落在第五组的频数是_,频率是频率是_,全年级,全年级800人中分数落在第五组的约有人中分数落在第五组的约有_人人 (1)频率,已知其中任意两个量就可以求出第三个量频率,已知其中任意两个量就可以求出第三个量 样本容量样本容量频数频数(2)各小组的频率和等于样本容量的频率和等于各小组的频率和等于样本容量的频率和等于1 (3)由样本
10、的频率可以估计总体的频率,从而估计出总体的频数由样本的频率可以估计总体的频率,从而估计出总体的频数 B120.241923.一个容量为一个容量为20的样本数据,分组后组距与频数如下:的样本数据,分组后组距与频数如下:(10,20),),2;(;(20,30),),3;(;(30,40),),4;(40,50),),5;(;(50,60),),4;(;(60,70),),2。则。则样本在区间(样本在区间(10,50上的频率为(上的频率为( ) A.5% B.25% C.50% D.70% 4.已知样本已知样本10,8,6,10,8,13,11,10,12,7,8,9,11,9,11,12,9,1
11、0,11,12,那么频率为,那么频率为0.2的的范围是(范围是( )DDS1 作出频率分布表,然后作直角坐标系,以横轴表示数据,纵作出频率分布表,然后作直角坐标系,以横轴表示数据,纵 轴表示轴表示“频率组距频率组距”;S2 把横轴分为若干段,每一线段对应一个组的组距,把横轴分为若干段,每一线段对应一个组的组距,S3 以此线段为底作一矩形,它的高等于该组的频率以此线段为底作一矩形,它的高等于该组的频率/组距组距,这样得这样得 出一系列的矩形,每个矩形的面积恰好是该组上的频率出一系列的矩形,每个矩形的面积恰好是该组上的频率这些矩形就构成了频率分布直方图这些矩形就构成了频率分布直方图 所有矩形的面积
12、和为所有矩形的面积和为1 算法算法:2.频率分布直方图频率分布直方图177.5身高身高cm150.5 153.5 156.5 159.5 162.5 165.5 168.5 171.5 174.5180.5频率频率组距组距0.020.040.060.08频率分布的条形图和频率分布直方图的区别频率分布的条形图和频率分布直方图的区别 两者是不同的概念;两者是不同的概念;横轴:两者表示内容横轴:两者表示内容相同相同.思考:思考: 频率分布条形图和频率分布直方图是两个相同的概念吗?频率分布条形图和频率分布直方图是两个相同的概念吗? 有什么区别?有什么区别?纵轴:两者表示的内容纵轴:两者表示的内容不相同
13、不相同.频率分布条形图频率分布条形图的纵轴(长方形的高)表示频率的纵轴(长方形的高)表示频率; 频率分布直方图频率分布直方图的纵轴(长方形的高)表示频率与组距的纵轴(长方形的高)表示频率与组距的比值的比值.其相应组距上的频率等于该组距上长方形的面积其相应组距上的频率等于该组距上长方形的面积. =频率长方形的面积组距频率组距12.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 4(1)列出样本的频率分布表列出样本的频率分布表;(2)画出频率分布直方图画出频率分布直方图
14、;(3)根据频率分布直方图估计根据频率分布直方图估计,数据落在数据落在15.5, 24.5)的概率是)的概率是多少多少? 练习练习 :2.一个容量为一个容量为100的样本的样本,数据的分组和各组的相数据的分组和各组的相关信息如下表关信息如下表,试完成表中每一行的两个空格试完成表中每一行的两个空格.0.060.0680.140.16160.210.510.18180.160.85100.950.055课堂小结课堂小结编制频率分布直方图的步骤编制频率分布直方图的步骤:找最大值与最小值。找最大值与最小值。决定组距与组数决定组距与组数决定分点决定分点登记频数,计算频率,列表,画直方图登记频数,计算频率,列表,画直方图说明说明:(1)确定分点时确定分点时,使分点比数据多一位小数使分点比数据多一位小数,并且把第并且把第1小组的起点小组的起点稍微再小一点稍微再小一点.一一、求求极差,极差,即数据中最大值与最小值的差即数据中最大值与最小值的差二、决定二、决定组距组距与组数与组数 :组距:组距=极差极差/组数组数三、分组三、分组,通常对组内数值所在区间,通常对组内数值所在区间,取取左闭右开左闭右开区间区间 , 最后一组取闭区间最
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 44724-2024城市公共汽电车无障碍运营服务规范
- 房地产营销策划 -美的 -义乌 -宝龙世家年度传播方案
- 夫妻离婚股份分割的流程-生活日常
- 西宁-PEP-24年小学英语第五单元测验卷
- 湖南衡阳2025届高三一轮复习好题训练:10月第1周 地理试题(解析版)
- 2025届高三英语二轮复习专项 2024年全国新课标I卷易错题二次开发练习 (含答案)
- 2024年冻土共振柱试验机项目资金筹措计划书代可行性研究报告
- 强化安全管理制度建设-坚持以人为本
- 概念验证服务标准
- Python程序设计实践- 习题及答案 ch05 实验1 数据的输入和输出
- 民间借贷利息计算表
- 沪科版(2024)八年级全一册物理第一学期期中学业质量测试卷 2套(含答案)
- 实验室家具工程施工组织方案
- 小学数学教学“数学好玩”探析
- 画法几何及机械制图(第六版)1-1
- 设备运行分析报告(模板)
- 独特的我PPT课件
- 施工现场平面布置图
- 精神病医院住院患者护理评估单
- 生活中的音乐教案
- 辩论赛评分表(完整版)-
评论
0/150
提交评论