




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
13.1-13.2总体与样本
数据的获取第13章
统计教师xxx沪教版(2020)
必修第三册总体与样本0102CONTANTS目录数据的获取总体与样本011.总体:与所研究的问题有关的_________组成一个总体.2.个体:总体中___________.3.样本:总体中的___________组成一个样本.4.样本容量:样本中___________.所有对象每一个对象一部分个体个体的数目5.简单随机样本:在选取样本时,应该使总体的每一个个体有___________被选中,这种样本称为简单随机样本.6.简单随机样本的获取方法:简单随机样本可以用_____的方法或者利用计算机的_____________来获取.同等的机会抽签随机数发生器(1)在50名学生中选取10名学生的视力作为样本,则50名学生是总体.()(2)在选取样本时,总体中的每一个个体应该都有同等的机会被选中.()(3)用抽签的方法可以获得简单随机样本.()(4)在300名学生中选取100名优等生的数学成绩作为样本,反映总体的数学成绩.()×√√×知识点1总体、个体、样本和样本容量【例1】某校初二年级全体320名学生在电脑培训前后各参加了一次水平相同的考试,考分都以同一标准划分成“不合格”、“合格”、“优秀”三个等级.为了了解电脑培训的效果,用抽签的方式得到其中32名学生的两次考试的考分等级,所绘制的统计图如图所示.试结合图示信息回答下列问题:(1)在此问题中,总体和样本各是什么?(2)这32名学生经过培训,考分等级“不合格”的百分比由____下降到_____.(3)通过调查这32名学生培训效果估计整个学校初二年级的培训效果合理吗?为什么?【思路点拨】(1)根据样本、总体的概念解答.(2)不合格人数的百分比=抽签不合格人数÷抽签人数×100%.(3)根据所选取样本是否具代表性,估计培训效果是否合理.【自主解答】(1)总体是初二年级320名学生电脑培训的效果,样本是抽到的32名学生电脑培训的效果.(2)培训前不合格的百分比是24÷32×100%=75%;培训后不合格的百分比是8÷32×100%=25%.(3)合理,因为样本容量不是很小,而且样本的选取是随机的,因此样本具有代表性,可以估计全校初二年级320名学生电脑培训的效果.【互动探究】问题中添加条件“学校有800名学生”后求学校培训后不合格的人数是多少?提示:培训后不合格的人数占初二年级人数的百分比为25%.所以学校培训后不合格的人数为25%×800=200(人).【总结提升】总体、个体、样本的异同总体、个体、样本所指的考察对象是统一的,只是三者的包含范围不一样:总体是所要考察对象的全体,样本是其中的一部分,个体是单独的一个考察对象.总体也有容量,不能忽略.解题时,要清楚总体、个体、样本所要研究的对象,而不是需要考察的对象的载体本身.知识点2简单随机样本的应用【例2】为了制定本市初中七、八、九年级学生校服的生产计划,有关部门准备对180名初中男生的身高做调查,现有三种调查方案:A.测量少年体校中180名男子篮球、排球队员的身高;B.查阅有关外地180名男生身高的统计资料;C.在本市的市区和郊县各任选一所完全中学、两所初级中学,在这六所学校有关年级的各班中,用抽签的方法分别选出10名男生,然后测量他们的身高.为了达到估计本市初中这三个年级男生身高分布的目的,你认为采用上述哪一种调查方案比较合理,为什么?【解题探究】1.选取样本的原则是什么?提示:选取样本的原则是使总体的每一个个体有同等的机会被选中(简单随机样本).2.根据样本选取的原则,调查方案A,B,C哪种符合简单随机样本的标准?提示:调查方式A和B都不符合样本选取标准,调查方式C符合样本选取原则.【互动探究】按调查方案A测得的身高与实际身高有何差异?提示:偏高.因为少年体校中180名男子篮球、排球队员的身高比一般学生都要高,所以,测得的数据偏高.【总结提升】选取简单随机样本的两种方法1.抽签:编号后随机抽取组成样本.2.应用计算机随机数发生器:编号后根据计算机抽取的号码组成样本.数据的获取02
统计学是通过收集数据和分析数据来认识未知现象的,因此如何收集数据,是统计学研究的重要内容.
在实践中,获取数据的途径多种多样,像统计报表和年鉴、社会调查、普查和抽样、互联网、试验设计等等都是常见的.下面介绍获取数据的些基本途径.1.通过调查获取数据
对于有限总体问题,如人口总数、城乡就业状况、农村贫困人口脱贫状况、生态环境改善状况、青少年受教育状况、高中生近视的比例、产品合格率、高中生日平均上网时间等问题,我们一般通过抽样调查或普查的方法获取数据.
针对不同问题的特点,为了有效收集所需数据,专家发明了各种不同的抽样方法.除了我们已经学过的简单随机抽样和分层随机抽样,还有系统抽样、整群抽样、不等慨率抽样、自适应抽样、两阶段抽样等很多其他的方法,在实际应用中,关键在于是否能充分有效地利用背景信息选择或创建更好的抽样方法,并有效避免抽样过程中的人为错误.在前面的学习中,我们对此有了一定的认识.2.通过试验获取数据
试验是获取样本观测数据的另一种重要途径.例如,要判断研制的新药是否有效、培育的小麦新品种是否具有更高的产量等情况,没有现存的数据可以查询,就需要通过对比试验的方法去获取样本观测数据.又如特种钢、轮胎的配方和产品质量等,也需要通过试验获取样本观测数据.
通过试验获取数据时,我们需要严格控制试验环境,通过精心的设计安排试验,以提高数据质量,为获得好的分析结果奠定基础.在统计学中,这种安排试验的学问叫做“试验设计”,感兴趣的同学可以查阅试验设计教科书.
在现实生活中,我们感兴趣的很多自然现象都不能被人类所控制,如地震、降水、大气污染、宇宙射线等,自然现象会随着时间的变化而变化,不能用我们已经学过的有限总休来刻画,也就不能用抽样的方法获取观测数据;另一方面,由于自然现象不能被人为控制,也不能通过试验获取观测数据.研究这类现象,只能通过长久的持续观察获取数据.3.通过观察获取数据
对于各个不同的行业,往往需要专业测量设备获取观测数据.随着科技水平的提高,专业测量设备的自动化程度越来越高,通过观测获取和存储数据的成本越来越低,这成为大数据产生的根源.一般地,通过观察自然现象所获取的数据性质比较复杂,其中蕴含着所观察现象的本质信息,这些信息十分宝贵,统计学理论和方法是挖掘这些信息的强有力的工具之一.
我们感兴趣的问题,可能有众多专家研究过,他们在研究中所收集的样本观测数据可能存储于学术论文、专著、新闻稿、公报或互联网上,这些数据是宝贵的财富,我们可以收集前人的劳动成果并加以利用,从而减少收集数据的成本.我们往往把这样获得的数据叫做二手数据.国家统计局是我国最主要的统计数据收集和发布的部门,调查统计的数据涉及经济、社会、民生的方方面面.国家统计局的统计数据通过多种形式进行公布,例如定期发布新闻稿、举办新闻发布会、发布统计公报、出版各类统计资料等.统计公报有年度统计公报、经济普查公报、人口普查公报、农业普查公报等;统计资料出版物有《中国统计摘要》、以《中国统计年鉴》为代表的统计年鉴系列等.4.通过查询获得数据2014年全国交通事故情况
例如,我们想了解2014年全国的交通事故情况,通过查找《中国统计年鉴》可以得到如下表所示的数据.如果我们关心机动车交通事故逐年变化的情况,那么需要通过查找每年的数据表,并把它们合并整理.类型发生数/起死亡人数/人受伤人数/人直接财产损失/万元机动车18032154944194887103386.0非机动车141752311157372719.4行人乘车人2242124711671403.5其他74219134.1总计19681258523211882107543
随着信息技术的发展,通过互联网获取数据越来越成为获取二手数据的主要方式.例如,可以从国家统计局的官方网站查询得到国家统计局公布的各种统计数据.在网络上,也有专门提供数据服务的公司,它们提供政府部门允许公开的各类数据.当然,互联网的最大优势是,人们可以利用强大的搜索功能,在整个网络上查找所需要的数据.但从网络上查找的数据,因为数据来历和渠道多样,所以质量会参差不齐,必须根据问题背景知识“清洗”数据,去伪存真,为进一步的数据分析奠定基础.归纳总结通过试验获取数据没有现存的数据可以查询严格控制实验环境,通过精心的设计安排试验,以提高数据质量通过观察获取数据自然现象要通过长久的持续观察获取数据通过查询获得数据众多专家研究过,其收集的数据有所存储必须根据问题背景知识“清洗数据”,去伪存真获取数据的基本途径适用类型注意问题通过调查获取数据对于有限总体问题,我们一般通过抽样调查或普查的方法获取数据要充分有效地利用背景信息选择或创建更好的抽样方法,并有效地避免抽样过程中的人为错误典例分析例1:判断正误:(1)要得到某乡镇的贫困人口数据,可以通过试验获取数据.(2)要了解一批节能灯的使用寿命,可以采用普查的方式.(3)普查获取的资料更加全面、系统,抽样调查更方便、快捷.题型一获取数据的途径【解答】解:(1)某乡镇的贫困人口数据属于有限总体问题,所以可以通过调查获取数据,故(1)错误,(2)要了解一批节能灯的使用寿命,可以采用抽查的方式,故(2)错误,(3)普查获取的资料更加全面、系统,抽样调查更方便、快捷,故(3)正确.故答案为:(1)错误;(2)错误;(3)正确.变式训练下列调查中,适宜采用全面调查(普查)方式的有.①调查某市市民对东京奥运会吉祥物的知晓率;②了解全国中学生的睡眠状况;③检查某学校的学生是否感染了流行病毒;④调查某超市库存储备的牛奶的质量情况;⑤调查乘坐某航班飞机的旅客是否携带违禁物品;⑥检测一批种子的发芽率.【解答】解:③⑤是需要对每一个调查对象都进行调查,适宜采用全面调查;①②的调查样本量大,不适宜进行全面调查;④⑥调查具有破坏性,只能选用抽样调查.故答案为:③⑤.解题技巧选择获取数据的途径的依据选择获取数据的途径主要是根据所要研究问题的类型,以及获取数据的难易程度.有的数据可以有多种获取途径,有的数据只能通过一种途径获取,选择合适的方法和途径能够更好地提高数据的可靠性.练一练:下列问题中采用怎样的抽样方法较为合理?(1)运动会服务人员为参加400米决赛的六名同学安排跑道(2)一次数学竞赛中,某班有10人在110分以上,40人在90~100分,10人
低于90分,现从中抽取12人了解有关情况解析:(1)总体容量较小,而且差异不大,用简单随机抽样方法中的抽签法和随机数法都比较方便(2)不同成绩段的学生对同一问题的看法可能存在较大差异,共用分层
随机抽样较为合理
3.为调查小区平均每户居民的月用水量,下面是三名学生设计的方
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 掀起复习热潮2024年陪诊师考试试题及答案
- 14普罗米修斯(教学设计)-2024-2025学年语文四年级上册统编版
- 通过故事分享提升道德认知计划
- 如何有效地进行预算控制计划
- 总结中发现机会与挑战的管理思路计划
- 促进社区经济循环的策略计划
- 全面了解宠物殡葬师考试试题及答案
- 深度解读监理工程师考试试题及答案
- 优化教师资格证复习试题及答案
- 中职电子商务实战演练试题及答案
- 《清华大学介绍》课件
- 高中化学培训《追寻化学教育的本源》
- 神经阻滞疗法在慢性疼痛治疗中的应用-课件
- 辽宁省大连市药品零售药店企业药房名单目录
- 《作文吹泡泡》-完整版课件
- 电化学储能保险发展报告
- 不合格产品统计表
- 《外科学》第七节 直肠癌
- DG-TJ 08-2002-2020 悬挑式脚手架安全技术标准 高质量清晰版
- Z世代消费态度洞察报告
- 办公楼办公室改档案室结构加固施工方案(15页)
评论
0/150
提交评论