(整理版)随机抽样_第1页
(整理版)随机抽样_第2页
(整理版)随机抽样_第3页
(整理版)随机抽样_第4页
(整理版)随机抽样_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一节 随机抽样多以选择题、填空题的形式出现,以实际问题为背景;热点是随机抽样方法中的分层抽样、系统抽样知识点:1简单随机抽样:定义:设一个总体含有n个个体,从中逐个不放回地抽取n个个体作为样本nn,如果每次抽取时总体内的各个个体被抽到的时机都相等,就把这种抽样称为简单随机抽样。方法:抽签法和随机数表法2系统抽样:定义:当总体中的个数较多时,可将总体分成均衡的几组,然后按照预先定出的规那么,从每组中抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样。沉着量为n的总体中抽取容量为n的样本步骤可概括为:1编号:先将总体的n个个体编号2分组:对编号进行分组,确定组间隔.当是整数时,取;3确定起始个

2、体号:在第1组中用简单随机抽样确定起始的个体编号lk;4抽取样本:按照一定的规那么抽取样本,通常是将加上间隔得到样本:。注意:当不是整数时,通过从总体中剔除一些个体使剩下的个体数n´能被整除,再重新编号分组确定起始个体号抽取样本。此时3分层抽样:定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样。4三种抽样方法的区别、联系及它们的适用范围?典例解析题型1:统计概念及简单随机抽样1为调查参加运动会的1000名运发动的年龄情况,从中抽查了100名运发动的年龄,就这个问题来说,以下说法正确的

3、选项是 a1000名运发动是总体b每个运发动是个体c抽取的100名运发动是样本d样本容量是1002今用简单随机抽样从含有6个个体的总体中抽取一个容量为2的样本。问: 总体中的某一个体在第一次抽取时被抽到的概率是多少? 个体在第1次未被抽到,而是在第2次被抽到的概率是多少? 在整个抽样过程中,个体被抽到的概率是多少?3假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,799进行编号,如果从随机数表第8行第7列的数开始向右读,请你衣次写出最先检测的5袋牛奶的编号 下面摘取了随机数表第7行至第9行84

4、 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54题型2:系统抽样4为了了解参加某种知识竞赛的1003名学生的成绩,请用系统抽样抽取一个容量为50的样本。5一个总体中有100个个体,随机编号为0,1,2,99,

5、依编号顺序平均分成10个小组,组号依次为1,2,3,10.现用系统抽样方法抽取一个容量为10的样本,假设在第1组中抽到的号码为6,那么在第7组中抽取的号码是_.题型3:分层抽样6甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,方案采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生 a30人,30人,30人 b30人,45人,15人c20人,30人,10人 d30人,50人,10人 人。8某最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组。在参加活动的职工中,青年人占42.5,中年人占47.5,老年人占

6、10。登山组的职工占参加活动总人数的,且该组中,青年人占50,中年人占40,老年人占10。为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本。试确定游泳组中,青年人、中年人、老年人分别所占的比例;游泳组中,青年人、中年人、老年人分别应抽取的人数。题型4:综合问题9某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后效劳情况,记这项调查为.那

7、么完成、这两项调查宜采用的抽样方法依次是 a分层抽样法,系统抽样法b分层抽样法,简单随机抽样法c系统抽样法,分层抽样法d简单随机抽样法,分层抽样法10270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,270;使用系统抽样时,将学生统一随机编号1,2,270,并将整个编号依次分为10段.如果抽得号码有以下四种情况:7,34,61,88,115,142,169,196,223,250;5,9,100,107,111,121,180,19

8、5,200,265;11,38,65,92,119,146,173,200,227,254;30,57,84,111,138,165,192,219,246,270;关于上述样本的以下结论中,正确的选项是 a、都不能为系统抽样b、都不能为分层抽样c、都可能为系统抽样 d、都可能为分层抽样第二节 用样本估计总体以基此题目中、低档题为主,多以选择题、填空题的形式出现,以实际问题为背景,亦可与概率结合以解答题形式出现;热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。知识点:1作频率分布直方图步骤:1求极差即一组数据中最大值与最小值的差;2决定组距与组数;3将数据分组;4列频率分布表;5

9、画频率分布直方图。2.折线图,总体密度曲线,茎叶图折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图。总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑的曲线,即总体密度曲线。3利用频率分布直方图估计样本的数字特征1众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标2平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和3中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值4标准差和方差如果这n个数据是标准差方差典例解析题型1:频率分布直方图,条形图,

10、茎叶图1为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品14件.1列出样本频率分布表;2画出表示样本频率分布的条形图;3根据上述结果,估计商品为二级品或三级品的概率约是多少?2分组140,145145,150150,155155,160160,165165,170170,175175,180合计人数125913631401列出频率分布表;2画出频率分布直方图,折线图;3估计数据落在150,170范围内的概率。3潮州统计局就某地居民的月收入调查了人,并根据所得数据画了样本的频率分布直方图每个分组包括左端点,不包括右端点,如第一组表示收入在。1

11、求居民月收入在的频率;2根据频率分布直方图算出样本数据的中位数;3为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这人中用分层抽样方法抽出人作进一步分析,那么月收入在的这段应抽多少人?时速km/h7060504030804200辆汽车正在经过某一雷达区,这些汽车运行的时速频率分布直方图如下图,那么时速超过60km/h的汽车数量约为_.5为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名学生中体重在56.5,64.5的学生人数是(a)20 (b)30(c)40 (d)506甲、乙两位同学某学

12、科的连续五次考试成绩用茎叶图 甲 乙表示如右,那么平均分数较高的是 ,成绩较为稳定的 9 8 6 3 8 9 9是 2 1 0 7 1 题型2:标准差与方差7在一次歌手大奖赛上,七位评委为歌手打出的分数如下:去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为8甲、乙两种冬小麦试验品种连续5年的平均面积产量如下:t / hm2品种第1年第2年第3年第4年第5年甲10乙其中产量比拟稳定的小麦品种是 。第三节 变量间的相关关系以考查线性回归系数为主,同时可考查利用散点图判断两个变量间的相关关系,多以选择,填空出现知识点:1两个变量的相关关系一种不确定的关系。与函数关系的区别与联系?相关系数判

13、定两个变量线性相关性:>0时,变量正相关,从散点图上看,点散布在从左下角到右上角的区域;<0时,变量负相关,从散点图上看,点散布在从左上角到右下角的区域; 越接近于1,两个变量的线性相关性越强; 接近于0,两个变量之间几乎不存在线性相关关系2回归直线方程:设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在某一条直线的附近,就可以认为y对x的回归函数的类型为直线型:。其中,。我们称这个方程为y对x的回归直线方程。典例解析1有关线性回归的说法,不正确的选项是 2下面哪些变量是相关关系 b.房屋面积与房屋价格 3一位母亲记录了儿子39岁的身高,由此建立的身高与年龄的回

14、归模型为y=7.19x+73.93用这个模型预测这个孩子10岁时的身高,那么正确的表达是 a身高一定是 b身高在以上c身高在以下 d身高在左右4是,的平均数,是,的平均数,是,的平均数,那么以下各式正确的选项是 5工人月工资元依劳动生产率千元变化的回归直线方程为,以下判断正确的选项是 a劳动生产率为1000元时,工资为50元b劳动生产率提高1000元时,工资提高150元c劳动生产率提高1000元时,工资提高90元d劳动生产率为1000元时,工资为90元6之间的一组数据: 与之间的线性性回归方程必过定点_.7某种产品的广告费用支出万元与销售万元之间有如下的对应数据:245683040605070

15、假设由资料可知对呈线性相关关系,试求:(1) 线性回归方程;(2) 据此估计广告费用支出为10时销售收入的值.第四节 典型统计案例知识点:1 事件的独立性,2 列联表独立性分析3 一元线性回归: 典例解析1打靶时甲每打10次可中靶8次,乙每打10次可中靶7次,假设两人同时射击一个目标,那么它们都中靶的概率是 4 c2某医疗机构通过抽样调查样本容量,利用,经查对临界值表知,那么以下结论正确的选项是 b.假设某人吸烟,那么他有的可能性患肺病的把握认为“患肺病与吸烟有关 的把握认为“患肺病与吸烟有关3为了考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:药物效果与动物试验列联表患病未患病服用药1045没服用药2030请问能有 把握认为药物有效,4在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动1根据以上数据建立一个2×2的列联表;2判断性别与休闲方式是否有关系5 下表为某地近几年机动车辆数与交通事故数的统计资料机动车辆数千台95110120135150交通事故数千件1对进行线性相关性检验2如果具有线性相关关系,求出回归直线方程3估计机动车辆为80千台时,交通事故数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论