


版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计知识点及常见题型1. 总体和样本:在统计学中,把研究对象的全体叫做总体.把每个研究对象叫做个体.把总体中个体的总数叫做总体容量.为了研究总体T的有关性质,一般从总体中随机抽取一部分:,心,,研究,我们称它为样本.其中个体的个数称为样本容量.2. 简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、戈咲、排队等, 完全随机地抽取调查单位。特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样 是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少 时,才采用这种方法。3. 简单随机抽样常用的方法:(1)抽签法
2、;随机数表法;计算机模拟法;使用统计软件直接抽取。 在简单随机抽样的样本容量设计中,主要考虑:总体变异情况;允 许误差范围;概率保证程度。4 .抽签法:(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。5.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。1. 系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽 取样本。第一个样本采用简单随机抽样的办法抽取。K (抽样距离)二N (总体规模)/n (样本规模)前提条件
3、:总体中个体的排列对于研究的变量来说,应是随机的,即不存在 某种与研究变量相关的规则分布。可以在调查允许的条件下,从不同的样本幵始 抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布承某种 循环性规律,且这种循环和抽样距离重合。2. 系统抽样,即等距抽样是实际中最为常用的抽样方法之一。因为它对抽样框的 要求较低,实施也比较简单。更为重要的是,如果有某种与调查指标相关的辅助 变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大 大提高估计精度。1. 分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或
4、层次中采用简单随机抽样或系用抽样的办法抽取一 个子样本,最后,将这些子样本合起来构成总体的样本。两种方法:1. 先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。2. 先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐 排列,最后用系统抽样的方法抽取样本。2. 分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同 的子总体中的样本分别代表该子总体,所有的样本进而代表总体。分层标准:(1) 以调查所要分析和研究的主要变量或相关的变量作为分层的标准。(2) 以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变 量作为分层变量。(3) 以那
5、些有明显分层区分的变量作为分层变量。3. 分层的比例问题:(1) 按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比 重来抽取子样本的方法。(2) 不按比例分层抽样:有的层次在总体中的比重太小, 其样本量就会非常少, 此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。 如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整 样本中各层的比例,使数据恢复到总体中各层实际的比例结构。1、 样 本均值:X 厘丄2Xnn2、.样本标准差:S碍J% X)2 % X)2 区k»n3. 用样本估计总体时,如果抽样的方法比较合理, 那么样本可以反映
6、总体的信息, 但从样本得到的信息会有偏差。在随机抽样中,这种偏差是不可避免的。虽然我 们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实 反映了总体的信息。4. (1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准 差不变(2) 如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来 的k倍(3) 组数据中的最大值和最小值对标准差的影响,区间(X 3s,x 3s)的应用; “去掉一个最高分,去掉一个最低分”中的科学道理1、 概念:(1)回归直线方程(2)回归系数2. 回归直线方程
7、的应用(1) 描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系(2) 利用回归方程进行预测;把预报因子(即自变量x )代入回归方程对预报量(即因变量 Y)进行估计,即可得到个体 Y值的容许区间。(3) 利用回归方程进行统计控制规定 Y值的变化,通过控制x的范围来实现统计控制的目标。如已经得到了空气中 NO的浓度和汽车流量间的 回归方程,即可通过控制汽车流量来控制空气中NO的浓度。4应用直线回归的注意事项(1)做回归分析要有实际意义;( 2)回归分析前 , 最好先作出散点图;(3)回归直线不要外延。题型一选择合适的抽样方法简单随机抽样 ,也叫纯随机抽样。 就是从总体
8、中不加任何分组、划类、排队 等,完全随机地抽取调查单位系统抽样 (等距抽样或机械抽样) :把总体的单位进行排序,再计算出抽样距 离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简 单随机抽样的办法抽取。分层抽样 (类型抽样):先将总体中的所有单位按照某种特征或标志(性别、 年龄等)划分成若干类型或层次,然后再在各个类型或层次中采 用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这 些子样本合起来构成总体的样本。1. 现有以下两项调查:某装订厂平均每小时大约装订图书362册,要求检验员 每小时抽取40册图书,检查其装订质量状况;某市有大型、中型与小型的商店共1500家,三者数量之比为
9、1 : 5 : 9.为了调查全市商店每日零售额情况,抽取 其中15家进行调查. 完成、这两项调查宜采用的抽样方法依次是()A. 简单随机抽样法,分层抽样法B. 分层抽样法,简单随机抽样法C.分层抽样法,系统抽样法D .系统抽样法,分层抽样法2. 某社区有 400个家庭,其中高等收入家庭 120 户,中等收入家庭 180户,低收入家庭 1 0 0户.为了调查社会购买力的某项指标, 要从中抽取一个容量为 100的样 本记作;某校高一年级有 12名女排球运动员,要从中选出 3人调查学习负担情 况,记作;那么,完成上述 2项调查应采用的抽样方法是()A.用随机抽样法,用系统抽样法B.用分层抽样法,用随
10、机抽样法C.用系统抽样法,用分层抽样法D. 用分层抽样法,用系统抽样法题型二: 系统抽样剔除个体数计算 当系统抽样中样本总量除以样本容量不是整数时,需要用简单随机抽样法剔除部分个体,剔除个35体的数量=样本总量一组距卅羊本容量。例.若总体中含有 1650 个个体,现在要采用系统抽样,从中抽取一个容量为的样本,分段时应从总体中随机剔除 个个体,编号后应均分为 _段,每段有 个个体.5,35,47题型三:分层抽样有关计算 样本容量分层抽样特点:各层抽样比例 =总体抽样比例=,每层抽取个体数量=该层个体总量 抽样总体容量比例。经典例题:某校高中部有三个年级,其中高三有学生1000人,现采用分层抽样法
11、抽取一个容量为185的样本,已知在高一年级抽取了75人,高二年级抽取了 60人,则高中部共有多少学生?练习.某单位业务人员、管理人员、后勤服务人员人数之比依次为15 : 3: 2.为了了解该单位职员的某种情况,采用分层抽样方法抽出一个容量为n的样本,样本中业务人员人数为30,则此样本的容量 门为( )C. 40D . 80题型四:频率分布直方图画法步骤作频率分布直方图分布的步骤求极差(即一组数据中最大值与最小值的差)决定组距与组数,一般样本容量越大组数越多,经常分为512组,组距尽量取整。将数据分组,通过唱票计算各组的频数列频率分布表,根据各组频数计算频率,列出频率分布表画出频率分布直方图,横
12、轴只画最小值与最大值之间部分,纵轴表示频率组距的值题型五:由频率分布直方图估计众数、平均数、中位数(由频率分布直方图估计众数:一般先计算各部分小矩形的面积,找到面积最大的矩形,取该矩形横边中点对应的数即为所求(由频率分布直方图估计平均数:一般利用平均数公式 X X.P, x2p2xnpn来计算,其中Xn表示第n个矩形横边中点对应的数,Pn表示第n个矩形的面积。(由频率分布直方图估计中位数:就是平分直方图面积且垂直于横轴的直线对应的数。前n个小矩形面积不足时,不足部分数值中位数=下一个矩形横边左端点+x组距该小矩形面积题型六:频率分布表中未知量计算各组频数之和二样本容量,各组频率之和 =1,各组
13、频数我率二样本容 数据落在某区间的概率 V区间包括的各组频率之和经典例题:为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的 前三个小组的频率分别是,.第一小组的频数是5.(1)求第四小组的频率和参加这次测试的学生人数;(2)在这次测试中,学生跳绳次数的中位数落在第几小组内?(3)参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩优秀率是多少?组试估计该年级学生平均跳绳次数,中位数、众数练习一.2005年降雨量的概率如下表所示:次数(1)求年降雨量在100,200范围内的概率;(2)求年降雨量在1
14、50,200或250,300范围内 的概率; 求年降雨量不在150,300范围内的概率;(4)求年降雨量在100,300范围内的概率.年降雨量/mm概率0. 120. 250. 160. 14练习2某地区的年降水量在下列范围内的概率如下表所示年降水量(单位::100,:150,:200,:250,mm150)200)250)300)概率则年降水量在150, 300 (mm范围内的概率为()A. B . C .D练习3. (2014重庆文17)(本小题满分13分.(I )小问4分,(II )小问4分,(III )小问5分)20名学生某次数学考试成绩(单位:分)的频率分布直方图如图所示: 洞穿高考
15、预测题六(I)求频率分布直方图中a的值;(II )分别求出成绩落在50,60与60,70中的学生人数;(III )从成绩在50,70的学生中任选2人,求此2人的成绩都在60,70中的概率.题型七:用平均数和方差判断产品质量、成绩好坏、产量高低等平均数和方差(标准差)都是反映数据离散程度的工具。成绩好坏、产量高低等指标首先看平均数越高越好,当平均数相近或相同时,可以用方差(标准差)来刻画样本的稳定性。题型八:求线性相关的两个变量的回归直线方程,并作出适当预测第一步:作散点图第二步:求回归方程第三步:代值计算nn_xx nX y(Xj x)(yi y)求线性回归方程系数公式:I?匕,? y bX.X2 nX2(xi x)2i 1i 1重要结论正相关则 b> 0,负相关则bv 0,当解释变量增加一个单位时,预报变量相应增加(b>0)或减少(b v 0) | b丨个单位? y bx , (x, y)称为样本点的中心,此点一定在回归直线上。用回归直线方程计算出的 y值不是真实值,真实值在计算值的左右,可能大,可能小也可能相等。相关指数R2用来刻画拟合效果,R2的值越大,拟合效果越好,反之则越差,一般选择 氏值大的模型。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年商务礼仪师考试流程说明试题及答案
- 2025年中国封闭式纯净水冷却器市场调查研究报告
- 新手必读的纺织机械证书考试经验试题及答案
- 2025年中国宠物消臭饼干市场调查研究报告
- 人教版三年级音乐下册(五线谱)第2单元《小船》教学设计
- 2025年中国女装真皮手袋市场调查研究报告
- 复杂产品的质量控制方法试题及答案
- 2025年中国多用途周转箱市场调查研究报告
- 2025年中国多味干数据监测报告
- 2025年中国外壳保护贴数据监测报告
- 新型农民培训服务投标方案
- 安徽省根银科技有限公司电子级玻璃纤维布织造项目环境影响报告表
- 张力放线工器具配备表
- 食品小摊贩备案卡(样式)及说明
- 工艺联锁图识读
- 针刀操作安全区带
- THBFIA 0004-2020 红枣制品标准
- 2023年中南大学湘雅二医院康复医学与技术岗位招聘考试历年高频考点试题含答案解析
- GB/T 6072.1-2000往复式内燃机性能第1部分:标准基准状况,功率、燃料消耗和机油消耗的标定及试验方法
- 苏教版科学(2017)六年级下册教学计划及教学进度表
- GB/T 21567-2008危险品爆炸品撞击感度试验方法
评论
0/150
提交评论