概率与统计随机抽样用样本估计总体变量间的相互_第1页
概率与统计随机抽样用样本估计总体变量间的相互_第2页
概率与统计随机抽样用样本估计总体变量间的相互_第3页
概率与统计随机抽样用样本估计总体变量间的相互_第4页
概率与统计随机抽样用样本估计总体变量间的相互_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十模块 概率与统计第四十八讲 随机抽样用样本估计总体变量间的相互关系统计案例回归课本本1.样本本及抽样样的定义义(1)在在数理统统计中称称研究对对象的全全体为总体,组成总总体的每每一个基本单元元为个体,从总体体中抽取取若干个个个体x1,x2,xn,这样的的n个个个体x1,x2,xn称为大小为n(容量量为n)的一个个样本.(2)抽抽样:抽抽样是为为了获取总体体的信息息,特别在在客观实实际中对对总体的全部个个体逐一一进行研研究,有有的是不不适宜不可能能或不必必要的.因此,抽样调查查是获取总总体信息息的重要要方法.2.随机机抽样(1)简简单随机机抽样:从一个个总体中中通过逐个抽取取的方法法从中抽取

2、取一个样样本,且且每次抽抽取时各各个个体体被抽到到的概率率相等,这样的的抽样称称为简单随机机抽样.这样抽抽出的样样本称为为简单随随机样本本.简单单随机抽抽样的基基本方法法有抽签法和和随机数数表法.(2)系系统抽样样:系统统抽样被被称为等距抽样样或机械械抽样.它按照照时间或或空间的的等距间隔隔抽取样本本,即将将总体分分成几个个部分,然后按按照预先先定出的的规则,从每一一部分抽取一个个个体,得到所所需要的的样本,这种抽抽样称为为系统抽抽样.系系统抽样样与简单单随机抽抽样的联联系在于于:将总总体均分分后的每每一部分分进行抽抽样时,采用的的是简单随机机抽样.(3)分分层抽样样:当总总体中一一部分个个体

3、与另另一部分分个体有有明显的差差异且易易于区别别时,常将将相近的的个体归归成一组组,然后后按照各各部分所所占的比例进行抽样样,这种种抽样称称为分层抽样样.其中所所分成的的各部分分称为层.分层抽抽样时,每一个个个体被被抽到的的概率都都是相等的.3.频率率分布表表频率率分布直直方图与与茎叶图图(1)频频率分布布样本中所所有数据据(或者者数据组组)的频频数和样样本容量量的比,就是该该数据的的频率.所有数数据(或或者数据据组)的的频率的的分布变变化规律律叫做频率分布布,可以用用频率分布布表频率分布布直方图图频率分分布折线线图茎茎叶图等等来表示示.(2)频频率分布布折线图图:连接接频率分分布直方方图中各

4、各小长方方形上端端的中点,就得到到频率分分布折线线图.(3)总总体密度度曲线如果样本本容量不不断增大大,分组组的组距距不断缩缩小,则则频率分分布直方方图实际际上越来来越接近近于总体在各各小组内内所取值值的个数数与总数数比值的的大小,它可以以用一光滑曲线线来描绘,这条光滑曲线线就叫做总总体密度度曲线.(4)茎茎叶图表表示数据据有两个个突出的的优点,其一是是统计图图上没有有原始数据据的损失,所有信信息都可可以从这这个茎叶叶图中得得到,其其二是在在比赛时时随时记记录,方方便记录录与表示示.4.用样样本的数数字特征征估计总总体的数数字特征征(1)众众数,中中位数,平均数数在一组数数据中,出现次次数最多

5、的数据叫叫做这组组数据的的众数.将一组数数据按大大小依次次排列,把处在在中间位置的一一个数据据(或中中间两个个数据的的平均数数)叫做做这组数数据的中中位数.如果n个个数,x1,x2,xn,那么(x1+x2+xn)叫做这n个数的的平均数数.总体中所所有个体体的平均均数叫做做总体平均均数.样本中所所有个体体的平均均数叫做做样本平均均数,如果在在n个数数据中,x1出现了f1次,x2出现f2次,xk出现fk次(这里里f1+f2+fk=n),那么(x1f1+x2f2+xkfk),叫做这这n个数数的加权权平均数数.5.两个个变量的的相关关关系(1)当当自变量量的取值值一定时,因变变量的取取值带有有随机性,

6、这两个个变量之之间的关关系叫做做相关关关系.如果一个个变量的的值由小小变大时时,另一一个变量量的值也也在由小小到大,这种相相关称为为正相关;反之,如果一一个变量量的值由由小变大大时,另另一个变变量的值值在由大大到小,这种关关系称为为负相关.变量间间的这种种关系与与函数关关系不同同,它是是一种非非确定关关系.(2)散散点图:表示具具有相关关系系的两个变变量的一一组数据据的图形形叫做散散点图.6.回归归直线方方程(1)一一般地,设x和和y是具具有相关关关系的的两个变变量,且且对应于于n个观观测值的的n个点点大致分分布在一一条直线线的附近近,若所所求的直直线方程程为我们将这这个方程程叫做回归直线线方

7、程,a,b叫做回归系数数,相应的的直线叫叫做回归直线线.(2)最最小二乘乘法使离差平平方和Q=(y1-bx1-a)2+(y2-bx2-a)2+(yn-bxn-a)2为最小的的方法,叫做最最小二乘乘法.7.回归归分析(1)回回归直线线方程=bx+a中中,上述方程程对应的的直线叫叫做回归直线线,而对两两个变量量所进行行的上述述统计分分析叫做做线性回归归分析.相关系数数用相关系数数来描述线线性相关关关系的的强弱.当r0时,两个变变量正相关;当r0时,两个变变量负相关,r的绝绝对值越越接近1,表明明两个变变量的线线性相关关性越强,r的绝绝对值接接近于0,表明明两个变变量之间间几乎不存在线性相关关关系.

8、通常当当|r|大于r0.05时,认为为两个变变量有很很强的线线性相关关关系,因而求求回归直直线方程程才有意意义.数据点和和它在回回归直线线上相应应位置的的差异(y1-i)是随机机误差效效应,称称i=yi-i为残差,将所得得值平方方后加起起来,用用数学符符号表示示为(yi-i)2称为残差平方方和,它代表表了随机机误差的的效应.8.独立立性检验验(1)分分类变量量的定义义如果某种种变量的的不同“值”表示个体体所属的的不同类类别,像像这样的的变量称称为分类变量量.(2)22列列联表一般地,假设有有两个分分类变量量X和Y,它们们的值域域分别为为x1,x2和y1,y2,其样样本频数数列联表表(称为为22

9、列联表表)为K2=用用它的大大小可以以决定是是否拒绝绝原来的的统计假假设H0,如果K2值较大,就拒绝绝H0,即拒绝绝事件A与与B无关关.考点陪练练1.(2010重庆)某某单位有有职工750人人,其中中青年职职工350人,中年职职工250人,老年职职工150人,为了了了解该单单位职工工的健康康情况,用分层层抽样的的方法从从中抽取取样本.若样本本中的青青年职工工为7人人,则样样本容量量为()A.7B.15C.25D.35解析:设设样本容容量为n,则依依题意有有n=7,n=15,选B.答案:B2.(2010湖北)将将参加夏夏令营的的600名学生生编号为为:001,002,600.采用用系统抽抽样方法

10、法抽取一一个容量量为50的样本本,且随随机抽得得的号码码为003.这这600名学生生分住在在三个营营区,从从001到300的第第营区区,从301到到495在第营区,从496到600在在第营营区,三三个营区区被抽中中的人数数依次为为()A.26,16,8B.25,17,8C.25,16,9D.24,17,9解析:依依题意及及系统抽抽样的意意义可知知,将这这600名学生生按编号号依次分分成50组,每每一组各各有12名学生生,第k(kN*)组抽中中的号码码是3+12(k-1).令令3+12(k-1)300,得得k,因此第第营区区被抽中中的人数数是25;令3003+12(k-1)495得10.828,

11、所以我我们有99.9%的把把握说,A,B两药对对该病的的治愈率率之间有有显著差差别.方法与与技巧上上述结论论是对所所有服用用A药或或B药的的病人而而言的,绝不要要误以为为只对100个个病人成成立.这这就体现现了统计计的意义义,即由由样本推推断出全全体.技法二数数形结结合思想想【典例2】为为了了了解中学学生的身身高情况况,对某某中学同同龄的若若干女生生的身高高进行测测量,将将所得数数据整理理后,画画出频率率分布直直方图如如图所示示,已知知图中从从左到右右15组的频频率分别别为0.05,0.10,0.15,0.15,0.30,68组组的频数数分别为为7,5,3,第二小小组的频频数为6.(1)画画出

12、频率率分布表表;(2)试试问这组组数据中中的中位位数在哪哪个身高高的范围围内?(3)如如果本次次测试身身高在157cm以以上(包包括157cm)的的为良好好,试估估计该校校女生身身高良好好率是多多少?解题切切入点通通过第二二组的频频数和频频率先求求出学生生总数,其他问问题就十十分容易易解决了了,主要要考查同同学们对对频率分分布表和和频率分分布直方方图的掌掌握情况况,考查查识图读图的的能力,以及灵灵活运用用图表表解决实实际问题题的能力力.解(1)因为为第二组组的频数数是6,频率是是0.1,所以以学生总总数为60.1=60,所以15组的的频数分分别为3,6,9,9,18;68组组的频率率分别为为频率分布布表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论