概率论与数理统计chap07samplingandsamplingdistributions课件_第1页
概率论与数理统计chap07samplingandsamplingdistributions课件_第2页
概率论与数理统计chap07samplingandsamplingdistributions课件_第3页
概率论与数理统计chap07samplingandsamplingdistributions课件_第4页
概率论与数理统计chap07samplingandsamplingdistributions课件_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、概率论与数理统计chap07samplingandsamplingdistributions课件概率论与数理统计chap07samplingandsampl2022/9/11 牛牛文库文档分享2Why do we need sampling? 为什么需要抽样?General Census might be difficult. 全面调查可能十分困难人口普查,经济普查General census might be infeasible. 全面调查是不可行的灯泡或汽车轮胎寿命General census might be impossible. 全面调查根本不可能药效Sampling might

2、reduce cost. 抽样可能省时、省人、省物、省力;Sampling might be more accurate. 如果做法得当,抽样调查的结果有可能比全面调查更准确。2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享3Purpose of Sampling抽样目的The purpose of sampling is to estimate population parameters of interest using information contained in samples.抽样的目的是利用样本中所包含的信息对感兴趣的总体参数进行估计。In this ch

3、apter, we will show how data obtained from a simple random sample can be used to compute estimates of a population mean, a population standard deviation, and a population proportion. We will also introduce the important concept of sampling distribution.我们将在本章介绍怎样利用样本信息对总体均值、总体标准差和总体比率进行估计。我们还将介绍抽样分布

4、概念。2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享4Simple Random Sampling 简单随机抽样The purpose of statistical inference is to develop estimates and test hypotheses about the characteristics of a population using information contained in a sample.统计推断:从样本含有的信息中提取有关总体特征的信息。P165 (English Version p243),EAI(Electronics

5、 Associates, Inc.)公司人力资源调查:如何从2500名员工中抽取出一个包含有30个个体的样本,并利用样本信息对总体参数进行推断?2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享5The definition of a simple random sampling and the process of selecting a simple random sample depend on whether the population is finite or infinite.简单随机抽样方法取决于总体本身是有限的还是无限的。For Finite Popula

6、tion: A simple random sample of size n from a finite population of size N is a smaple selected such that each possible sample of size n has the same probability of being selected. 对于有限总体:如果总体中的每一个个体被抽中的概率都一样,则称这种抽样方法为(有限总体的)简单随机抽样。For Infinite Population: (1) Each element selected comes from the sam

7、e population. (2) Each element is selected independently. 对于无限总体:如果(1)每个个体都来自同一个总体,(2)每个个体的选择都是独立的,则称这种抽样方法为(无限总体的)简单随机抽样。2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享6Methods to generate a simple random sampling产生简单随机抽样样本的常用方法应用实例:从300人的工厂中选取一个包含30个个体的样本。把工人编号1到300用Excel中的均匀分布随机数发生函数生成随机数(采用小数点后保留三位)根据生成的随机数

8、表选择样本中的个体组成样本。Sampling with replacement有放回抽样Sampling without replacement无放回抽样Lot 抓阄Random Numbers (English Version p245)随机数表,中文版p167Random Numbers generated by computer.使用计算机产生随机数Excel2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享7Application 应用实例第169页第8题:选6个篮球队组成一个简单随机样本 (similar to English Version p248 Appli

9、cations 8)采用第167页(EV p245)随机数表采用第9列每行前二位数结果13,8,23,25,18,5 或马里兰州,衣阿华,佛罗利达州,弗吉尼亚,匹兹堡,俄克拉何马2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享8Return to EAI problem回到EAI问题(p165 ,English Version p242)EAI公司的人事主管为了制定一份简报,需要了解关于公司全体2500名管理人员的平均年薪以及公司中已经完成公司管理培训项目的管理人员所占的比例。公司全体管理人员的平均年薪总体均值完成公司管理培训项目的管理人员所占的比例总体比率为此,该公司的

10、人事主管选择了一个由30个管理人员组成的简单随机样本(说明使用Excel均匀分布随机数发生函数RANDBETWEEN产生样本)。对由30个管理人员组成的样本,人事主管调查了他们的年薪和参加管理培训项目的情况,数据见P185EAI.xls。2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享9Point Estimation 点估计对于一个我们感兴趣的总体参数(比如:平均值或标准差等),怎样从样本数据获得关于它们的估计?Point Estimation: we use the data from the sample to compute a value of a sample

11、 statistic that serves as an estimate of a population parameter.点估计:用样本数据计算一个样本统计量的值,并用这个值作为对应总体参数的估计。在EAI公司的问题中,我们用样本均值 作为总体均值 的点估计量,用样本比率 作为总体比率 的点估计量。2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享10EAI公司问题估计结果总体参数参数值(真值)点估计量点估计值年薪的总体均值51800美元年薪的样本均值51814美元年薪的总体标准差4000美元年薪的样本标准差s3347.72美元已完成管理培训项目的总体比率p0.60已

12、完成管理培训项目的样本比率0.632022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享11Common Point Estimations常用点估计 总体参数点估计总体均值样本均值总体标准差样本标准差总体比率样本比率2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享12More Cases 更多的实例加利福尼亚高速公路巡警保留着一项事故从报告到警员抵达事故现场所需要时间的记录。一个由十条记录组成的简单随机样本(以分钟为单位)如下:126 34 48 50 68 23 36 81 25 103a.事故从报告到警员抵达事故现场所需时间总体平均值的点估计为多少?

13、b.事故从报告到警员抵达事故现场所需时间总体标准差的点估计是多少?样本均值 = 59.4分钟 = 的点估计样本标准差 = 34.6分钟 = 的点估计2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享13More Cases 更多的实例1996年Louis Harris民意测验通过一项对1005名成人的调查来了解人们使用Internet 的情况,调查结果如下:874名成人知道Internet.503名成人是计算机使用者191名成人在过去的12个月中使用过Internet.试求如下总体参数的点估计。a.知道Internet的成人所占的比率。b.成人中计算机使用者所占比率。c.成

14、人中在过去的12个月中使用过Internet的人所占比率知道Internet的成人所占的比率(总体比率)的点估计为0.87.成人中计算机使用者所占比率(总体比率)的点估计为0.5.成人中在过去的12个月中使用过Internet的人所占比率(总体比率)的点估计为0.19.2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享14Sampling Distribution抽样分布Taking sampling mean as an example以样本均值 为例:Sampling distribution: A probability distribution consisting

15、 of all possible values of a sample statistic.每一次简单随机抽样将得到不同的样本组成,不同的样本将产生不同的样本估计值,由所有可能的样本估计值以及它们发生的概率组成的随机变量称为抽样分布。Why to discuss the sampling distribution of 为什么要讨论 的抽样分布?点估计的代表性如何度量?要回答这个问题,我们需要对抽样误差的大小作出概率度量。2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享15Sampling Distribution 抽样分布例1:从2,5,8,9中随机地抽取包含2个个体的

16、样本,计算样本均值,共有多少种不同的情况?(这个总体的均值为6,方差为7.5)这是一个新的随机变量,称为样本容量为2的样本均值 的抽样分布,它的均值为6,方差为2.5。样本组成样本均值概率2,53.51/62,851/62,95.51/65,86.51/65,971/68,98.51/62022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享16Sampling Distribution of 样本均值 的抽样分布The sampling distribution of is the probability distribution of all possible values

17、of the sample mean ,简单随机抽样的样本均值 的抽样分布是样本均值 的所有可能值的概率分布。Expected Value of 的期望值 where 2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享17This result shows that with simple random sampling, the expected value or mean for is equal to the mean of the population.样本均值 的数学期望 ,其中 是总体均值,即样本均值的数学期望就是总体均值,因此我们用样本均值的观测值作为总体均值

18、的估计值。Sampling Distribution of 样本均值 的抽样分布2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享18Sampling Distribution of 样本均值 的抽样分布The standard deviation of 样本均值 的标准差:Infinite Population Finite Population无限总体 有限总体 the standard deviation of the sampling distribution of 样本均值抽样分布的标准差 the standard deviation of the populat

19、ion 总体标准差 the sample size 样本容量 the population size 有限总体的总体容量Finite population correction factor有限总体的修正系数2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享19Further Thought 概念深入思考样本标准差对于一个给定的样本,它是一个数值;对于所有可能的样本,它是一个随机变量;度量样本数据的变异程度。样本均值的标准差对于给定的总体,它总是一个数值;度量样本均值(作为随机变量)的变异程度。2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享20Cal

20、culation of the Standard Deviation of 样本均值标准差的计算When the population is infinite; or the population is finite and the sample size is less then or equal to 5%of the population size当总体是无限的(infinite)或虽然总体是有限的(finite),但是样本容量(sample size)不大于总体容量(population)的5时,用以下公式计算样本均值的标准差: 即不用修正。回到例1,计算样本均值的标准差。例1回到EA

21、I公司问题,计算样本均值的标准差。样本标准差是多少?P185EAI2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享21Meaning of Standard Deviation of Sample Mean样本均值的标准差的意义Why it is important? 为什么需要讨论样本均值的标准差?The smaller the sample means standard deviation is, the more typical the sample mean is as an estimate of population mean. 样本均值的标准差越小,用样本均

22、值作为总体均值的点估计越有代表性。总体方差越小,用样本均值作为总体均值的点估计越有代表性。样本容量越大,用样本均值作为总体均值的点估计越有代表性。2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享22Central Limit Theorem中心极限定理In selecting simple random samples of size n from a population, the sampling distribution of the sample mean can be approximated by a normal probability distributi

23、on as the sample size becomes large.从总体中抽取样本容量很大的简单随机样本,当样本容量很大时,样本均值 的抽样分布可以用正态分布来近似。具体来说就是,当样本容量很大时,可近似为均值为 标准差为 的正态分布。上述结论也可以表述为:当样本容量很大时, 标准正态分布2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享23Practical Value of the Central Limit Theorem中心极限定理的应用无论总体服从什么分布,只要样本容量充分大,都可以用正态分布近似样本均值的抽样分布。中P177, 18 English p26

24、3 18 可以利用中心极限定理,求样本均值的取值落在某一区间内的概率。P177, 19 English p263 19样本容量越大,采用样本均值的观测值作为总体均值的估计值就越有意义。P177, 20 English p263 20关于样本容量:当总体服从正态分布时,对于任何样本容量,简单随机样本的样本均值都服从正态分布。对于其他总体分布,一般当样本容量不小于30时,我们就认为它是大样本,可以采用中心极限定理。对于0-1分布的总体,样本容量多大才算大样本不仅取决于样本容量 ,还依赖于成功的概率 。2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享24Sampling Dis

25、tribution of 样本比率 的抽样分布Sampling Distribution 的抽样分布是样本比率 的所有可能取值的抽样分布。Expected Value 的数学期望为 ,其中 为总体比率。Standard Deviation 的标准差为Infinite population无限总体: Finite population 有限总体:0-1分布总体情况下的中心极限定理:当 且 时,样本比率 的抽样分布可以用正态分布近似。2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享25Applications 应用实例中文版English VersionP181, 31 P2

26、69,33P181, 32P269,34P181, 34P269,36P181, 35P270,372022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享26Properties of point estimation 点估计的评价标准UnbiasednessThe sample statistic is an unbiased estimator of the population parameter ifWhere无偏性:如果样本统计量 满足条件 ,其中 为总体参数,则称样本统计量 为总体参数 的无偏估计量。2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档

27、分享27Biased estimation 有偏估计123Unbiased estimation 无偏估计123Properties of point estimation 点估计的评价标准2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享28Common Unbiased Estimates常用无偏估计样本均值 是总体均值 的无偏估计样本比率 是总体比率 的无偏估计样本方差 是总体方差 的无偏估计 2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享29Properties of point estimation 点估计的评价标准Efficiency:

28、Assume that a simple random sample of n elements can be used to provide two unbiased point estimators of the same population parameters.In this situation, we would prefer to use the point estimator with the smaller standard deviation. 有效性:对于样本容量相同的同一总体参数的两个无偏估计量,我们称标准差较小的那个估计量比另一个更有效。 比 更有效2022/9/9

29、牛牛文库文档分享2022/9/11 牛牛文库文档分享30Properties of point estimation 点估计的评价标准ConsistencyLoosely speaking, a point estimator is consistent if the values of the point estimator tend to become closer to the population parameter as the sample size becomes larger.一致性粗略的讲,样本容量越大,点估计量的值越接近于总体参数。我们前面讨论过的样本均值和样本比率都满足一

30、致性要求。满足一致性要求的有效估计量成为一致有效无偏估计量。2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享31Other Sampling Methods其他抽样方法Stratified Sampling 分层抽样The population is first divided into groups of elements (each element in the population belongs to one and only one stratum). And then, combining the stratum sample results which ar

31、e taken from each stratum into one population parameter estimate. It is called Stratified Sampling.将总体分成若干子总体(每一个个体属于且仅属于一个子总体),然后对每一个子总体采用一定的抽样方法进行抽样,将得到的各个样本合起来组成总体的一个样本,这个抽样方法称为分层抽样。2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享32Stratified Random Sampling 分层随机抽样Stratified Random Sampling 分层随机抽样If a simple

32、random sample is taken from each stratum, and was combined into one population parameter estimate, this method is called Stratified Random Sampling.如果对各子总体采用简单随机抽样,并将各样本合起来组成总体的一个样本,这个抽样方法称为分层随机抽样。If strata are homogeneous, this method is as “precise” as simple random sampling but with a smaller tot

33、al sample size.当每一个层内部的个体特征比较接近(同质性高,因而方差小)时,分层随机抽样的样本较具代表性。Advantage: We can get the stratum parameter estimate together with the population parameter estimate.它的好处是:在得到总体参数的估计的同时,还可以得到各子总体参数的估计。2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享33Cluster sampling整群抽样The population is first divided into separate g

34、roups of elements called clusters. Ideally, each cluster is a representative small-scale version of the population, and then A simple random sample of the clusters is then taken. All elements within each sampled (chosen) cluster form the sample. This sampling method is called Cluster sampling.将总体分成独

35、立的个体群体,总体中的每一个个体都属于且仅属于某一个群。简单随机抽样的单位为群,这种抽样方法称为整群抽样。2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享34Cluster sampling整群抽样If all clusters are alike in this regards, sampling a small number of clusters will provide good estimated of the population parameters.如果所有的群在意义上是同质的,则抽取小量的群就可以得到对总体参数好的估计。One of the primar

36、y applications of cluster sampling is area sampling. We can obtain a larger sample with a significantly lower total cost.整群抽样适用于区域抽样。它具有省时、省力、省钱的特点。2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享35Systematic Sampling 系统抽样First finding a random number and then counting or searching through the list of the popula

37、tion until the corresponding element is found. It is call Systematic Sampling.随机选定抽样的起始个体,然后按照一定的间隔选定样本的其他个体组成样本,这样的抽样方法称为系统抽样。There is only one element selected randomly. the other elements are decided by the first randomly selected element.系统抽样只有一个个体是随机抽取的,初始个体一旦被选定,其余个体均由间隔大小唯一决定。2022/9/9 牛牛文库文档分享2022/9/11 牛牛文库文档分享36Systematic Sampling 系统抽样There is only one element selected randomly. the other elements are decided by the first randomly selected element.系统抽样只有一个个体是随机抽取的,初始个体一旦被选定,其余个体均由间隔大小唯一决定。This

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论