统计学 第5章参数估计_第1页
统计学 第5章参数估计_第2页
统计学 第5章参数估计_第3页
统计学 第5章参数估计_第4页
统计学 第5章参数估计_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第五章 参数估计本章主要内容 第一节 抽样推断的一般问题 第二节 抽样误差 第三节 抽样估计方法 第四节 抽样组织设计统计学 第五章 参数估计 某商家推出新产品之前,想了解消费者对新产品的接受程度和满意程度,为预测产品市场前景及设计相应市场策略提供依据。该商家委托调查公司对销售区域的消费者展开调查。调查公司随机抽取了10个主要城市的1000名消费者进行调查,样本数据显示75%的受访者能接受新产品,其中28%的消费者表示非常满意。那么调查公司这一调查结果可信吗?能不能根据这个调查结果估计新产品的的全国市场容量?为了进行这样的估计,应该具备哪些前提条件?2统计学 第五章 参数估计 3第一节第一节

2、 抽样推断的一般问题抽样推断的一般问题 一、抽样推断的概念 二、抽样推断的特征 三、抽样推断的内容 四、有关抽样的基本概念统计学 第五章 参数估计 第一节 抽样推断的一般问题本章目录 4一、抽样推断的概念一、抽样推断的概念 抽样推断抽样推断是根据随机原则从总体中抽取部分总体单位,以这一部分总体单位的实际数据推算总体相应数量特征的一种统计分析方法。 随机原则随机原则是指在抽样调查中,使每一个单位被抽中的概率都相等且不等于0。 随机抽样的目的随机抽样的目的是使样本与总体同分布。统计学 第五章 参数估计 第一节 抽样推断的一般问题5二、抽样推断的特征二、抽样推断的特征 是由部分推算整体的一种认识方法

3、; 按随机原则抽取样本; 运用概率估计的方法; 抽样推断的误差可以事先计算并加以控制。统计学 第五章 参数估计 第一节 抽样推断的一般问题6三、抽样推断的内容三、抽样推断的内容抽样估计 抽样估计是通过以样本数据对总体某一未知数量特征进行估计的一种统计分析方法。 假设检验 假设检验是根据研究的目的和要求,先对总体某一未知的数量特征作某种假设,然后根据样本数据对这一假设进行检验,以判断假设的真伪的一种统计分析方法。 统计学 第五章 参数估计 第一节 抽样推断的一般问题7四、有关抽样的基本概念 (一)总体和样本 (二)样本容量和样本个数 (三)参数和统计量 (四) 放回抽样和不放回抽样统计学 第五章

4、 参数估计 第一节 抽样推断的一般问题8(一)总体和样本总体 总体又称母体或全及总体,它是指所要认识的,具有某种共同性质的许多单位的集合体,也就是研究对象的全体。总体单位数一般用“N”表示。 样本 样本又称子样或总体样本,是从全及总体中抽取并进行观察,代表全及总体的那部分单位的集合体。样本单位数一般用“n”表示。 统计学 第五章 参数估计 第一节 抽样推断的一般问题9(二)样本容量和样本个数1样本容量 样本容量是指样本所包含的单位数。 2样本个数 样本个数又称样本可能数目,也就是从一个总体中可能抽取的样本个数。统计学 第五章 参数估计 第一节 抽样推断的一般问题 对于一次抽样调查,总体是唯一确

5、定的,而样对于一次抽样调查,总体是唯一确定的,而样本却是不确定的,一个全及总体可能抽出很多个样本却是不确定的,一个全及总体可能抽出很多个样本总体。本总体。 10(三)参数和统计量 全及指标与样本指标 全及指标 根据总体各单位的标志值或标志属性计算的,反映总体数量特征的综合指标称为全及指标。 全及指标是总体变量的函数,其数值是确全及指标是总体变量的函数,其数值是确定的、惟一的,因此称为定的、惟一的,因此称为参数参数。 统计学 第五章 参数估计 第一节 抽样推断的一般问题11 样本指标 根据样本各单位标志值或标志属性计算的,反映样本数量特征的综合指标称为样本指标。 样本指标是样本变量的函数,用来估

6、计总样本指标是样本变量的函数,用来估计总体参数,因此也称体参数,因此也称统计量统计量,其值随着样本,其值随着样本的不同而不同,因此的不同而不同,因此统计量是个随机变量统计量是个随机变量。统计学 第五章 参数估计 第一节 抽样推断的一般问题12ff xnxxpxp统计学 第五章 参数估计 第一节 抽样推断的一般问题(1)常用的参数(2)常用统计量a.平均数: 成数: b.方差: 成数方差:ffNXXXX222PXp)1 (2PPp ffnxxxx2222(1)ppp常用的参数和统计量fXfNXX13(四) 放回抽样和不放回抽样1.放回(重复)抽样 从N个单位中每次抽取1个,抽取后将其号码记下,再

7、放回,一直抽取n个单位组成一个样本,这样的抽样方法称为放回(重复)抽样。 2.不放回(不重复)抽样 从N个单位中每次抽取1个,抽取后不放回,一直抽取n个单位组成一个样本,这样的抽样方法称为不放回(不重复)抽样。 统计学 第五章 参数估计 第一节 抽样推断的一般问题本章目录 14第二节第二节 抽样误差抽样误差 一、抽样误差的概念及影响因素一、抽样误差的概念及影响因素 二、抽样平均误差二、抽样平均误差 三、抽样极限误差三、抽样极限误差统计学 第五章 参数估计 第二节 抽样误差本章目录 15一、抽样误差的概念及影响因素(一)抽样误差的概念 在抽样推断中,误差的来源很多,包括登记性误差和代表性误差。登

8、记性误差 又称为调查误差或工作误差,是指在调查过程中,由于各种主观或客观的原因而引起的误差。统计学 第五章 参数估计 第二节 抽样误差16代表性误差 是指在抽样调查中,样本各单位的结构情况不足以代表总体的状况,而用部分去推断总体所产生的误差。 它包括两类误差:系统性误差和随机性误差。统计学 第五章 参数估计 第二节 抽样误差17系统性误差 它是由于抽样时违反随机原则而产生的误差。 系统性误差和登记误差一样,都是抽样组织工作造成的,应该采取措施预防或将其减小到最低程度。随机性误差 它是指由于随机抽样的偶然因素使样本代表性不足而引起的。 随机性误差在抽样推断中是不可避免的。统计学 第五章 参数估计

9、 第二节 抽样误差18 抽样误差 广义:指代表性误差 狭义:专指抽样调查中的随机性误差统计学 第五章 参数估计 第二节 抽样误差19(二)抽样误差的影响因素 1.总体各单位标志值的差异程度; 2.样本的单位数; 3.抽样的方法; 4.抽样调查的组织形式。 重复抽样的抽重复抽样的抽样误差比不重样误差比不重复抽样的大复抽样的大单位数越多,单位数越多,抽样误差越小抽样误差越小差异越大,抽差异越大,抽样误差越大样误差越大简单随机抽简单随机抽样的抽样误样的抽样误差最大差最大统计学 第五章 参数估计 第二节 抽样误差20二、抽样平均误差(一)什么是抽样平均误差 抽样平均误差是反映抽样误差一般水平的指标,其

10、实质是指抽样平均数的标准差,它反映了抽样指标与总体指标的平均离散程度,通常用抽样平均数的标准差来衡量。(二)抽样平均误差的计算 1.重复抽样的条件下 2.不重复抽样的条件下统计学 第五章 参数估计 第二节 抽样误差211.重复抽样的条件下nXx:抽样平均误差统计学 第五章 参数估计 第二节 抽样误差 式中,n为样本容量; 为总体标准差一般情况下是未知,可用样本标准差 替代 。npp:成数的抽样平均误差 式中,n为样本容量; 为总体成数标准差一般情况下是未知,可用样本成数标准差 替代 。XxPp222.不重复抽样的条件下2X22:1(1)XxXxNnnNnNnN抽样平均误差当 很大时近似为统计学

11、 第五章 参数估计 第二节 抽样误差 式中,N为总体单位数;n为样本容量; 为总体方差一般情况下是未知,可用样本方差 替代。2x23 式中, N为总体单位数; n为样本容量; 为总体成数方差一般情况下是未知,可用样本成数方差 替代 。1:2NnNnPp成数的抽样平均误差)1 (2NnnNPp很大时近似为当2P2p统计学 第五章 参数估计 第二节 抽样误差24 由此可以看出,同样条件下,重复抽样与不重复抽样的抽样平均误差之间相差一个 ,称 为校正因子校正因子。 由于 ,因此在同样条件下,不重复抽样的平均误差总是小于重复抽样的平均误差。 在抽样比例 很小时,Nn1Nn111NnNn11Nn统计学

12、第五章 参数估计 第二节 抽样误差253.当总体方差和标准差未知时,可用以下方法解决: 用样本方差来代替总体方差 可用过去全面调查的资料,也可以用过去抽样调查的资料代替 如果有多个不同的材料,则应选择用方差数值较大的。 用估计资料代替统计学 第五章 参数估计 第二节 抽样误差26 例:某企业生产一批灯泡,共10000只,随机抽取500只作耐用时间实验。测算结果平均使用寿命为5000小时,样本标准差为300小时,500只中发现10只不合格。求平均数和成数的抽样平均误差。统计学 第五章 参数估计 第二节 抽样误差 重复抽样: 不重复抽样:27统计学 第五章 参数估计 第二节 抽样误差(小时)42.

13、13500300nx%63. 0500%981%981nPPp(小时)08.13100005001500300122Nnnx%61. 0100005001500%981%9811NnnPPp%98500490p28三、抽样极限误差 抽样极限误差抽样极限误差是指用绝对值形式表示的样本指标与总体指标偏差可允许的最大范围。即: 或 如果抽样极限误差用抽样平均误差来衡量,则有: 或 统计学 第五章 参数估计 第二节 抽样误差XxxPpp。;Pp;X,x为总体成数为样本成数为总体平均指标为样本平均指标式中xxtppt即抽样极限误差是抽样平均误差的多少倍。我们把倍数t称为抽样误差的概率度本章目录 29第三

14、节第三节 抽样估计方法抽样估计方法 一、一、抽样估计抽样估计的含义的含义 二、总体参数的点估计二、总体参数的点估计 三三、总体参数的区间估计、总体参数的区间估计 四四、样本容量的确定、样本容量的确定统计学 第五章 参数估计 第三节 抽样估计方法本章目录 30一、抽样估计的含义 抽样估计就是用实际调查的样本指标估计相应的总体指标。 由于总体指标可称为参数,所以又称为参数估计,参数估计分为点估计和区间估计两种方法。统计学 第五章 参数估计 第三节 抽样估计方法31二、总体参数的点估计(一)参数点估计的概念及特点(二)抽样估计量的优良标准(三)抽样估计的估计精度(四)抽样估计的置信度统计学 第五章

15、参数估计 第三节 抽样估计方法32(一)参数点估计的概念及特点1.概念概念 点估计又称为定值估计,就是用实际抽样调查资料得到的样本指标值直接作为相应总体参数的估计值 例如:用样本平均数直接代替总体平均数统计学 第五章 参数估计 第三节 抽样估计方法332.特点特点 方法简单,能够提供总体参数的具体估计值,从而可以作为行动决策的数量依据。 没有考虑抽样误差问题。即这种估计方法不能说明它有多大的把握程度,也不能说明它有多大的准确程度。统计学 第五章 参数估计 第三节 抽样估计方法34(二)抽样估计量的优良标准 统计学 第五章 参数估计 第三节 抽样估计方法无偏性无偏性 作为总体参数估计量的样本统计

16、量,要求其期望值(平均数)等于被估计的总体参数。这样的估计量称为无偏估计量。 有效性有效性 以抽样指标估计总体指标时,要求作为优良估计量的方差应比其它估计量的方差小。 一致性一致性 又称相合性,作为优良估计量的样本容量充分大时,抽样指标也应充分地靠近总体指标。 即方差越小的估计量就越有效一般情况下均可满足35(三)抽样估计的估计精度 误差率: 估计精度:统计学 第五章 参数估计 第三节 抽样估计方法xXxxx误差率pPppp误差率误差率估计精度136(四)抽样估计的置信度 抽样估计的置信度是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。置信度一般用“1-”表示。用公式表示为:统计学

17、 第五章 参数估计 第三节 抽样估计方法例如,例如,“在在95%置信度下,样本平均身高与总体平置信度下,样本平均身高与总体平均身高的误差不超过均身高的误差不超过5cm”表示在很多次抽样中,表示在很多次抽样中,样本平均身高与总体平均身高相差小于样本平均身高与总体平均身高相差小于5cm的抽样的抽样次数占总抽样次数的次数占总抽样次数的95%。 1tF37 同样,置信度可以通过正态分布概率表获得。 由此可见,抽样极限误差和估计的置信度密不可分:极限误差范围越小,估计的置信度也越小;极限误差范围越大,估计的置信度也越大。 11%27.68ttF统计学 第五章 参数估计 第三节 抽样估计方法 96. 19

18、6. 1%95ttF 22%45.95ttF 33%73.99ttF38三、总体参数的区间估计(一)区间估计的基本特点及要素(二)总体平均数(成数)的区间估计统计学 第五章 参数估计 第三节 抽样估计方法39(一)区间估计的基本特点及要素1.区间估计的基本特点区间估计的基本特点 根据给定的概率保证程度,利用实际抽样资料,指出总体参数可能存在的区间范围。这个区间称为置信区间。2.区间估计必须具备的三个要素区间估计必须具备的三个要素 (1)估计值 (2)抽样误差范围 (3)概率保证程度 统计学 第五章 参数估计 第三节 抽样估计方法40(二)总体平均数(成数)的区间估计xxxxxxXxXx,或,统

19、计学 第五章 参数估计 第三节 抽样估计方法其中,其中, 为极限误差为极限误差xxtppppppPpPp,或,其中,其中, 为极限误差为极限误差ppt41(二)总体平均数(成数)的区间估计统计学 第五章 参数估计 第三节 抽样估计方法1.计算抽样平均数和标准差:iiiffxxnxx或ffxxnxx22)()(如果总体标准差未知,则用样本标准差代替对于大样本用1)(1)(22ffxxnxx对于小样本用简简单单随随机机抽抽样样下下的的一一般般步步骤骤(1)平均数平均数(2)标准差标准差42(二)总体平均数(成数)的区间估计统计学 第五章 参数估计 第三节 抽样估计方法1.计算抽样平均数和标准差:或

20、抽样成数平均数和成数标准差:px )1 (pppppnnp11或简简单单随随机机抽抽样样下下的的一一般般步步骤骤(1)平均数平均数如果总体标准差未知,则用样本标准差代替(2)标准差标准差43(二)总体平均数(成数)的区间估计统计学 第五章 参数估计 第三节 抽样估计方法简简单单随随机机抽抽样样下下的的一一般般步步骤骤1.计算抽样平均数和标准差:或抽样成数平均数和成数标准差:重复抽样:2 .计算平均误差:不重复抽样:n)1(2NnNn)1 (2NnnN很大时很大时44(二)总体平均数(成数)的区间估计统计学 第五章 参数估计 第三节 抽样估计方法1.计算抽样平均数和标准差:或抽样成数平均数和成数

21、标准差:3 .计算计算极限误差:t简简单单随随机机抽抽样样下下的的一一般般步步骤骤2 .计算平均误差:45(二)总体平均数(成数)的区间估计统计学 第五章 参数估计 第三节 抽样估计方法1.计算抽样平均数和标准差:或抽样成数平均数和成数标准差:简简单单随随机机抽抽样样下下的的一一般般步步骤骤2 .计算平均误差:4 .计算计算区间的上下限:3 .计算计算极限误差:pppPpxxxXx或或46(二)总体平均数(成数)的区间估计统计学 第五章 参数估计 第三节 抽样估计方法1.计算抽样平均数和标准差:或抽样成数平均数和成数标准差:简简单单随随机机抽抽样样下下的的一一般般步步骤骤2 .计算平均误差:5

22、 .结果结果3 .计算计算极限误差:4 .计算计算区间的上下限:47(二)总体平均数(成数)的区间估计统计学 第五章 参数估计 第三节 抽样估计方法1.计算抽样平均数和标准差:或抽样成数平均数和成数标准差:简简单单随随机机抽抽样样下下的的一一般般步步骤骤2 .计算抽样平均误差:5 .结果结果3 .计算抽样计算抽样极限误差:4 .计算计算区间的上下限:48 例1:麦当劳餐馆在7星期内抽查49位顾客的消费额,得到平均消费额为32元,标准差为9.45元,求在90%的概率保证下,顾客平均消费的估计区间。统计学 第五章 参数估计 第三节 抽样估计方法49统计学 第五章 参数估计 第三节 抽样估计方法计算

23、抽样平均数和标准差(元)32x(元)45. 9计算抽样平均误差(元)35. 14945. 9nx根据给定的概率保证程度F(t) ,查表得概率度t(元)2 . 235. 164. 1xxt计算抽样极限误差 64. 1%90ttF估计总体消费额区间(元)8 .292 . 232xx(元).2342 . 232xx 以90%的概率保证,麦当劳餐馆的顾客平均消费额在29.834.2元之间。50 例2:在一项广告活动的跟踪调查中,在被调查的400人中有240人会记起广告的标语。试计算会记起广告标语占总体比率的95%置信度的估计区间。统计学 第五章 参数估计 第三节 抽样估计方法51统计学 第五章 参数估

24、计 第三节 抽样估计方法计算抽样成数平均数和标准差%604002401nnp49. 0%601%601ppp计算抽样平均误差%45. 24004 . 06 . 01nppp根据给定的概率保证程度F(t) ,查表得概率度t 96. 1%95ttF计算抽样极限误差%8 . 4%45. 296. 1ppt52统计学 第五章 参数估计 第三节 抽样估计方法估计总体比率的区间%2 .55%8 . 4%60pp%8 .64%8 . 4%60pp 以95%的概率保证,估计会记起广告标语的人数占总体比率在55.2%64.8%之间。53 例3:某乡水稻总面积20000亩,以不重复抽样方法从中随机抽取400亩,实

25、割实测得样本平均亩产645公斤,标准差72.6公斤。要求极限误差不超过7.2公斤。试对该乡水稻的亩产和总产量作出估计。统计学 第五章 参数估计 第三节 抽样估计方法54统计学 第五章 参数估计 第三节 抽样估计方法根据给定的极限误差,计算总体指标的区间范围(公斤)8 .6372 . 7645xx(公斤).26522 . 7645xx亩产量的上、下限:总产量的上、下限:万公斤)(.6127520000.8637万公斤)(.4130420000.265255统计学 第五章 参数估计 第三节 抽样估计方法计算抽样平均误差(公斤)6 . 32000040014006 .72122Nnnx计算概率度t,

26、并且查表得出概率保证程度F(t)26 . 32 . 7xxt %45.95tF 以95.45%的概率保证,该乡水稻平均亩产在637.8652.2公斤之间,总产量在1275.61304.4万公斤之间。56 例4:估计某市居民住户拥有电脑的普及率,随机抽取900户居民,其中675户有电脑。要求极限误差范围不超过2.8%,试对该市居民住户电脑普及率进行估计。统计学 第五章 参数估计 第三节 抽样估计方法57统计学 第五章 参数估计 第三节 抽样估计方法计算样本成数、标准差及抽样平均误差%759006751nnp43. 025. 075. 01ppp%4 . 190025. 075. 01nppp根据

27、给定的极限误差,计算总体成数区间的下限和上限%2 .72%8 . 2%75pp%8 .77%8 . 2%75pp计算概率度t,并且查表得出概率保证程度F(t)2%4 . 1%8 . 2ppt %45.95tF 以95.45%的概率保证程度,估计该市居民电脑普及率在72.2%77.8%之间。58四、样本容量的确定(一)确定适当样本容量的意义统计学 第五章 参数估计 第三节 抽样估计方法1.在一定的误差允许下,样本容在一定的误差允许下,样本容量太大,则会增大工作量,造成量太大,则会增大工作量,造成人力、财力和时间的浪费。人力、财力和时间的浪费。2.如果改变了对误差的要求,则如果改变了对误差的要求,

28、则可以通过增减样本容量来控制抽可以通过增减样本容量来控制抽样误差的大小。样误差的大小。59四、样本容量的确定(二)简单随机抽样下样本容量的确定统计学 第五章 参数估计 第三节 抽样估计方法ntt222tn22222tNNtn)1 (2Nnntt本章目录 60 3.应用上述公式计算样本容量应注意的问题: 上述公式计算的n是最低的,也是最必要的样本容量; 一般总体方差是未知的,在实际计算时往往用有关资料代替; 如果进行一次抽样调查,同时对总体平均数和总体成数进行区间估计,运用上述公式计算的 和 一般不等,为了同时满足两个推断的要求,一般在两个样本容量中选择较大的一个; 上面公式计算的n不一定是整数

29、,如果带小数,一般不采用四舍五入的办法化成整数,而是用比这个数大的临近整数代替。 例见P117-118xnpn统计学 第五章 参数估计 第三节 抽样估计方法61第四节 抽样组织设计一、抽样组织设计的基本原则二、几种常用的抽样组织形式统计学 第五章 参数估计 第四节 抽样组织设计本章目录 62一、抽样组织设计的基本原则(一)要保证随机原则的实现(二)要考虑样本容量(三)要考虑抽样的组织形式 组织方式不同,抽样的效果也不一样(四)要考虑调查费用 任何形式的抽样调查都是在一定费用的限制下进行的,在其它条件相同的情况下,应力求选用调查费用最小的方案。统计学 第五章 参数估计 第四节 抽样组织设计63二

30、、几种常用的抽样组织形式(一)简单随机抽样(二)类型抽样(三)等距抽样(四)整群抽样(五)多阶段抽样统计学 第五章 参数估计 第四节 抽样组织设计64(一)简单随机抽样(一)简单随机抽样统计学 第五章 参数估计 第四节 抽样组织设计65 简单随机抽样的优缺点: 优点优点:在理论上最符合随机的原则,其抽样误差是计算其它抽样组织方式下抽样误差的依据。 缺点缺点:在实践中会受到限制。统计学 第五章 参数估计 第四节 抽样组织设计66总体总体N样本样本n不等比例抽取不等比例抽取等比例抽取等比例抽取统计学 第五章 参数估计 第四节 抽样组织设计67关于类型抽样的说明关于类型抽样的说明分组标志的选择:一定

31、是与研究目的有关的标志类型抽样是将分组法和随机原则相结合类型抽样的优点: 它提高了样本的代表性 它降低了总方差对抽样误差的影响类型抽样可以是重复抽样也可以是不重复抽样统计学 第五章 参数估计 第四节 抽样组织设计68(三三) 等距抽样(机械抽样或系统抽样)等距抽样(机械抽样或系统抽样)nNd统计学 第五章 参数估计 第四节 抽样组织设计69 当总体排队时所依据的标志不是所要调查的标志,或者跟所要调查的标志无关或基本无关时,这种排队方法叫做无关标志排队法。按无关标志排队按无关标志排队统计学 第五章 参数估计 第四节 抽样组织设计70按有关标志排队按有关标志排队 当总体排队时所依据的标志就是所要调查的标志,或者虽不是所要调查的标志,但与所要调查的标志有密切关系或有一定关系时,这种排队方法叫做有关标志排队法。统计学 第五章 参数估计 第四节 抽样组织设计71随机起点等距抽样随机起点等距抽样 当抽样间隔d确定以后,在第一组随机抽选第一个样本单位,设顺序号为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论