![统计学chap参数估计_第1页](http://file3.renrendoc.com/fileroot3/2021-11/29/211381ee-9f43-491c-a5ad-0f89875c5f79/211381ee-9f43-491c-a5ad-0f89875c5f791.gif)
![统计学chap参数估计_第2页](http://file3.renrendoc.com/fileroot3/2021-11/29/211381ee-9f43-491c-a5ad-0f89875c5f79/211381ee-9f43-491c-a5ad-0f89875c5f792.gif)
![统计学chap参数估计_第3页](http://file3.renrendoc.com/fileroot3/2021-11/29/211381ee-9f43-491c-a5ad-0f89875c5f79/211381ee-9f43-491c-a5ad-0f89875c5f793.gif)
![统计学chap参数估计_第4页](http://file3.renrendoc.com/fileroot3/2021-11/29/211381ee-9f43-491c-a5ad-0f89875c5f79/211381ee-9f43-491c-a5ad-0f89875c5f794.gif)
![统计学chap参数估计_第5页](http://file3.renrendoc.com/fileroot3/2021-11/29/211381ee-9f43-491c-a5ad-0f89875c5f79/211381ee-9f43-491c-a5ad-0f89875c5f795.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1参数估计第五章 参 数 估 计2本章内容一、统计推断的基本问题和概念一、统计推断的基本问题和概念二、总体参数的点估计二、总体参数的点估计三、正态总体均值的区间估计三、正态总体均值的区间估计四、总体均值与成数的大样本区间估计四、总体均值与成数的大样本区间估计五、总体方差的区间估计五、总体方差的区间估计六、样本容量的确定六、样本容量的确定3统计推断的基本问题和概念( (一一) )统计推断的基本问题统计推断的基本问题( (二二) )简单随机抽样简单随机抽样和和抽样误差抽样误差 ( (三三) )统计量统计量及其及其抽样分布抽样分布4总体参数的点估计 ( (一一) )点估计的一般原理点估计的一般原理(
2、 (二二) )矩估计矩估计( (三三) )极大似然估计极大似然估计( (四四) )点估计量的优良标准点估计量的优良标准5正态总体均值的区间估计( (一一) )区间估计的概念和基本思想区间估计的概念和基本思想( (二二) )单正态总体均值的区间估计单正态总体均值的区间估计( (三三) )两正态总体均值之差的区间估计两正态总体均值之差的区间估计6一般总体均值与成数的大样本区间估计 ( (一一) )非正态总体均值的大样本区间估计非正态总体均值的大样本区间估计( (二二) )总体成数的大样本区间估计总体成数的大样本区间估计7正态总体方差的区间估计( (一一) )单正态总体方差的区间估计单正态总体方差的
3、区间估计( (二二) )两正态总体方差之比的区间估计两正态总体方差之比的区间估计8样本容量的确定( (一一) )总体均值估计的必要样本容量总体均值估计的必要样本容量( (二二) )总体成数估计的必要样本容量总体成数估计的必要样本容量( (三三) )影响必要样本容量的因素影响必要样本容量的因素为什么要确定必要样本容量为什么要确定必要样本容量9把所研究的问题或现象视为随机变量,有概率分布,它全把所研究的问题或现象视为随机变量,有概率分布,它全面描述了要研究的现象的统计规律性。如果知道了研究对象面描述了要研究的现象的统计规律性。如果知道了研究对象的概率分布,就比较清楚地了解了研究现象。的概率分布,就
4、比较清楚地了解了研究现象。但现实中,但现实中, 绝大多数情况下,并不知道要研究对象的分布,绝大多数情况下,并不知道要研究对象的分布,有时即使知道其分布类型,但不知道分布中所含的参数。有时即使知道其分布类型,但不知道分布中所含的参数。由于总体包含个体的大量性,研究者很难得到全部个体的由于总体包含个体的大量性,研究者很难得到全部个体的信息和资料,即使有时可以得到,但不经济。信息和资料,即使有时可以得到,但不经济。 统计推断的基本问题统计推断的基本问题10统计推断的基本问题统计推断的基本问题统计推断通常是从所要研究的对象全体中抽取一部分进行统计推断通常是从所要研究的对象全体中抽取一部分进行观测或试验
5、以获取信息,对总体作出推断。观测或试验以获取信息,对总体作出推断。由于抽取部分个体观测和试验是随机进行的,根据有限个由于抽取部分个体观测和试验是随机进行的,根据有限个体的数据对总体作出的推断不可能绝对准确,总包含误差,体的数据对总体作出的推断不可能绝对准确,总包含误差,这种推断的可靠性用概率表示比较恰当,概率大,推断就比这种推断的可靠性用概率表示比较恰当,概率大,推断就比较可靠,概率小,推断的准确性就低。较可靠,概率小,推断的准确性就低。如何根据观测或试验所得到的有限信息对总体作出推断,如何根据观测或试验所得到的有限信息对总体作出推断,并同时指出所作的这种推断有多大的可靠性并同时指出所作的这种
6、推断有多大的可靠性(用概率表示用概率表示),是统计推断的基本问题。是统计推断的基本问题。 11简单随机抽样简单随机抽样为什么要进行随机抽样?为什么要进行随机抽样?l由于种种原因,现实中很多现象不可能进行全面调查。由于种种原因,现实中很多现象不可能进行全面调查。 对具有破坏性或消耗性的产品进行质量检验对具有破坏性或消耗性的产品进行质量检验 对无限总体或总体容量过大的现象进行研究对无限总体或总体容量过大的现象进行研究 l某些现象即使理论上可以进行全面调查,但为了节省大某些现象即使理论上可以进行全面调查,但为了节省大量的人力、物力、财力和时间,在不影响精度和可靠度的量的人力、物力、财力和时间,在不影
7、响精度和可靠度的前提下,采用抽样推断可以达到事半功倍的效果。前提下,采用抽样推断可以达到事半功倍的效果。 12简单随机抽样简单随机抽样抽取的样本应能很好地代表总体;抽取的样本应能很好地代表总体;从总体中抽取样本有多种不同的方法,最简单的、应用很从总体中抽取样本有多种不同的方法,最简单的、应用很普遍的抽样方法是普遍的抽样方法是简单随机抽样简单随机抽样,它满足以下两个条件:,它满足以下两个条件:(1)总体的每一个体都有同等机会被选入样本;)总体的每一个体都有同等机会被选入样本;(2)样本的分量)样本的分量 是相互独立的随机变量,即样是相互独立的随机变量,即样本中任一个体的取值不影响其他个体的取值。
8、本中任一个体的取值不影响其他个体的取值。满足这两个条件的抽样方法称为满足这两个条件的抽样方法称为简单随机抽样简单随机抽样,由此得到,由此得到的样本称为简单随机样本。易见,简单随机样本的样本称为简单随机样本。易见,简单随机样本 独立同分布(有时用独立同分布(有时用 表示)。表示)。 nXXX,21nXXX,21. . di i13简单随机抽样简单随机抽样l从总体中抽样有多种方法和技术从总体中抽样有多种方法和技术, 除除简单随机抽样简单随机抽样外外, 分分层抽样、系统抽样层抽样、系统抽样和和整群抽样整群抽样也是常用的抽样方法也是常用的抽样方法, 不同不同的抽样方法得到不同的样本的抽样方法得到不同的
9、样本, 所用的统计推断方法也不尽所用的统计推断方法也不尽相同。相同。l如无特别说明,所提到的样本都是指简单随机样本。如无特别说明,所提到的样本都是指简单随机样本。 l在一次抽样后,观测到在一次抽样后,观测到 的一组确定的值或数的一组确定的值或数据据 称为该称为该样本的观测值样本的观测值或或样本数据样本数据,也称作该,也称作该样本的一个样本的一个实现实现。样本所有可能观测值的全体就构成了样。样本所有可能观测值的全体就构成了样本空间。本空间。 ),(21nXXX),(21nxxx14l由于样本中每一个个体由于样本中每一个个体 都来自总体都来自总体 ,所以样本中的,所以样本中的任一个体任一个体 的分
10、布函数和总体相同,即的分布函数和总体相同,即 的分布函数为的分布函数为 简单随机样本简单随机样本 相互独立。相互独立。l如无特别说明,一般用大写英文字母或希腊字母表示随如无特别说明,一般用大写英文字母或希腊字母表示随机变量,而用小写英文字母表示随机变量的观测值或数据。机变量,而用小写英文字母表示随机变量的观测值或数据。简单随机抽样简单随机抽样iXXiXiX)(ixFnXXX,2115样本只是总体的部分个体,不能完全包含总体的全部信息。样本只是总体的部分个体,不能完全包含总体的全部信息。无论抽样方法多么先进、抽样过程多么仔细,总体的信息在无论抽样方法多么先进、抽样过程多么仔细,总体的信息在样本中
11、总会有损失。样本中总会有损失。不管采用什么推断方法,由样本推断总体时,必定存在差不管采用什么推断方法,由样本推断总体时,必定存在差异异; 总体未知参数和相应的基于样本的统计量之间的差异称总体未知参数和相应的基于样本的统计量之间的差异称为为抽样误差抽样误差。抽样误差是抽样推断方法所固有的,只能采用一些措施抽样误差是抽样推断方法所固有的,只能采用一些措施(提提高样本的代表性、增加样本容量等高样本的代表性、增加样本容量等)减少抽样误差,但无法减少抽样误差,但无法完全消除;只要利用抽样推断方法,完全消除;只要利用抽样推断方法,抽样误差就一定存在抽样误差就一定存在,在参数的点估计、区间估计和假设检验等统
12、计推断过程中都在参数的点估计、区间估计和假设检验等统计推断过程中都伴有抽样误差。伴有抽样误差。 抽样误差抽样误差16抽样误差抽样误差17抽样误差抽样误差18抽样误差抽样误差总体的变异程度愈大,抽样误差就越大。总体的变异程度愈大,抽样误差就越大。19统计量统计量统计量统计量是不依赖于任何未知参数的样本的可测函数,它是一个是不依赖于任何未知参数的样本的可测函数,它是一个随机变量随机变量。在由样本推断总体时,往往是通过统计量把样本信息加工浓缩起来,进在由样本推断总体时,往往是通过统计量把样本信息加工浓缩起来,进而解决要研究的问题。而解决要研究的问题。统计量的观测值:统计量的观测值:把样本的观测值代入
13、统计量公式计算出的数值;把样本的观测值代入统计量公式计算出的数值;第四章讲的算术平均数、标准差、方差、原点矩、中心矩及偏度、峰第四章讲的算术平均数、标准差、方差、原点矩、中心矩及偏度、峰度等都是统计量的观测值公式。度等都是统计量的观测值公式。 注:注:虽然统计量不含有任何未知参数,但是其分布可能包含未知参数。虽然统计量不含有任何未知参数,但是其分布可能包含未知参数。20统计量是随机变量,它有自己的分布密度和分布函数。统计量是随机变量,它有自己的分布密度和分布函数。统计量的分布称为统计量的分布称为抽样分布抽样分布。由样本推断总体的特征时由样本推断总体的特征时, 正是依据统计量的抽样分布。正是依据
14、统计量的抽样分布。由于正态分布在统计学中的应用十分普遍,样本均值和样由于正态分布在统计学中的应用十分普遍,样本均值和样本方差在统计学中也起着非常重要的作用,所以给出正态总本方差在统计学中也起着非常重要的作用,所以给出正态总体的样本均值和样本方差的抽样分布,这是统计推断的体的样本均值和样本方差的抽样分布,这是统计推断的理论理论依据和基础依据和基础。 抽样分布抽样分布21非正态总体样本均值的抽样分布非正态总体样本均值的抽样分布 22图图5.1 5.1 样本均值的抽样分布随样本均值的抽样分布随n变化趋于正态分布的过程变化趋于正态分布的过程 23点估计的一般原理点估计的一般原理24点估计的优点:能够提
15、供总体参数的具体估计值,可以作点估计的优点:能够提供总体参数的具体估计值,可以作为行动决策的数量依据。为行动决策的数量依据。 点估计的不足:不能提供误差情况如何、误差程度有多大点估计的不足:不能提供误差情况如何、误差程度有多大构造统计量时,利用构造统计量时,利用不同的原理和思想不同的原理和思想就可以得到不同的就可以得到不同的统计量,常用的有统计量,常用的有矩估计矩估计和和极大似然估计极大似然估计点估计的优点和不足点估计的优点和不足25矩估计法是英国统计学家矩估计法是英国统计学家K. Pearson提出的。提出的。基本思想基本思想:样本来源于总体,样本矩在一定程度上反映了总样本来源于总体,样本矩
16、在一定程度上反映了总体矩,由大数定律知样本矩依概率收敛到总体矩,因此用样体矩,由大数定律知样本矩依概率收敛到总体矩,因此用样本矩来近似相应的总体矩;又因总体分布的参数一般都是总本矩来近似相应的总体矩;又因总体分布的参数一般都是总体矩的函数,从而得到总体未知参数的估计,称为体矩的函数,从而得到总体未知参数的估计,称为矩估计矩估计。矩估计矩估计优点优点: (1)只要总体的只要总体的k阶矩存在,就可以应用阶矩存在,就可以应用; (2)简单、直观,不必知道总体的分布类型。简单、直观,不必知道总体的分布类型。 若研究者并不清楚所研究现象的分布,可以应用矩估计;若研究者并不清楚所研究现象的分布,可以应用矩
17、估计;但如果总体的分布类型已知,则采用极大似然估计更合适但如果总体的分布类型已知,则采用极大似然估计更合适(由由于矩估计此时不能充分利用总体分布提供的信息于矩估计此时不能充分利用总体分布提供的信息)。矩估计矩估计 26极大似然估计极大似然估计271. 1. 无偏性无偏性2. 2. 一致性一致性 3. 3. 有效性有效性 为为 任意一个无偏估计量,任意一个无偏估计量,则称则称 是是 的有效估计。的有效估计。22)(,)(;)(SEpEXE1|; 1|limlimpPxPnn点估计量的优良标准点估计量的优良标准)(Var)Var(1128区间估计的概念和基本思想区间估计的概念和基本思想 双侧置信区
18、间的端点常常是未知参数的估计量的函数。双侧置信区间的端点常常是未知参数的估计量的函数。 双侧置信区间是一个随机区间,其两个端点都是随机变量,双侧置信区间是一个随机区间,其两个端点都是随机变量,该随机区间可能包含待估计的未知参数,也可能不包含。该随机区间可能包含待估计的未知参数,也可能不包含。 29 置信区间越小,说明估计的精度越高,即我们对未知参数置信区间越小,说明估计的精度越高,即我们对未知参数的了解越具体;置信水平越大,估计可靠性就越大。的了解越具体;置信水平越大,估计可靠性就越大。 在样本容量一定的前提下,精度与置信水平往往相互矛盾;在样本容量一定的前提下,精度与置信水平往往相互矛盾;若
19、置信水平增加,则置信区间必然增大,精度降低;若精度若置信水平增加,则置信区间必然增大,精度降低;若精度提高,则区间缩小,置信水平必然减小。要想同时提高估计提高,则区间缩小,置信水平必然减小。要想同时提高估计的置信水平和精度,就要增加样本容量。的置信水平和精度,就要增加样本容量。 置信区间和第六章的假设检验关系密切,两者有着对偶的置信区间和第六章的假设检验关系密切,两者有着对偶的关系,只要有一种假设检验就可以根据该假设检验构造相应关系,只要有一种假设检验就可以根据该假设检验构造相应的置信区间,反之亦然。的置信区间,反之亦然。 置信区间的构建往往要借助于置信区间的构建往往要借助于未知参数点估计未知
20、参数点估计(或其函数或其函数)及其抽样分布。及其抽样分布。 置信区间的性质置信区间的性质30置信区间的含义置信区间的含义31分位数及其计算分位数及其计算符号:分位数、临界值;使用Excel计算方法查表方法Ftzz,22ttzz11,),(: ),();,(: ),(n),(: )();,(: )()(:);2(:)1 (:);1 (:222222222nmfinvnmFnmfinvnmFchiinvnnchiinvntinvttinvtnormsdistznormsdistz32单正态总体均值的区间估计单正态总体均值的区间估计( (方差已知时方差已知时) )nzx2nzx2x正态分布分位数见正
21、态分布分位数见教材的图教材的图5.25.23334单正态总体均值的区间估计单正态总体均值的区间估计(方差未知时方差未知时)niixxnS122)(113536) 1(,) 1(22nSntXnSntX),(22nSzXnSzX37t分布与标准正态分布的比较分布与标准正态分布的比较 3839两正态总体均值之差的区间估计两正态总体均值之差的区间估计 1. 1. 两个正态总体的方差两个正态总体的方差 和和 已知已知两个正态总体均值之差置信水平为两个正态总体均值之差置信水平为 的置信区间为的置信区间为),(2221222122mnzYXmnzYX2122140412. 2. 两个正态总体的方差两个正态
22、总体的方差 和和 未知,但未知,但两正态总体均值之差两正态总体均值之差 的置信水平为的置信水平为 的置信区间为的置信区间为212222221)11)2(,11)2(22mnSmntYXmnSmntYXpp2112) 1() 1(2221mnSmSnSp,)(111221niiXXnS,)(111222miiYYmS其中其中4243如果样本量如果样本量n和和m较小,则较小,则利用利用上式计算置信区间不合适。上式计算置信区间不合适。如果两个样本不是独立的,而是配对样本,也不能用上式。如果两个样本不是独立的,而是配对样本,也不能用上式。3. 3. 两个正态总体的方差两个正态总体的方差 和和 未知,且
23、未知,且两正态总体均值之差两正态总体均值之差 的置信水平为的置信水平为 的的近似近似置信区置信区间为间为21222221211),(2221222122mSnSzYXmSnSzYX44( (一一) ) 单个非正态总体的均值的大样本置信区间单个非正态总体的均值的大样本置信区间 来自某总体来自某总体( (不不必必是正态总体是正态总体) ),假定总体方差,假定总体方差 存在存在但未知,总体均值但未知,总体均值 未知,则总体均值未知,则总体均值 的置信水平为的置信水平为 的的近似近似置信区间为置信区间为( (二二) ) 两个非正态总体的均值之差的置信区间两个非正态总体的均值之差的置信区间 和和 分别是
24、从总体分别是从总体X和和Y(不是正态总体不是正态总体)抽取的抽取的样本,且相互独立,两总体方差样本,且相互独立,两总体方差 和和 未知,总体均值未知,总体均值 和和 未知;则总体均值之差未知;则总体均值之差 的置信水平为的置信水平为 的大样本置的大样本置信区间为信区间为 非正态总体均值的大样本区间估计非正态总体均值的大样本区间估计 nXX,121),(22nSzXnSzX),(2221222122mSnSzYXmSnSzYXmYY,11nXX,121222211当总体分布对称、单峰的连续时,不需要太大的样本容量,用正态分布近似就会有很好的当总体分布对称、单峰的连续时,不需要太大的样本容量,用正
25、态分布近似就会有很好的效果,当总体分布不对称或是多峰或离散分布时,则需要较大的样本容量效果,当总体分布不对称或是多峰或离散分布时,则需要较大的样本容量( (如如50)50),才能,才能得到比较好的近似效果得到比较好的近似效果. .45总体成数的大样本区间估计总体成数的大样本区间估计 单总体单总体46【例【例5.6】某公司有职工】某公司有职工3000人,从中随机抽取人,从中随机抽取100人调查其工资收入情况。人调查其工资收入情况。调查结果表明,职工的月平均工资为调查结果表明,职工的月平均工资为3350元,标准差为元,标准差为403元,月收入在元,月收入在5000元及以上职工元及以上职工8人。试以
26、人。试以95.45%的置信水平推断该公司职工的置信水平推断该公司职工月平均工月平均工资所在的范围资所在的范围和和月收入在月收入在5000元及以上职工在全部职工中所占的比重元及以上职工在全部职工中所占的比重。 4748两个总体成数之差的近似区间估计两个总体成数之差的近似区间估计49【例【例5.75.7】分别从两个同行公司中随机抽取分别从两个同行公司中随机抽取100100人和人和120120人调人调查其工资收入情况。调查结果表明,查其工资收入情况。调查结果表明,A A公司月收入在公司月收入在50005000元元及以上有职工及以上有职工9 9人,人,B B公司月收入在公司月收入在50005000元及
27、以上的职工有元及以上的职工有6 6人。试以人。试以95%95%的置信水平推断这两个公司职工月工资在的置信水平推断这两个公司职工月工资在50005000元及以上职工所占的比重之差的置信区间;该结果能说元及以上职工所占的比重之差的置信区间;该结果能说明明A A公司公司50005000元及以上职工所占的比重比元及以上职工所占的比重比B B公司高吗?公司高吗?5051单正态总体方差的区间估计单正态总体方差的区间估计 5253两正态总体方差之比的区间估计两正态总体方差之比的区间估计 545556参数估计时为什么要确定必要样本容量参数估计时为什么要确定必要样本容量参数估计时,既希望估计的可靠度或置信度要高,又希望参数估计时,既希望估计的可靠度或置信度要高,又希望估计的精度要高,这就需要较多的样本量;但估计的精度要高,这就需要较多的样本量;但样本容量过多样本容量过多,必然会增加人力、财力、物力的支出。必然会增加人力、财力、物力的支出。样本容量过少样本容量过少,又会导致抽样误差增大,达不到抽样所要,又会导致抽样误差增大,达不到抽样所要求的准确程度。求的准确程度。必要样本容量就是在保证误差不超过规定范围的条件下尽必要样本容量就是在保证误差不超过规定范围的条件下尽可能节省人、财、物的支出可能
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度智慧城市建设项目合同施工范围及服务标准
- 2025年度绿色建筑项目贷款合同公证
- 2025年度在线教育平台讲师与课程开发合同
- 2025年度工程造价咨询企业项目风险管理合同
- 2025年度医疗健康公司间设备融资租赁借款合同范本
- 2025年度股东保密协议及企业社会责任合同
- 2025年度海上石油钻井平台物资运输合同2025年度海上旅游航线船舶租赁协议
- 2025年度民间借款合同范本参考
- 2025年度房屋拆除与土地复垦一体化施工合同
- 2025年度新能源汽车制造劳动合同规范
- 《金属加工的基础》课件
- 运输行业春节安全生产培训 文明驾驶保平安
- 体验式沙盘-收获季节
- 老年护理陪护培训课件
- 2019年420联考《申论》真题(山西卷)试卷(乡镇卷)及答案
- 医院投诉纠纷及处理记录表
- YY/T 0698.5-2023最终灭菌医疗器械包装材料第5部分:透气材料与塑料膜组成的可密封组合袋和卷材要求和试验方法
- 酱香型白酒工厂设计
- 【深度教学研究国内外文献综述2100字】
- 牵引管道孔壁与管道外壁之间注浆技术方案
- 新人教版四年级下册数学教材解读课件
评论
0/150
提交评论