简单随机抽样

上传人：大*** IP属地：安徽上传时间：2023-06-27 格式：PPT 页数：147 大小：2.11MB 积分：80 举报 版权申诉

已阅读5页，还剩142页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

简单随机抽样：代表性：中每一个与所考察的总体有相同的分布。2.独立性：是相互独立的随机变量。

样本及抽样分布

假如总体的分布函数为简单随机样本的联合分布函数为概率密度为：

样本平均值：样本方差：

统计量：由样本构造的一些函数，不含任何未知参数。完全由样本决定的量。

样本标准差：样本k阶（原点）矩：样本k阶中心矩：经验分布函数定义：设是取自总体X～F（x）的一个样本，把样本观察值从小到大排列为称函数为总体X的经验分布函数。

格里汶科（Glivenko）在1933年证明了以下的结果：对于任一实数，当时以概率1一致收敛于分布函数

例：从一批标准重量为500g的罐头中，随机抽取8听，测得误差如下（单位：g）:8，－4，6，－7，－2，1，0，1求经验分布函数，并作出图形。解：将样本值按大小顺序排列为－7〈－4〈－2〈0〈1＝1〈6〈8则样本经验分布函数为

抽样分布：统计量的分布称为“抽样分布”。精确抽样分布：

总体X的分布已知，如对于任一n,都能导出统计量的明显表达式，这种分布称为精确抽样分布。它常用于小样本的统计推断问题。

渐近分布：在样本容量n无限大时，能获得统计量的极限分布，这种分布称为渐近分布。它常用于大样本的统计推断问题。几个常用统计量的分布（1）分布～N（0，1），则称统计量服从自由度为n的分布，记为自由度为上式右端包含的独立变量的个数。设概率密度图形。

由分布的可加性：设并且独立，则有：

分布的数学期望和方差：若

分布的分位点：表只详列到n=45为止。费歇曾证明，当n充分大时，近似地有：（2）t分布设且X,Y独立，则称随机变量：

服从自由度为n的t分布，记为t～t(n)。

图形关于t=0对称，当n充分大时其图形类似于标准正态概率密度的图形。

t分布的分位点：

由图形的对称性知。

（3）F分布

设且独立，则称随机变量服从自由度为的F分布，记为

的图形。由定义可知F分布的分位点

定理一：设是来自正态总体的样本，是样本均值，则有：（4）正态总体的样本均值与样本方差的抽样分布

定理二：设是总体的样本，,分别是样本均值和样本方差，2°与独立。

则有：1°

定理三：设是总体的样本，,分别是样本均值和样本方差，则有：定理四：设分别是来自正态总体的样本，且这两个样本相互独立。设分别是这两个样本的样本均值，分别是这两个样本的样本方差，则有

1°

2°其中例

设总体X服从正态分布是来自总体X的简单随机样本，则随机变量服从什么分布，自由度是多少。

[分析]根据简单随机样本的性质，相互独立，服从同分布易见也相互独立，并且由于故从而有即，因此Y服从F分布，自由度为（10，5）。

估计量优良性常用的几条标准：

无偏心、有效性、相合性。（1）无偏性

（2）有效性（3）相合性第七章参数估计两种基本方法：点估计、区间估计。

是总体均值样本方差

是总体方差σ2的无偏估计。

样本均值的无偏估计；样本二阶中心矩不是σ2的无偏估计，S也不是σ的无偏估计。

最小方差无偏估计：

为的任一无偏估计。

寻求估计量的方法:

矩估计法

最大似然估计法

（1）矩估计法:

用样本各阶矩去估计总体各阶矩。概率密度为分布律为它的前k阶矩可以解出以样本矩分别代替上式中的就有分别作为的估计量。例5：设总体X的均值都存在，且有。但均为未知，又设是来自总体X的一个样本，求的矩估计量。

解：总体一阶矩：总体二阶矩：由矩法，用样本矩去估计总体矩，令:

＝A1

解得：

所得结果表明，总体均值与方差的矩估计量的表达式不因总体分布不同而异。

总结：矩估计法的优点是简便易行，并不需要事先知道总体的分布；

缺点是：在总体分布类型已知的场合，没有充分利用分布提供的信息。一般场合下，矩估计量不具有唯一性。

由费希尔（R.A.Fisher）引进的最大似然估计法，就是固定样本观察值，在取值的可能范围内挑选使似然函数达到最大的参数值，作为参数的估计值，即取使称为参数的最大似然估计值，而相应的统计量称为参数的最大似然估计量。

（2）最大似然估计法

设是来自总体X的一个样本，则的联合密度为：设是相应于样本的一个样本值，则随机点落在点的邻域（边长分别为的n维立方体）内的概率近似地为其值随的取值而变化。与离散型的情况一样，取的估计值使概率取到最大值。

的最大值。这里称为样本的似然函数。若：则称为的最大似然估计值，称为的最大似然估计量。考虑函数：可从方程：解得。也可以从方程：

求得。从后一方程求解往往比较方便，称为对数似然方程。

例：设试求参数P的最大似然估计量。是样本的一个样本值。X的分布律为：似然函数为：取对数

是来自总体X的一个样本，解：设令

解得p的最大似然估计值：p的最大似然估计量为：这一估计量与矩估计量是相同的。例：设为未知参数是来自总体X的一个样本值。求的最大似然估计量。解：X的概率密度为：似然函数为：取对数令解得得的最大似然估计量为：它们与相应的矩估计量相同。

求最大似然估计值的一般步骤是：由总体分布导出样本的联合分布律函数（或联合概率密度）；2.把样本联合分布律函数（或联合概率密度）中自变量看成已知常数，而把参数看作自变量，得到似然函数3.求似然函数的最大值点（常常转化为求

的最大值点）；4.在最大值点的表达式中，用样本值代入就得参数的最大似然估计值。

一般，用最大似然法所得的估计的性质比用矩法所得的要好，故通常多用最大似然法。

由所有产品的失效时间所组成的样本。完全样本:2基于截尾样本的最大似然估计常用的两种截尾寿命试验：一种是定时截尾寿命试验此时m是一个随机变量，所得的样本称为定时截尾样本。

2.另一种是定数截尾寿命试验所得的样本称为定数截尾样本。有二个要求：要求以很大的可能被包含在区间2.估计的精度要尽可能高，即要求区间的长度内，即：概率要尽可能大。尽可能小。3区间估计

置信区间：称随机区间是的置信水平为的置信区间。

和置信上限，称为置信水平。

分别称为双侧置信区间的置信下限

可以得到未知参数的任何置信水平小于1的置信区间置信水平愈高，相应的区间平均长度愈长（在同样的样本容量下）。在同样的置信水平下，样本容量愈大，区间平均长度愈短。

求置信区间的步骤如下：明确问题，求什么参数的置信区间？置信水平

是多少？2.寻找参数的一个良好的点估计W。3.寻找（或构造）一个待估参数θ和估计量W的函数

S(W,θ),其分布为已知，并且不依赖于任何未知数。

称S(W,θ)为枢轴量。如

4.对于给定的置信水平分布，确定常数a,b使得5.对“”作等价变形，得到如下形式：则就是参数的置信水平为，根据S(W,θ)的的置信区间。4正态总体均值与方差的区间估计（一）单个总体1°均值（1）

的情况的置信区间为已知（2）考虑到是的无偏估计，将上式中的换成，取枢轴量对给定的置信水平，查t分布分位数表的使

为未知即于是，得到了的一个置信水平为的置信区间或在实际问题中，总体方差未知的情况居多。（3）总体分布未知，但样本容量n很大此时由中心极限定理，知因此若总体方差已知时，得到的一个置信水平为的近似置信区间但一般未知，用S近似代替，这样得到的一个置信水平为的近似置信区间近似服从N(0,1)2°方差例：设为总体的样本，未知，求参数的置信水平为

解：的无偏点估计为样本方差S2。已知的置信区间的置信区间。对给定的置信水平，查分布上分位点表可得即得到方差的一个置信水平为的置信区间标准差的一个置信水平为的置信区间

（二）两个总体1°两个总体均值差的情况

的置信区间具体步骤为：

(1)两总体均为正态，设，分别为的无偏估计，故的无偏估计量是由的独立性以及得：或

已知。对给定的置信水平1—，查标准正态分布函数表得使即得的一个置信水平为1—的置信区间：(2)两总体均为正态，但为未知。

其中，从而可得的一个置信水平为1—的置信区间为：

(3)两总体分布未知，但用去估计根据中心极限定理，近似有类似可得的一个置信水平为1—的近似置信区间为：很大。2°两个总体方差比由第六章定理四：不依赖任何未知参数。由此得：即：的置信区间对于任意满足随机区间是的置信水平为的单侧置信区间，称为的置信水平为的单侧置信下限。

6单侧置信区间又若统计量，对于任意满足称随机区间是的置信水平为的单侧置信区间，称为的置信水平为的单侧置信上限。

概率反证法的逻辑是：假设原假设成立，如果小概率事件在一次试验中发生，就可以有很大的把握否定原假设。在假设检验中，称这个小概率为显著性水平。第八章假设检验

具体有两类假设检验问题：（1）对参数的假设检验。（2）对总体分布的假设检验。假设检验的一般步骤：（1）提出原假设及备择假设（对立假设）（2）选取一个适当的统计量T，在（3）根据给定显著性水平（4）算出统计量T的实测值，将实测值与拒绝域对照

，若实测值落入拒绝域，则否定原假设否则，就认为差异不显著而不能否定原假设。

成立的条件下求出它的分布（或近似分布）；，求出拒绝域C；两类错误及其概率

第一类错误：第二类错误：

显著性检验

控制犯第1类错误的概率加以，使它不大于,而不考虑犯第II类错误的概率的检验，称为显著性检验。不管在什么情况下，为了保证都不应太小。

不致太大，样本容量

双侧检验与单侧检验假设检验

其中，表示可能大于，也可能小于的拒绝域分别在两侧。在上述例1中，拒绝域为，－），（，＋在很多情况下，会提出如下形式的原假设：对应的备择假设是称这类假设检验为单侧假设检验或单边假设检验。

，这类检验（－），称这类假设检验为双侧假设检验。正态总体均值、方差的检验法（显著性水平为）原假设H0检验统计量备择假设H1拒绝域原假设H0检验统计量备择假设H1拒绝域例题：例1：某种元件的寿命X（以小时计）服从正态分布159280101212224379179264222362168250149260485170问是否有理由认为元件的平均寿命大于225（小时）？（解：检验假设（原假设取与题意相反的假设）因为均未知，用t检验法，其拒绝域为：均未知。现测得16只元件的寿命如下：）算得即有：t没有落在拒绝域中，故接受H0，即认为元件的平均寿命不大于225小时。

3分布拟合检验皮尔逊的

专用于检验分布是否为正态的“偏度、峰度检验法”。

检验法（一）检验法检验法是在总体的分布未知时，根据它的n个样本总体X的分布函数不是若总体X为离散型，则:总体X的分布律为若总体X为连续型，则总体X的概率密度为

来检验总体分布假设的一种方法。原假设为：总体X的分布函数为（可以不写出）分布拟合的（1）将总体X的可能取值范围或全体的小区间或子集，记作（2）把落入第i个小区间的样本值的个数记作称为实测频数。所有实测频数之和（3）当为真时，可以根据计算事件的概率，得到，于是就是落入的样本值的理论频数。

检验法基本思想和步骤如下：分成k个互不重迭等于样本容量n。所假设的X的分布函数来显然，实测频数与理论频数

皮尔逊引进了如下统计量表示经验分布与理论分布之间的差异：其中是随机变量，在理论分布已给定的情况下，之间的差标志着经验分布与理论分布之间的差异的大小。是常量。皮尔逊证明了如下定理：如原假设中的理论分布已经完全给定，那么当时，统计量

＝＝的分布近似服从个自由度的分布。

如果理论分布估计量来代替（一般用最大似然估计值来代替）。那么当时，统计量的分布近似服从由度的根据这个定理，对于给定的显著性水平，查分布分位数表可得临界值，使得即中有r个未知参数，则需用相应的个自分布。为小概率事件。得拒绝域为根据所给样本值计算，如果的值大于，则否定假设；否则认为差异不够显著而接受。这就是注意，皮尔逊定理是在n无限大时推导出来的，因而在使用时要注意n要足够大以及根据计算实践经验，要求，以及每一个都不小于5。满足这个条件。

拟合检验法。不太小这两个条件。否则应适当合并区间，使

一元回归分析：在回归分析中，变量只有两个；

多元回归分析：变量在二个以上；

线性回归：变量间呈线性关系；

非线性回归：变量间不具有线性关系。

回归分析就是研究相关关系的一种重要的数理统计方法。即从数量的角度去研究这种关系。第九章回归分析与方差分析1．一元线性回归分析

对一组X的值Y相应的观察值

这n对数据可作出一个散点图，可直观地描述两变量之间的关系。根据散点图，有以下几个问题：（1）两变量之间的关系是否密切，或者说能否由X来估计Y；（2）两变量之间的关系是呈一条直线还是某种曲线；（3）是否存在其他规律。

作独立观察，得到随机变量，构成n对数据。（一）一元线性回归为了研究和之间的关系，假定有以下结构：其中a和b是未知常数，称为回归系数，得率的影响。

表示随机因素对实际中常假定服从正态分布，即通常称上式表明，Y由两部分组成：一部分是x的线性函数

另一部分是随机误差，是人们不可控制的。

（1.1）为一元线性回归模型。回归方程：该样本的构造可由方程来描述，这里，它是不能观察的。

n次独立观察，得一样本：对应的样本值记为：是第i次观察时随机误差所取的值，

回归分析的任务是利用n组独立观察数据来估计a和b,以估计值的代替a，b，称其为经验回归方程。

得回归方程1．用最小二乘法估计偏差的平方和最小二乘法认为：寻找这就是最小二乘法的基本思想。

，使上述平方和达到最小。对作了n次观察或试验，得到n对数据找一条直线当取值时，应取值而实际观察到的为，这样，形成了偏差（图）尽可能地拟合这些数据。

根据最小二乘法思想，类似地提出了如下的目标量它是所有实测值与回归值设法求出的估计值，使得到的回归直线是在所有直线中最小的一条。

的偏差平方和。达到最小，由此用求极值法，求出使达到最小的。即解方程得其中：得到回归方程（1.8）为了计算上的方便，引入下述记号：这样，的估计值可写成（1.10）

（1.9）求出回归方程，问题尚未结束。由于是从观察得到的回归方程，它会随观察结果的不同而改变，并且它只反映了由的变化引起的（1）回归方程是否有意义？即的变化是否真的对（2）如果方程真有意义，用它预测的偏差能否估计？

的变化，没有包含误差项。因此会问这样的问题：有影响？因此，要对回归效果作出检验。时，预测值与真值2．回归方程的显著性检验对任意的一组观察值最小二乘法，形式上求得对

如果与

因此，需要考察与是否确有线性关系，这就是，都可以用的回归方程。没有线性关系，这种形式的回归方程就没有意义。回归效果的检验问题。

与残差平方和

反映了由于的变化引起的的差异，体现了对的影响；

反映了自变量以外的随机因素对的影响。为

若它不是显著地大，表明所选的并不是一个重要的

回归平方和的影响部分与随机因素影响部分的比值;因素，它的作用与随机因素的作用相当，于是得到的回归方程就没有意义。

如果它显著地大，表明关于回归方程的显著性检验问题

可以证明，当的关系中b=0时，有

的作用是显著地比随机因素大，这样方程才有意义。b是否等于0的检验问题用来检验b的绝对值是否大于0;或者说检验回归方程给定显著性水平便可判断回归方程是否有意义。即要检验假设检验统计量为是否有意义。，查F分布分位数表，求出否定域，拒绝域为

也可用t检验法来检验回归方程是否有意义，假设且与独立（见附录5°），故有即这里又使用t检验法来进行检验。有（见附录2°）：当H0为真时b=0，此时即得H0的拒绝域为当假设就认为回归效果不显著。

被拒绝时，认为回归效果是显著的，反之，3.预测（我们无法确切知道的值。因此，只能估计的范围。通常假定这样通过对的估计，就可知道

的估计）当检验认为回归方程确有意义，则可用来预测或控制。的取值范围。假定是在模型的条件下进行的一次试验结果，可以证明有：

因此，

给定的置信水平，有的置信区间为其中于是根据书上（用相关系数检验法），也有即给定置信水平，有

让（换为）变动，有：或置信区间其中事实上，当n很大且靠近时，有即服从，用正态分布的性质有或作为实际应用时的近似预报。

总结：回归方程计算

（2）进行统计检验：对给定的临界值，如果则拒绝假设，说明一元线性回归成立。如果则接受假设，说明一元线性回归不成立。，由F分布表查出自由度为（1，n-2）（3）对回归直线进行预测。

其中：4．可线性化的一元非线性回归两个变量之间并不一定是线性关系，而是某种曲线关系。应该用曲线来拟合。用适当的变量代换，把它线性化。具体做法是：根据观察值画出散点图，通过散点图与常见曲线进行比较，经验地选择曲线类型。

以下几种曲线都可以通过变量代换转化为线性回归：（2）幂函数：（3）双曲线：或（4）对数函数：（1）指数函数：解题步骤：（1）若在原模型下，例如在原模型下，对于

（2）求出在新模型其中（3）利用上节的方法来估计（4）在得到Y关于的回归方程后，再将原自变量代回，就得到Y关于的回归方程。它的图形是一条有样本下的样本或对Y进行预测。曲线，也称为曲线回归方程。2多元线性回归在实际问题中，随机变量Y往往与多个普通变量有关，研究这类关系问题称为多元回归问题。

（1）多元线性回归的数学模型假设变量与另外个变量线性的，它的第i次试验数据为这一组数据可以假设有如下的形式：其中是个待估参数，是这就是多元回归的数学模型。

的内在关系是个可控变量，（2）参数估计与一元线性回归类似，用最小二乘法来求未知参数的点估计（也可以用最大似然估计法来估计），找出当时，使上式两边对求偏导数，并令它们等于零，得

达到最小。化简得

该方程组称为正规（则）方程组，为了求解的方便，将上式写成矩阵的形式，为此，引入矩阵：因

的逆阵（设存在）得到解

于是有这就是正规方程组的矩阵形式，在上式两边左乘这就是所要求的的估计，得到经验回归方程称为元经验线性回归方程，简称回归方程。

的样本之间相互独立。

其中与方差分析的数学模型。

设不同水平Aj下均为未知参数。称为单因素试验3单因素试验的方差分析名词：试验指标、因素、单因素试验、水平方差分析的任务是对模型：1°检验s个总体的估计。

的均值是否相等，（3.2）不全相等。2°作出未知参数即检验假设3°求出的区间估计。将的加权平均值记为（3.3），称为总平均，再引入此时有表示水平下的总体平均值与总平均的差异，习惯上将称为水平的效应。

其中(3.4)即假设等价于假设

（3.2）′

（3.1）′模型可改写成：（二）平方和的分解

总偏差平方和：

其中总偏差平方和的分解：其中（3.10）

（即水平下的样本平均值）（3.8）（3.9）（3.7）与的比值反映了两种差异所占的比重，若问：的比值大到什么程度，可以否定因此，统计量可用来检验因素的效应是否显著。

的比值越大，说明因素的各个水平不同引起的差异显著。？当H0为真时拒绝域具有形式（四）假设检验问题的拒绝域由此得检验问题（3.2）′的拒绝域为如果，则拒绝如果，则接受上述分析的结果可排成表9.5的形式，称为方差分析表。

（3.20），此时说明因素对指标起显著影响；，此时说明因素A的不同水平对结果影响不显著。表9.5单因素试验方差分析表方差来源平方和自由度均方F值因素ASAs-1误差SEn-s总和STn-1表中分别称为SA,SE的均方。影响试验结果的因素不止一个，要用双因素或多因素的方差分析；确定哪些因素是主要的，它们对试验结果的影响是否显著；它们之间是否有交互作用。4双因素试验的方差分析（一）双因素等重复试验（有交互作用）的方差分析设有两个因素A，B作用于试验的指标。因素B有s个

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

简单随机抽样

文档简介

温馨提示

最新文档

评论

简单随机抽样

文档简介

温馨提示

最新文档

评论

相关文档