




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
..第1章概率论与数理统计基础1.1概率论基础一、随机事件与概率随机事件--简称事件自然界中的事件可分为必然事件、不可能事件和随机事件三种:eq\o\ac<○,1>必然事件〔U:指在一定条件下必然发生的事件,如"1atm下水加热至100℃时沸腾"是必然事件。eq\o\ac<○,2>不可能事件〔V:指在一定条件下不发生的事件,如"1atm下水加热至50℃时沸腾"是不可能事件。eq\o\ac<○,3>随机事件〔A、B……:指一定条件下,可能发生,也可能不发生的事件。概率与频率对每一次试验而言,随机事件是否发生是带有偶然性的。但在大量重复试验下,并把这些试验结果综合在一起,就可以看出支配这些偶然性的某种必然规律性来。实践证明,随机事件发生的可能性大小是它本身所固有的属性,不随人们的主观意愿而转移,并且这种属性可以通过大量试验来认识。为便于研究,我们将随机事件A发生的可能性的大小用一个数值p来表示,并把这个数值p叫做事件A的概率。记作:P〔A=p为了确定事件A的概率p,首先必须说明频率的概念。设A为某试验可能出现的随机事件,在同样条件下,该试验重复做n次,事件A出现了m次〔0≤m≤n,则称m为A在这n次试验中出现的频数,称m/n为A在这n次试验中出现的频率。〔见书上表1-1频率m/n本身不是常数,它与试验次数n有关,随着试验次数n的增加,频率总是在某一常数附近摆动,而且n愈大,频率与这个常数的偏差往往愈小,这种性质叫做频率的稳定性。这个常数是客观存在的,与所做的若干次具体试验无关,它反映了事件本身所蕴含的规律性,反映了事件出现的可能性大小。因此,这个常数〔p就是事件A的概率。即事件A的概率就是事件A发生的频率的稳定值〔p。P〔A=p抛掷硬币试验试验者投掷次数n出现正面次数m出现正面频率m/n蒲丰404020480.5069皮尔逊1200060190.5016皮尔逊24000120120.5005维尼30000149940.4998概率的基本性质eq\o\ac<○,1>0≤P〔A≤1即任何事件的概率都介于0和1之间eq\o\ac<○,2>P<U>=1即必然事件的概率为1eq\o\ac<○,3>P<V>=0即不可能事件的概率为0二、随机变量及其概率分布随机变量的概念有些随机事件有数量标识,如射击时命中的环数,掷一枚骰子所出现的点数等等。但也有些随机事件无数量标识,如掷一枚硬币时,试验结果为"正面朝上"或"反面朝上",而不是数量。这会使我们感到不太方便,能否用量来代替事?这就促使我们引入随机变量的概念。事实上,很多事都和量有关。例如,掷硬币时"正面朝上"或"反面朝上"这两件事,我们可以分别记为"0"或"1"。经这样规定后,随机事件就可以用一个数来表示了。试验结果能用一个数ξ<希腊字母,读"克西">来表示,这个数ξ随试验结果不同而变化,我们称ξ为随机变量。随机变量与一般实变量不同,它是随机的,即它的取值有一定的概率。掷硬币试验时,随机变量ξ的取值为0或1。随机变量分为离散型和非离散型两类。离散型随机变量取值为有限个或无限可列个。非离散型随机变量的取值不能一一列举出来,情况比较复杂,其中最重要的,在实际中最常见的是连续型随机变量。随机变量的概率分布离散型随机变量掌握离散型随机变量的变化规律,除了要了解它的取值以外,更重要的是还要了解它取各可能值的概率是多少。例如,要检验一批产品的质量,从中任意抽取5件,仅仅知道次品数ξ的可能取值〔0,1,2,3,4,5还不够,还应当知道"次品数为0”的概率有多大,"次品数为1”的概率有多大,……,"次品数为设离散型随机变量ξ的所有可能取值为x0,x1,……,xk,……,ξ取各个可能值的概率为P<ξ=xk>=p<xk><k=0,1,2……>〔1-1〔1-2则称式〔1-1为离散型随机变量ξ的概率分布或分布律〔也称概率函数,若将其用表格形式表示,则为〔1-2ξx0x1……xk……pp<x0>p<x1>……p<xk>……若用图形表示,则如课本上的图1-1所示。由概率的基本性质可知,概率分布具有以下性质:〔i0≤p<xk>≤1<k=0,1,2……>〔ii=1这两条性质可以作为检验一张表能否成为一个离散型随机变量的分布律的条件。连续型随机变量的分布密度离散型随机变量的概率分布的变化规律可以用分布律来描述,但是这种方法不适用于连续型随机变量,因为后者的取值无法一一列举出来,因此不能用分布律的形式来描述。对这类随机变量的概率分布规律的描述通常是以研究"随机变量在某个区间上取值的概率"来实现的。为此,我们引入概率分布密度函数的概念。定义:若随机变量ξ的分布函数F〔x恰好是某个非负函数p〔x在〔-∞,x上的积分,即F<x>=则称ξ为连续型随机变量,称p〔x为ξ的概率分布密度函数〔简称为分布密度或密度函数。称ξ的分布为连续型分布。分布密度函数p〔x具有以下性质:p〔x≥0这两条性质可以作为判断一个函数是否可以作为一个连续型随机变量的分布密度的条件。P〔a<ξ≤b=F<b>-F<a>显然,一旦知道了分布密度p〔x,即可求出ξ在任何实数区间〔a,b]上取值的概率,即〔a<ξ≤b这件事的概率等于分布密度函数p〔x从a到b的积分。注意,对连续型随机变量,任一点的概率均为零,因为p〔x在任一点上的积分为零。因此,概率为零的事件未必不发生,而概率为1的事件未必发生!在p〔x的连续点处,有F′<x>=p<x>。概率分布密度函数p〔x的图形如图1-2所示。随机变量的分布函数若ξ是一个随机变量,x是任意实数,函数F〔x=P<ξ≤x>称为随机变量ξ的概率分布函数,简称分布函数。对离散型随机变量ξ,分布函数为F〔x=P〔ξ≤x=,<k=0,1,2,……;-∞<x<+∞>如图1-3所示。对连续型随机变量ξ,p<x>为其分布密度,则分布函数为F〔x=P〔ξ≤x=〔-∞<x<+∞如图1-4所示。连续型随机变量的分布函数的几何意义是,分布函数等于位于x左方的分布密度曲线下的面积。根据定义,随机变量的分布函数F〔x具有以下性质:F<x>是一个非减函数,即若x1<x2,则必有F<x1><F<x2>0≤F〔x≤1F<-∞>==0,F<+∞>==1对任意实数a和b〔a<b,有P<a<ξ≤b>=P<ξ≤b-P<ξ≤a=F<b>–F<a>三、正态分布〔Gauss高斯分布正态分布的定义随机变量的分布形式有多种,但最重要,最常用的是所谓的正态分布。自然界中许多随机变量的分布均服从正态分布。此外,还有许多随机变量近似服从正态分布。正态分布的数学表达式首先由高斯〔Gauss给出,所以也叫高斯分布。设随机变量ξ的分布密度函数为p<x=〔-∞<x<+∞其中μ和都是常数,且>0,则称ξ服从参数为μ和2的正态分布,记作N〔μ,2。为方便起见,常把随机变量ξ服从参数为μ和2的正态分布简记为ξ~N〔μ,2。正态分布的分布函数为F〔x=〔-∞<x<+∞特别的,当μ=0和=1时称ξ服从标准正态分布,记作ξ~N<0,1>。此时,其分布密度函数用〔x表示,即〔x=<-∞<x<+∞>相应地,分布函数用Φ〔x表示,即Φ〔x=<-∞<x<+∞>正态分布是一种十分重要的分布,在实际上也是最常见的一种分布,如产品的质量指标、人的身高、体重及测量的误差等一般认为是服从正态分布的。 〔面相、手相、算命等传统民间文化,实质上就是把人的一生的命运按概率分布函数进行计算和推测!可是,这些分布密度函数---经验公式的适用条件是什么???正态分布密度函数的特点p<x≥0;;p<x>的图形对称于x=μ;当x时p<x>;在x=μ处,p<x有极大值。μ和是正态分布的两个重要参数,决定着正态分布密度曲线的位置和形状。μ决定位置,决定形状。3.正态分布的概率计算标准正态分布函数Φ<x=在实际工作中广泛应用,但它难以直接进行积分运算,通常是查表,参见书后的附表1。若ξ~N<0,1>,对任意a<b,有P〔a<ξ≤b==Φ<b>-Φ<a>Φ<b和Φ<a可从附表1中查得。若ξ~N<μ,2>,对任意α<β,有P〔<ξ≤β=四、随机变量的数字特征〔数学期望、方差我们知道,随机变量的分布函数〔或分布密度、分布律能很好地描述随机变量的统计特征,但对于一个实际的问题要找出一个随机变量的分布函数〔或分布密度、分布律不是一件很容易的事;另外,在实际上有时也并不要求出随机变量的分布函数,而只要知道随机变量的某些特征就可以了。它能部分地描述分布函数的特征。反映随机变量的分布情形的某些特征数字,我们称为随机变量的数字特征。最常用且最重要的两种数字特征是数学期望和方差。1.数学期望〔均值〔1数学期望的概念例:设对某食品的水分进行了n次测量,其中有m1次测得结果为x1,有m2次测得结果为x2,……,有mk次测得结果为xk,则测定结果的平均值为x1m1+x2m2+……+xkmk其中n=m1+m2+……+mk=,mi为xi出现的频数,为xi出现的频率。因此,所求平均值为得到的诸量值以其出现的频率为权的加权平均。由于频率具有偶然性,所以我们用频率的稳定值——概率代替频率,就消除了偶然性,从本质上反映了随机变量的平均值。习惯上,我们把这个平均值称为随机变量ξ的数学期望或均值。数学期望的意思是通过大量观察,可以期望这个随机变量取这个值。下面分别讨论离散型和连续型两种随机变量的数学期望的定义及其性质。〔2离散型随机变量的数学期望定义:设ξ为离散型随机变量,其分布率为ξx1x2……xkPp1p2……pk如果级数绝对收敛,则称级数为随机变量ξ的数学期望〔或均值并记作E〔ξ,即E〔ξ=显然,对于分布已经确定的随机变量来说,随机变量的数学期望是一个常数。如果级数发散,则称ξ的期望不存在。数学期望是算术平均值概念的拓广,说得明确些,就是概率意义下的平均,因而也称数学期望为均值。连续型随机变量的数学期望定义:设连续型随机变量ξ的分布密度为p〔x,若广义积分绝对收敛,则E〔ξ=称为连续型随机变量ξ的数学期望。例:设ξ~N〔μ,,求E〔ξ解:E〔ξ===μ∴正态分布N〔μ,中的参数μ就是ξ的数学期望。数学期望的性质若C为常数,则E〔C=C若ξ为一随机变量,C为常数,则E〔Cξ=CE<ξ>,E〔C+ξ=E〔ξ+C若ξ1和ξ2为两个同类随机变量<同为离散型或连续型随机变量>则E〔ξ1+ξ2=E〔ξ1+E〔ξ2若ξ和η为相互独立的随机变量,则E〔ξη=E〔ξE〔η2.方差〔1方差的概念随机变量ξ的数学期望E〔ξ反映了随机变量取值的平均水平,但在许多实际中,只知道ξ的数学期望是不够的,还要知道ξ的取值偏离期望的程度。为此,引进方差的概念。定义:设ξ为一随机变量,如果其数学期望E〔ξ存在,则称[ξ-E〔ξ]为随机变量的ξ的离差。离差的平方的数学期望称为随机变量ξ的方差,记作D〔ξ,即D〔ξ=E{[ξ-E〔ξ]2}显然,对任意随机变量有D〔ξ≥0。[ξ-E〔ξ]2是随机变量ξ的函数,是一个新的随机变量,它的期望表示这个新的随机变量取值的平均情况。D〔ξ大,则ξ与E〔ξ的偏差也大,离散程度越大。故D〔ξ定义域很好地反映了方差是描述随机变量ξ与E〔ξ的偏离情况,也便于数学上的分析。方差的算术平方根称为ξ的标准差或均方差,记作〔ξ=.与数学期望一样,对有确定分布的随机变量来说,方差也是一个常量。〔2离散型随机变量的方差设离散型随机变量ξ的分布律为ξx1x2……xkPp1p2……pk则D〔ξ=E{[ξ-E〔ξ]2}=[xk-E〔ξ]2p〔xk〔3连续型随机变量的方差若ξ为连续型随机变量,p〔x为分布密度,则D〔ξ=E{[ξ-E〔ξ]2}=[x-E〔ξ]2p〔xdx方差D〔ξ表示ξ取值对E〔ξ的偏离程度,即ξ取值的发散程度,D〔ξ越大,表示ξ取值越发散,反之,表示ξ取值越集中在E〔ξ的附近。例:设ξ~N〔μ,,求D〔ξ.解:∵E〔ξ=μ∴D〔ξ=E{[ξ-E〔ξ]2}=[x-E〔ξ]2p〔xdx==即D〔ξ=〔4方差的性质〔iC=常数,D〔C=0〔iiD〔Cξ=C2D〔ξD〔C+ξ=D〔ξ〔iiiξ和η相互独立D〔η+ξ=D〔η+D〔ξ〔ivD〔ξ=E〔ξ2-[E〔ξ]21.2统计量及其分布一.基本概念1、总体与样本〔1总体与个体在数理统计学中,我们把研究对象的全体称为总体,把构成总体的每一个个别对象称为个体。我们可以把一个总体看作某一随机变量ξ全部取值的集合。如果一个总体ξ服从正态分布,即ξ~N〔μ,,则称ξ为正态总体。〔2样本与样本容量从总体中抽取一部分个体叫做总体的一个样本,样本中个体的数目叫做样本容量。从总体中随机地抽取n个个体〔ξ1、ξ2……ξn,则〔ξ1、ξ2……ξn为总体的一个样本。样本中个体数目n为样本容量。由于〔ξ1、ξ2……ξn是从总体中随机抽取的,所以ξ1、ξ2……ξn分别为n个随机变量。在一次实际抽取之后,样本〔ξ1、ξ2……ξn得到一组具体的数值〔x1、x2……xn,称为样本〔ξ1、ξ2……ξn值,即样本〔ξ1、ξ2……ξn的一个观察值。〔3简单随机样本样本通常只占总体的很小部分,因此,可以认为每次抽取一个个体之后,总体的分布并不会发生改变。这说明,样本〔ξ1、ξ2……ξn都是与总体ξ同分布的;其次,如果样本的抽取是随机进行的,并不掺杂人的主观倾向造成的偏差,那么每个个体被抽到的机会都是均等的〔即ξ1、ξ2……ξn相互独立。符合上述2个条件的抽样方法称为简单随机抽样,所获得的样本成为简单随机样本。显然简单随机样本具有2个性质:eq\o\ac<○,1>代表性;eq\o\ac<○,2>独立性2、统计量当我们得到了总体ξ的一个样本〔ξ1、ξ2……ξn时,为了推得总体的一些性质,往往需要对所取得样本做一些运算,即构成样本的某种函数,这种函数称为统计量。因为样本是随机变量,所以作为样本的函数的统计量也是一个随机变量。在数理统计中,常用的统计量是样本均值、样本方差和极差,它们都是样本的数字特征。若〔ξ1、ξ2……ξn为总体ξ的一个样本,如果样本的函数f〔ξ1、ξ2……ξn不包含其它未知参数,则称f〔ξ1、ξ2……ξn为总体的一个统计量。又若〔x1,x2,……xn为样本〔ξ1、ξ2……ξn的一组观测值,则函数值f〔x1、x2……xn为统计量f〔ξ1、ξ2……ξn的一个观测值。设从总体中随机抽取一个容量为n的样本,样本值为x1、x2……xn,则称为样本均值,称为样本方差〔S称为样本均方差或样本标准差,称R=max〔x1、x2……xn-min〔x1、x2……xn为样本极差。样本均值是描述数据的平均状态或集中位置的,样本方差是描述数据的波动情况或离散程度的,极差则是表示数据离散程度的最简单方法。二.统计量的分布1.样本均值〔的分布设〔ξ1、ξ2……ξn为来自正态总体ξ~N〔μ,的一个样本,样本均值为,则可证明~N〔μ,/n~N〔0,1这说明样本均值的取值比总体ξ的取值更紧密地集中在总体均值μ的周围,集中的程度与样本容量n的大小有关。2.分布若〔ξ1、ξ2……ξn为来自正态总体ξ~N〔μ,的一个容量为n的样本,又若为已知,可以证明,由样本方差S2构造的统计量<n-1>S2/是自由度为n-1的变量,即<n-1>S2/服从自由度为n-1的分布,记作=<n-1>S2/~〔n-1其中随机变量的分布密度3.t分布设〔ξ1、ξ2……ξn为来自正态总体ξ~N〔μ,的样本,可以证明统计量服从自由度为n-1的t分布,记作~t〔n-1随机变量t的分布密度为自由度f=n-1t变量用于对正态总体均值的估计和检验。定理:设〔ξ1、ξ2……ξn为来自正态总体N〔μ1,的一个样本,<η1、η2……ηn>为来自正态总体N〔μ2,的一个样本,且这两个样本相互独立,则统计量式中该定理主要用于两个正态总体的期望值有无差异的推断,或估计它们的期望值之差的场合。F分布设〔ξ1、ξ2……ξn与<η1、η2……ηn>是分别取自两个相互独立的正态总体ξ~N〔μ1,和η~N〔μ2,的样本,则统计量服从第一自由度f1=n1-1,第二自由度f2=n2-1的F分布,记作~F<n1-1,n2-1>其分布密度为f1=n1-1,f2=n2-1特别地,若则有~F<n1-1,n2-1>F变量用于两个正态总体方差异同的检验。1.3参数估计数理统计的基本任务是以样本为依据来推断总体的统计规律性。在实际工作中,我们会遇到两个方面的问题:1.通过实践或理论上的推导,大体上掌握了总体ξ的分布类型,但其中的分布参数未知,因而需要根据样本对参数进行估计;2.有些实际问题不要求掌握总体ξ的分布,只需知道总体ξ的数学期望和方差等数字特征。这都需要我们去探讨如何根据样本的数据对总体ξ的未知参数作出科学的估计,这就是参数估计问题。参数估计通常有两种方法,即点估计〔以样本的某一函数的某一函数值作为总体中未知参数的估计值和区间估计〔将总体的数字特征按照一定的概率确定在某一范围之内。一、参数的点估计1、问题的提出:前面讨论统计量时,提到样本均值和样本方差的概念。那么是否可用样本均值和样本方差去估计总体均值和总体方差呢?理论上可证明:当样本容量n无限增大时,样本均值和总体均值之比及样本方差和总体方差之比皆无限趋近于1。因此,可以用样本均值和样本方差去估计总体均值和总体方差。点估计是在样本上进行的,设F<x,θ>为总体ξ的分布函数,其中x为变量,θ为参数,<ξ1、ξ2、…ξn>是来自总体的一个样本,现用样本函数<ξ1、ξ2、…ξn>去估计θ,我们称为参数θ的一个点估计量,而称θ为待估参数。若〔x1、x2、...、xn为一个样本值,代入估计量中,就得到θ的具体数据,这个数据称为参数θ的估计值。由于统计量是随机变量,对于不同的样本值,待估参数θ的估计值也不同。我们总是希望统计量能够尽可能准确的表达参数的真值。为了这个目的,我们规定了一些评价估计值优劣的标准,来衡量包括点估计在内的估计方法的优劣。2、估计量的评价〔1估计的无偏性:估计值与参数真值θ可能不同,但我们有理由要求应该围绕着待估参数θ摆动,即应有E<>=θ。符合这个条件的估计量称为参数θ的无偏估计量。例1-5证明样本均值是总体ξ数学期望E<ξ>的无偏估计量证:E<>=E〔===E<ξ>即样本均值的数学期望E<>等于总体ξ的数学期望E<ξ>,根据定义,所以是总体ξ数学期望E<ξ>的无偏估计量。证明S2=2是D<ξ>的无偏估计量;S*2=2不是D<ξ>的无偏估计量。证明过程见p26~27。E<S2>=D〔ξ,E<S*2>=D〔ξ。所以:用S2比用S*2估计总体方差更好些。〔2估计的有效性无偏性是估计量好坏的评价标准之一。但是一个总体参数的无偏估计量并不是唯一的,换言之,同一个总体参数可能有两个或者两个以上的无偏估计量。如果要比较同一参数的两个无偏估计量的好坏,自然应该在样本容量相同的条件下,看哪一个估计量摆动更小,这就是有效性的概念。设1和2是同一参数θ的无偏估计量,如果D<1><D<2>,就说1比2更有效。比较正态总体均值E<ξ>的两个估计量=和的有效性。解:因为D<>=D〔>=>=n=又因D<>=D<>=所以D<><D<>。即较有效。换言之,容量大的样本均值作为总体均值的估计量更为有效。二.参数的区间估计参数的点估计是利用样本来构造统计量,再把样本值代入估计量求出估计值来实现的。但是由于样本的随机性,这样的估计值不见得就是待估参数的真值。那么,它们的近似程度如何?误差的范围有多大?可信的程度如何?这样一些在参数估计中应确切说明的问题在点估计中是难以回答的。因此,我们希望能够根据样本给出待估参数的一个范围,使它能够以较大的概率包含待估参数的真值,这就是对未知参数的区间估计。区间估计是要根据样本来确定一个区间〔1,2,使参数θ落在这个区间内的概率等于一个给定的数1-α,即P<1<θ<2>=1-α。其中<1,2>称为θ的置信区间,1-α称为此区间的置信水平或置信度,α称为信度。α是事先给定的小于1的正数<通常取0.05或0.01>,是对参数的估计失准的概率。下面对正态总体ξ的数学期望和方差作区间估计。1、正态总体数学期望〔均值μ的区间估计〔1已知,求μ的置信区间设总体ξ~N<μ,>,且已知,<ξ1、ξ2、…ξn>是来自正态总体的一个样本,则由式<1-3>和<1-4>可知:~N<μ,>,u=~N<0,1>根据正态分布的性质,对给定的信度α,查标准正态分布的上侧分位数Uα表,可得,使得:P<|u|<>=1-α,即P〔<>=1-αP〔<μ<=1-α所以μ的置信区间为〔,.讨论:1当样本容量n越大时,越小,计算到的置信区间越小,估计效果越好。因此,为提高区间估计精度,可以增大样本容量。2用上述方法进行区间估计,先决条件是总体必须服从正态分布,而且为已知。如果不是正态分布,但样本容量n充分大时,近似服从正态分布~N<μ,/n>,u=近似服从N<0,1>,故对于大样〔n≥30,不管总体是否正态,都可以对总体均值μ进行区间估计。〔2未知,求μ的置信区间在实际问题中,往往只知道总体服从正态分布,而数学期望μ和方差均为未知,在这种情况下求期望的置信区间,可用样本方差S2代替总体方差,用S2所构造的t变量代替u变量来进行。设样本<ξ1,ξ2…ξn>来自正态总体N<μ,>,则可知t=~对于给定的信度α,自由度f=n-1,查t分布表可得临界值,使得P<|t|<>=1-α,即P〔<=1-αP<<μ<>=1-α于是得到μ的置信区间为:<,>.2.方差的区间估计在实际问题中考虑精度的稳定性时,需要对方差进行区间估计,即要根据样本找出正态总体方差D<ξ>=的置信区间。设样本<ξ1、ξ2、…ξn>来自正态总体N<μ,>,则=~其中=对于给定的信度α,由自由度f=n-1,查分布表,可得出对应的两侧临界值和,使得:P〔<<=1-α即P〔<<=1-αP〔<<=1-α∴置信区间为〔,1.4统计假设检验一、假设检验的基本概念1、问题的提出前面我们介绍了对总体的未知参数的估计方法——点估计和区间估计.下面将介绍统计推断中的另一类重要问题——假设检验.采用的方法是:首先对总体ξ的未知参数的数值提出假设〔假设产生于对随机现象的实际观察,或者产生于对随机现象的理论分析,然后利用样本提供的信息来检验所提出的假设是否合理,这种方法称为对参数的假设检验。对未知参数提出的假设,通常用H0表示,称为待检假设。例1-10奶粉包装机正常工作时,包装量服从正态分布,根据长期的经验得知其标准差σ=15g,而额定标准为每袋500g,现随机抽取奶粉9袋,其净重分别为498、508、518、526、488、513、510、516、513,问:根据这9个数据,能否判定包装机是否正常工作?在这里,已经知道了包装量ξ服从正态分布,所谓工作正常是指均值μ=500。因此,本问题就归结为判断总体均值μ是否等于μ0=500。我们假设包装机正常工作,记为H0:μ=μ0=500H0是假设的符号,于是所求的问题就转化为根据9个样本数据检验假设H0是否正确。下面讨论如何根据样本提供的信息来检验假设H0是否成立。2、假设检验的基本思想假设检验的基本思想是依据"小概率事件在一次实验中几乎是不可能出现的"。设有某H0需要检验,我们先假设H0为正确,在此假设下,某事件A的概率很小,例如P<A>=0.05或者0.01,经过一次试验后,如果A出现了,那么便出现了一个小概率事件。由于"小概率事件在一次实验中几乎是不可能出现的",而现在居然出现了,这就不能不使人怀疑H0的正确性。因而自然要否定H0。反之,如果A不出现,一般就先肯定或者保留H0。例:某一箱子中装有100个白球和黑球,但不知道黑白球各有多少个,现提出假设H0:"其中99个白球",用上面的思想方法检验H0的正确性。我们可以暂设H0正确,那么从箱子里任取一球,得黑球的概率为0.01,故抽到黑球就是一个小概率事件。如果现在居然抽到了黑球,那么自然就要否定H0,就是说白球的个数不是99。那么,概率小到什么程度才叫"小概率事件"呢?这没有一个绝对标准,要根据具体情况而定。通常将概率不超过0.05或0.01的事件当作小概率事件。P〔A=α,α=0.05或者0.01。α称为显著性水平或检验水平。在区间估计中,α称为信度。3、两类错误由于假设检验是由样本推断总体,不可能绝对准确,所以有可能存在以下两类错误:第一类是假设H0本来符合实际情况,检验时却把它否定了,称为弃真错误。这是因为,当H0为真时,小概率事件A也有可能发生〔A是小概率事件,并非不可能事件。因此H0本来为真时,也可能在小概率事件A发生时被拒绝。反之,有可能根据一次试验的结果把原来不真的假设H0接受下来,这就犯了第二类错误,称为取伪错误。显然,出现这两类错误的概率越小越好。但在实际工作的时候,要使犯这两类错误的概率同时都非常小是做不到的。人们往往先控制犯第一类错误的概率〔犯第一类错误的概率等于显著性水平α,再用适当增大样本容量n的方法来减小犯第二类错误的概率。二、一个正态总体的假设检验下面讨论一个正态总体的两个参数〔即均值和方差的假设检验问题。1、已知方差,检验均值μ〔即已知,检验假设H:μ=μ0例1-10已知袋装量ξ~N〔μ,,且=152,要检验H0:μ=μ0=500是否成立。一般,在假设H0:μ=μ0=500成立的条件下,可知来自正态总体N〔μ,的样本均值服从正态分布N〔μ,,而统计量服从标准正态分布N〔0,1。当给定小概率α时,有相应的,使得:P〔=〔在区间估计中,用到P〔=1-即{}是一个小概率事件。若=0.05,则==1.96,这时{1.96}就是小概率事件。对于例1-10,由样本值算出,从而统计量u的值为==2.0于是1.96,就是说在一次抽样中发生了{}这样的小概率事件,这是不合理的,导致这种不合理发生的原因,应该认为是原假设不真,因而拒绝原假设H0,即认为μ≠μ0=500,也就是说包装机工作不正常。在出现拒绝原假设H0的情况下,称μ与μ0有显著差异。这种显著差异结论是以α为小概率的条件下作出的,因此,通常称α为显著性水平〔即信度。α不同,也不同,从而有可能影响显著性结论,原来在α=0.05时显著的,在α=0.01时未必显著了。如上例:若取α=0.01,则==2.576,与=2.0比较,有,这时接受原假设,即认为包装机工作正常。概括这一检验过程,可以把已知方差时对正态总体均值的u检验,归纳为以下5个步骤——u检验法。U检验法:〔1提出假设H0:μ=μ0〔2构造统计量,u服从标准正态分布N〔0,1。〔3对于给定的显著性水平α,由P〔=,查标准正态分布的上侧分位数表,得临界值。〔4由测定的样本值,计算u变量的值u0〔5作出判断:当时,拒绝原假设;当时,接受原假设。2、未知方差,检验均值μ〔即未知方差,检验假设H0:μ=μ0因为方差未知,所以不能再用u检验法。此时我们用样本方差代替总体方差,因而应该选用t变量:~对于给定的显著性水平α以及自由度f=n-1,查t分布表可得,使得:P〔=即{}是小概率事件。因此,当从样本值算得t的值后,就可将与相比较,以检验H0:μ=μ0是否成立。若,则拒绝H0,反之则接受原假设。该检验方法称为t检验法,其步骤与u检验法类似。3、未知均值μ,检验方差〔即未知均值μ,检验假设H0:设〔为来自正态总体N〔μ,的一个样本,今欲检验假设H0:可求得:统计量~在假设成立时,有=~对于给定的小概率,可由分布表上查出与自由度f=n-1对应的两个临界值和,使得P〔=,P〔=即{或}为小概率事件。通过样本值计算统计量=的值。若或,则拒绝H0。若≤≤,则接受原假设。这种用变量对假设做显著性检验的方法称为检验法。例1-12游离氨基酸含量~N〔μ,〔服从均值μ未知的正态分布〔p.36三、两个正态总体的假设检验1、未知和,但知道=,假设检验H0:μ1=μ2设总体,,,且两者相互独立。已知=,〔和〔分别为来自正态总体的样本,和分别为其样本均值。今欲检验H0:μ1=μ2,即H0:μ1-μ2=0。可求得:其中当H0成立时,有对于给定的小概率以及自由度f=,查概率分布表可得,使得:P〔=即{}是小概率事件。由样本值计算出T的值,若,则拒绝原假设,反之则接受。特别的:当时,2.未知μ1和μ2,检验H
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安全管理部门
- 宗教旅游资源
- 南京工业区挥发性有机物污染特征、来源解析及对臭氧生成的影响
- DoS攻击下负荷频率控制电力系统稳定性研究
- 基于LightGBM的中厚板热矫直工艺预测模型研究
- 2024年首都医科大学附属北京康复医院招聘笔试真题
- 2024年金华义乌市中心医院医共体毕业生招聘笔试真题
- 2024年安徽医科大学临床医学院附属华安脑科医院招聘笔试真题
- 成本部门经理年终总结
- 2025年硬质合金喷焊粉合作协议书
- 亚洲的人文环境
- 初中物理之魔术物理课件
- 投用前安全检查表
- “三备两研”集体备课实施方案
- 医疗质量管理制度相关知识考试试题
- 医院病历体格检查表范本
- 二次供水设备保养维修方案(完整)
- 【直播带货的模式研究国内外文献综述4300字(论文)】
- 高中英语-40篇英语短文搞定高中英语3500个单词
- 2023年新改版苏教版五年级下册科学全册精编知识点(附问答题总结)
- 杭州国际动漫节策划书
评论
0/150
提交评论