《医药数理统计方法》各章内容提要_第1页
《医药数理统计方法》各章内容提要_第2页
《医药数理统计方法》各章内容提要_第3页
《医药数理统计方法》各章内容提要_第4页
《医药数理统计方法》各章内容提要_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE数据的描述和整理数据的分类数据类型定性数据(品质数据)定量数据定类数据(计数数据)定序数据(等级数据)数值数据(计量数据)表现形式类别(无序)类别(有序)数值(+-×÷)对应变量定类变量定序变量数值变量(离散变量、连续变量)主要统计方法计算各组频数,进行列联表分析、2检验等非参数方法计算各种统计量,进行参数估计和检验、回归分析、方差分析等参数方法常用统计图形条形图,圆形图(饼图)直方图,折线图,散点图,茎叶图,箱形图常用统计量1、描述集中趋势的统计量名称公式(原始数据)公式(分组数据)意义均值反映数据取值的平均水平,是描述数据分布集中趋势的最主要测度值,中位数Me中位数所在组:累积频数超过n/2的那个最低组是典型的位置平均数,不受极端值的影响众数Mo数据中出现次数最多的观察值众数所在组:频数最大的组测度定性数据集中趋势,对于定量数据意义不大2、描述离散程度的统计量名称公式(原始数据)公式(分组数据)意义极差RR=最大值-最小值R≈最高组上限值-最低组下限值反映离散程度的最简单测度值,不能反映中间数据的离散性总体方差2反映每个总体数据偏离其总体均值的平均程度,是离散程度的最重要测度值,其中标准差具有与观察值数据相同的量纲总体标准差样本方差S2反映每个样本数据偏离其样本均值的平均程度,是离散程度的最重要测度值,其中标准差具有与观察值数据相同的量纲样本标准差S变异系数CVCV=反映数据偏离其均值的相对偏差,是无量纲的相对变异性测度样本标准误反映样本均值偏离总体均值的平均程度,在用样本均值估计总体均值时测度偏差3、描述分布形状的统计量名称公式(原始数据)公式(分组数据)意义偏度Sk反映数据分布的非对称性Sk=0时为对称;Sk>0时为正偏或右偏;Sk<0时为负偏或左偏峰度Ku(原始数据)(分组数据)反映数据分布的平峰或尖峰程度Ku=0时为标准正态;Ku>0时为尖峰分布;Ku<0时为扁平分布*在分组数据公式中,mi,fi分别为各组的组中值和观察值出现的频数。第二章随机事件与概率(一)基本概念概念符号概率论的定义集合论的含义随机试验(试验)E具有以下特征的观测或试验:1.试验在相同的条件下可重复地进行2.试验的所有结果事先已知,且不止一个3.每次试验恰好出现其中之一,但试验前无法预知到底出现哪一个结果。样本空间试验所有可能结果组成的集合,即所有基本事件的全体全集基本事件(样本点)试验的每个不可再分的可能结果,即样本空间的元素元素随机事件(事件)A试验中可能发生也可能不发生的结果,是由基本事件组成的样本空间的子集子集必然事件在试验中一定发生的事件全集不可能事件在试验中一定不发生的事件,不含任何基本事件空集(二)事件间的关系关系符号概率论的定义集合论的含义包含AB事件A的发生必然导致事件B的发生A是B的子集相等A=BAB而且BAA与B相等和(并)A+B(A∪B)事件A与B中至少有一个事件发生A与B的并积(交)AB(A∩B)事件A与B同时发生A与B的交差A-B事件A发生同时B不发生A与B的差互不相容AB=事件A与B不可能同时发生A与B不相交对立事件A不发生A的补集(余集)(三)事件的运算规律运算律公式交换律A+B=B+A,AB=BA结合律(A+B)+C=A+(B+C),(AB)C=A(BC)分配律(A+B)C=AC+BC,A+(BC)=(A+B)(A+C)差积转换律对立律A=,A+=Ω德·摩根对偶律,(四)概率的定义类型定义公式古典概率P(A)=统计概率P(A)=p(≈)公理化定义(基本性质)对样本空间中任意事件A对应的一个实数P(A),满足公理1(非负性):0≤P(A)≤1公理2(规范性):P()=1,P()=0公理3(可加性):若A1,A2,…,An,…,两两互不相容,P(A1+A2+…+An+…)=P(A1)+P(A2)+…+P(An)+…则称P(A)为随机事件A的概率。(五)概率的计算公式名称计算公式加法公式P(A+B)=P(A)+P(B)-P(AB)若A、B互不相容(AB=):P(A+B)=P(A)+P(B)对立事件公式P(A)=1-P();P()=1-P(A)事件之差公式P(A-B)=P(A)-P(AB)若BA,P(A-B)=P(A)-P(B)条件概率公式,(P(A)>0)乘法公式若P(A)>0,P(AB)=P(A)P(B|A)若P(B)>0,P(AB)=P(B)P(A|B)当P(A1A2…An-1P(A1A2…An)=P(A1)P(A2|A1)P(A3|A1A2)…P(An|A1A2…A独立事件公式A、B相互独立:P(AB)=P(A)P(B)A1,A2,…,An相互独立:P(A1A2…An)=P(A1)P(A2)…P(An全概率公式若A1,A2,…,An为完备事件组*,对事件B逆概率公式(贝叶斯公式)若A1,A2,…,An为完备事件组*,P(B)>0*完备事件组{A1,A2,…,An}1.A1,A2,…,An互不相容且P(Ai)>0(i=1,2,…,n);2.A1+A2+…+An=第三章随机变量及其分布(一)随机变量及常用分布1.离散型随机变量及常用分布名称定义性质或背景备注分布律P{X=xk}=pk,k=1,2,…或Xx1x2…xk…Pp1p2…pk…1.pk≥0,k=1,2,…2.0-1分布P{X=1}=p,P{X=0}=q,或X01Pqp二项分布n=1的特例:B(1,p)(一重贝努里试验)EX=pD(X)=pq二项分布B(n,p)P{X=k}=,k=0,1,…,nX为n重贝努里试验中A事件发生的次数EX=npD(X)=npq泊松分布P()P{X=k}=,k=0,1,2,…,>0是常数二项分布泊松近似公式(≈np)(n很大,p较小)EX=D(X)=超几何分布P{X=k}=k=1,2,…,min(M,n)无放回产品抽样试验当N→+∞时,时,EX=2.连续型随机变量及常用分布名称定义性质或背景备注密度函数f(x)对任意a<b有P{a<X≤b}=1.f(x)≥02.3.对任意常数a,有P{X=a}=0等价定义:对X的分布函数有F(x)=,﹣∞<x<+∞正态分布N(,2)f(x)=﹣∞<x<+∞P{a<X≤b}=E(X)=D(X)=2标准正态分布N(0,1)(x)=﹣∞<x<+∞1.(﹣x)=1-(x)2.(x)可查表计算其中(x)是分布函数E(X)=0D(X)=1指数分布E()常用作“寿命”分布>0为常数E(X)=1/D(X)=1/2均匀分布U[a,b]直线上几何概率模型的分布描述E(X)=(a+b)/2D(X)=(b-a)2/12对数正态分布LN()f(x)=若X服从对数正态分布LN(),则lnX~N()韦布尔分布W(m,,)f(x)=m=1且=0时为指数分布;m=3.5时近似于正态分布分布函数为F(x)=,(x>)3.随机变量的分布函数类型定义性质备注通用定义F(x)=P{X≤x},﹣∞<x<+∞0≤F(x)≤1;F(﹣∞)=0,F(+∞)=13.F(x)对x单调不减4.F(x)为右连续P{a<X≤b}=F(b)-F(a)离散型XF(x)=,﹣∞<x<+∞连续型XF(x)=,﹣∞<x<+∞f(x)=F(x)P{a<X≤b}=(二)随机变量的数字特征类型定义性质备注数学期望E(X)离散型E(X)=1.E(C)=C(C为常数)2.E(CX)=C·E(X)3.E(X±Y)=E(X)±E(Y)4.若X、Y相互独立,则E(X·Y)=E(X)·E(Y)描述随机变量所有可能取值的平均水平连续型E(X)=方差D(X)D(X)=E[(X-E(X))2]1.D(C)=0(C为常数)2.D(CX)=C2·D(X)3.若X、Y相互独立,则D(X±Y)=D(X)+D(Y)4.D(X)=E(X2)-(EX)2描述随机变量取值相对于均值的平均离散程度标准差(X)协方差cov(X,Y)Cov(X,Y)=E[(X-E(X))(Y-E(Y))]=E(XY)-E(X)·E(Y)1.Cov(aX,bY)=abCov(X,Y)2.Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)3.X与Y独立Cov(X,Y)=04.D(X±Y)=D(X)+D(Y)±2Cov(X,Y)描述X与Y的偏差的关联程度相关系数XY1.|XY|≤1;2.|XY|=1存在常数a、b使得P{Y=aX+b}=1;3.X与Y独立X与Y不相关,反之不一定成立。描述X与Y间线性相关程度;XY=0,称X与Y不相关;(三)随机变量函数的分布类型X的分布函数Y=g(X)的分布数学期望公式离散型XX的分布律P{X=xk}=pk,k=1,2,…Y的分布律为P{Y=g(xk)}=pk,k=1,2,…。若有某些g(xi)相等,则对其作适当的并项,即对应概率相加连续型XX的密度为fX(x)分布函数法:FY(y)=P{Y≤y}=P{g(X)≤y}Y=g(X)的密度:fY(y)=F′Y(y)定理公式法:若y=g(x)在fX(x)非零区间上严格单调,h(y)是y=g(x)的反函数(四)二维随机向量及分布1.二维离散型随机向量名称定义性质或试验背景备注联合分布律1.pij≥0,i,j=1,2,…,2.联合分布律的列表结构(概率分布表)X的边缘分布随机变量X的分布律由联合分布律“行值相加”Y的边缘分布随机变量Y的分布律由联合分布律“列值相加”独立性X与Y相互独立X、Y的边缘分布完全确定其联合分布律按定义验证独立性,实用中由试验独立性得2.二维连续型随机向量名称定义性质或试验背景备注联合密度f(x,y)对平面上的区域D1.f(x,y)≥02.X的边缘密度随机变量X的密度fX(x)=FX(x)Y的边缘密度随机变量Y的密度fY(y)=FY(y)独立性X与Y相互独立X、Y的边缘分布完全确定其联合分布律按定义验证独立性;实用中由试验独立性得二维正态分布(X,Y)~N(μ1,μ2,)X~N(,)Y~N(,)X与Y相互独立=0;是X与Y的相关系数3.二维随机向量的分布函数名称定义性质或试验背景备注联合分布函数定义F(x,y)=P{X≤x,Y≤y}﹣∞<x,y<+∞1.0≤F(x,y)≤1;2.F(-∞,y)=0,F(x,-∞)=0,F(-∞,-∞)=0,F(+∞,+∞)=1;3.F(x,y)对x,y均为右连续;4.F(x,y)对x和y单调不减;F(x,y)可以描述任意类型(X,Y)的分布离散型(X,Y)﹣∞<x,y<+∞连续型(X,Y)﹣∞<x,y<+∞X的边缘分布函数FX(x)为X的分布函数由F(x,y)可确定FX(x)与FY(y),反之未必Y的边缘分布函数FY(y)为Y的分布函数(五)大数定律和中心极限定理名称条件结论备注契贝晓夫不等式X的E(X)、D(X)均存在有限对任意>0,有或在已知X的均值和方差时,估计X与其均值E(X)的偏差大(小)于的概率切比雪夫大数定律设{Xk}为相互独立且服从同一分布的随机变量序列,又E(Xk)=,D(Xk)=2(k=1,2,…)均存在有限对任意>0,有即当n足够大时,将依概率收敛于其均值μ贝努里大数定律设n~B(n,p);(或n为n重贝努里试验中事件A发生的次数,P(A)=p)对任意ε>0,有。即A发生的频率以严格数学形式描述“频率的稳定性”。在试验次数很大时,用事件A的频率作为其概率的近似值勒维-林德贝格中心极限定理(独立同分布中心极限定理)设{Xk}为相互独立且服从同一分布的随机变量序列,又E(Xk)=,D(Xk)=2(k=1,2,…)均存在有限令,则即n很大时,Yn~N(0,1)(近似)n足够大时,近似服从N(n,n2)德莫佛-拉普拉斯中心极限定理(贝努里情形中心极限定理)设n~B(n,p);(或n为n重贝努里试验中事件A发生的次数,P(A)=p)令,则即n很大时,Yn~N(0,1)(近似),或n~N(np,npq)(近似)当n很大(n>30)时,有第四章抽样分布内容提要(一)数理统计的基本概念名称定义特性意义总体X研究对象的全体X将总体理解为服从某一分布的随机变量X利用随机变量X的性质来研究总体样本X1,X2,…,Xn满足:1.(独立性)相互独立;2.(代表性)与总体X同分布。样本具有二重性:(1)随机变量X1,X2,…,Xn(理论分析)(2)观察值x1,x2,…,,xn(数值计算)样本是从总体中随机抽取部分个体组成,用于推断总体有关统计特征统计量(X1,X2,…,Xn)样本X1,X2,…,Xn的不含任何未知参数的函数泛指时为随机变量,特指时为相应数值对样本所含信息进行加工提炼,用于估计推断总体参数(二)常用统计量名称定义应用意义样本均值用于分析总体均值E(X),且有刻画了样本的位置(集中)特征,反映样本观察值的平均水平。样本方差S2用于分析总体方差D(X),且有E(S2)=D(X)刻画了样本的离散特征,反映样本观察值偏离样本均值的分散程度。样本标准差SS与Xi的度量单位一致刻画样本观察值偏离样本均值的绝对偏差,且与取值数据的量纲一致。变异系数CV反映样本的相对离散程度的无量纲统计量刻画样本观察值偏离样本均值的相对偏差,可用于比较不同均值样本相对变异程度标准误反映样本均值的变异程度用来衡量以样本均值来推断估计总体均值时的平均误差(三)统计三大常用分布名称定义性质2分布2(n)设X1,X2,…,Xn相互独立,均服从N(0,1),则~2(n)其中n为2分布的自由度1.X~2(n),则E(X)=n,D(X)=2n2.X~2(n1),Y~2(n2)且X与Y独立,则X+Y~2(n1+n2)t分布t(n)设X~N(0,1),Y~2(n),且X与Y相互独立,则~t(n)其中n为2分布的自由度1.t1-(n)=﹣t(n)2.当n→∞时,t(n)的极限分布就是N(0,1)F分布F(n1,n2)设X1~2(n1),X2~2(n2),且X1与X2独立,则~F(n1,n2)其中n1,n2为2分布的自由度1.设T~t(n),则T2~F(1,n)2.设F~F(n1,n2),则1/F~F(n2,n1)3.(四)正态总体的抽样分布总体类型抽样分布说明单个正态总体样本均值的抽样分布作为正态变量的线性组合仍服从正态分布的标准化变量服从标准正态分布将中的换成S,相应分布由N(0,1)修正为t(n-1)样本方差S2相关抽样分布S2与还是相互独立的两个正态总体样本方差之比的抽样分布用于两个总体方差的统计推断样本均值之差的抽样分布当时用于两个总体均值的统计推断其中第五章参数估计内容提要(一)总体参数的点估计法点估计法基本思想计算步骤矩估计法用样本矩估计相应的总体矩,从而得到总体未知参数的估计值设未知参数为θ1,θ21.由总体X的分布计算E(X),E(X2)2.解方程组得θ1,θ2的矩估计最大似然估计法根据样本来选择参数,使得该样本出现的可能性最大设未知参数为θ1.写出似然函数2.选择,使L()最大。即解似然方程或3.解之得即为θ的最大似然估计(二)估计量的判别标准判别标准定义备注无偏性样本均值是总体均值的无偏一致估计量;样本方差是总体方差的无偏一致估计量;样本率p是总体率P的无偏一致估计量。有效性设均为的无偏估计量,若,则称比有效一致性对任意给定的,有,即依概率收敛于(三)总体参数的区间估计总体分布参数条件置信区间正态分布均值已知未知未知大样本(n30)方差未知二项分布总体率大样本(n30)小样本(n<30)查附表8泊松分布参数大样本(n30)小样本(n<30)查附表9第六章假设检验内容提要(一)假设检验的基本思想与步骤名目内容基本思想概率性质的反证法推断依据小概率原理:小概率事件在一次试验中几乎不可能发生两类错误第一类错误(弃真);第二类错误(取伪)基本步骤1.建立检验假设:原假设H0和备择假设H1;2.确定检验统计量及其分布,并根据样本值计算检验统计量的值;3.根据显著性水平,确定检验临界值,即得拒绝域;4.统计判断:若统计量的值落在拒绝域内,则拒绝原假设H0;否则,就接受原假设H0。分类参数假设检验;非参数假设检验(二)正态总体的参数假设检验1.单个正态总体均值的假设检验条件检验假设统计量临界值拒绝域2已知H0:=0H1:≠0u/2|u|≥u/2H1:>0(或H1:<0)uu≥u(或u≤-u)2未知H0:=0H1:≠0t/2|t|≥t/2H1:>0(或H1:<0)tt≥t(或t≤-t)2未知大样本(n>30)H0:=0H1:≠0u/2|u|≥u/2H1:>0(或H1:<0)uu≥u(或u≤-u)2.配对比较总体均值的假设检验条件检验假设统计量临界值拒绝域配对总体(d为差值)H0:=0H1:≠0t/2|t|≥t/2H1:>0(或H1:<0)tt≥t(或t≤-t)3.正态总体方差的假设检验条件检验假设统计量临界值拒绝域单个总体H0:2=02H1:2≠022=,或H1:2>02(或H1:2<02)(或)(或)两个总体H0:12=22H1:12≠22()F/2H1:12>22F4.两个正态总体的均值比较检验条件检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论