计数资料的统计推断1.ppt_第1页
计数资料的统计推断1.ppt_第2页
计数资料的统计推断1.ppt_第3页
计数资料的统计推断1.ppt_第4页
计数资料的统计推断1.ppt_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八讲 计数资料的统计推断,2,统计推断,用样本信息推论总体特征的过程。 包括: 参数估计: 运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。 假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。,主要内容,一、率(或构成比)的抽样误差和标准误 二、总体率(或构成比)的估计:点估计、区间估计 三、总体率(或构成比)的假设检验 1.率(或构成比)的 检验 2. x2检验 四、假设检验的注意事项 五、非参数检验 1.参数统计和非参数统计优缺点 2.秩和检验,一、率(或构成比)的抽样误差和标准误,均数的标准差和标准误(复习)。 抽样误差产生的原因、概念 标准误的计算公式 与样本量的关系:成反比。 例题:56页 某市为了解已婚育龄妇女子宫颈癌的患病情况,进行了抽样调查,随机抽取2000人,患者80例。试求此患病率的标准误。,二、总体率(或构成比)的估计,点估计:将样本率直接作为总体率的估计值. 区间估计(对照总体均数的区间估计) 公式: PU.SP 条件: nP5, n(1-P)5 例题: 意义:,三、总体率(或构成比)的假设检验,当两个样本率不同时,有两种可能: 1. P1 , P2所代表的总体率相同,由于抽样误差的存在,造成的不同,这种差别在统计上叫差别无统计学意义。 2. P1 , P2所代表的总体率不同,即两个样本来不同的总体,其差别有统计学意义。 现在就是要用统计学的方法进行判断到底属于那种情况。,7,1.总体率(或构成比)的u检验,目的: 公式: 其中符号的含义 适用条件: 已知0 nP5, n(1-P)5 例题P58,8,2. x2检验,是一种假设检验的方法,当样本量不大,或几个率进行比较时可用x2检验。 某医生想观察一种新药对流感的预防效果,进行了如下的研究,问此药是否有效?,9,x2分布规律,自由度一定时,P值越小, x2值越大。 当P 值一定时,自由 度越大, x2越大。 =1时, P=0.05, x2 =3.84 P=0.01, x2 =6.63 P=0.05时, =1, x2 =3.84 =2, x2 =5.99 当自由度取1时, u2= x2,10,x2检验的基本公式,x2 =(A-T)2/T A:表示实际频数,即实际观察到的例数。 T:理论频数,即如果假设检验成立,应该观察到的例数。 :求和符号 自由度:=(R-1)x(C-1) R行数, C列数 注意:是格子数,而不是例数。,11,基本原理,x2 =(A-T)2/T 如果假设检验成立,A与T不应该相差太大。理论上可以证明 (A-T)2/T服从x2分布,计算出x2值后,查表判断这么大的x2是否为小概率事件,以判断建设检验是否成立。,(1)四格表资料的x2检验,什么是四格表资料?凡是两个率或构成比资料都可以看做四格表资料。举例。,13,四格表的一般形式,理论频数与自由度的计算:A是实际频数,T是根据假设检验来确定的,当H0成立时,计算出的格子中的数。每个格子中的理论频数计算公式为:TRC=NRxNC/N, NR所在的行合计,NC所在的列合计,代入公式中求x2值。 (求上例的4个T值) 四格表资料的专用公式:,四格表资料的专用公式,x2 =(ad-bc)2 xN/ (a+b)(c+d)(a+c)(b+d) 该公式从基本公式推导而来,结果相同。计算较为简单。,适用条件: N40且 T 5 当不满足时用校正公式。 x2 =(|A-T|-0.5)2/T 或 x2 =(|ad-bc|-n/2)2 xN (a+b)(c+d)(a+c)(b+d) 见62页。,15,例题,上例:问此药是否有效。 第一步:建立假设 H0 : 1=2 =20% H1 : 1 2 第二步:确定显著性水平 =0.05 第三步:计算统计量: n =20040,每格的T值大于5,可选用公式?(计算过程) 第四步:确定P值 第五步:判断结果,16,(2)配对计数资料的x2检验,什么是配对资料?P64 甲乙两种培养基的生长情况,例:问两种培养基的效果是否不同,第一步:建立假设 H0 : B=C=b+c/2 H1 : BC 第二步:确定显著性水平 =0.05 第三步:计算统计量: b+c40时,基本公式:x2 =(A-T)2/T, 专用公式: x2 =( b-c)2/ b+c b+c40时,校正公式: x2 =(|A-T|-0.5)2/T x2 =( lb-cl-1)2/ b+c 自由度:=(2-1) x (2-1)=1 第四步:确定P值 第五步:判断结果,18,(3)行x列表的x2检验,四格表是指只有2行2列,当行数或列数超过2时,统称为行x列表。行x列表的x2检验是对多个样本率(或构成比)的检验。 基本公式:x2 =(A-T)2/T 专用公式:x2 =n x ( A2 /nR x nC -1) 自由度:=(R-1)x(C-1) 适用条件:表中不宜有1/5以上格子的理论频数小于5,或有一个格子的理论频数小于1。,19,四、注意事项,1、计量资料的注意事项同样适用(见下张幻灯片) 2、公式的适用条件n 、T 3、多组率经x2检验有显著性时,只能说明不全相同,但不能确定哪两个不同。需要进一步证明时,用行x列表的x2分割法。,20,21,练习,书上作业。67页,22,五、参数统计和非参数统计, 参数:总体的统计指标称为参数( 、) 统计量:样本的统计指标叫统计量(X、s、p) 参数统计:我们介绍的统计推断方法,通常要求样本来自正态总体,或方差齐等,在这些假设的基础上,对总体参数进行估计和检验,称为参数统计。 非参数统计:有许多资料不符合参数统计的要求,不能用参数统计的方法进行检验,而需要一种不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验,称为非参数检验。,23,秩和检验,非参数检验的方法很多,秩和检验是较常用的,检验效率较高的一种。其基本原理是编秩求和。,24,成组资料比较的秩和检验,秩和检验的方法很多。 以此例说明秩和检验的基本原理。82页。 研究不同饲料与雌鼠体重增加的关系,问高低蛋白饲料与体重增加有无关系?,不同饲料的两组雌鼠在8周内所增体重(g),26,参数统计和非参数统计优缺点,参数统计 优点: 对资料的分析利用充分 统计分析的效率高 缺点: 对资料的要求高 适用范围有限,非参数统计 优点:对资料的没有特殊要求 不受分布的影响(偏态、分布不明的资料) 不受方差齐性的限制 不受变量类型的影响 不受样本量的影响 缺点: 检验效率低(易犯型错

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论