东南大学考研统计复习课件_第1页
东南大学考研统计复习课件_第2页
东南大学考研统计复习课件_第3页
东南大学考研统计复习课件_第4页
东南大学考研统计复习课件_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、复习陈炳为答疑时间2009-6-15 下午 公共601 闵捷老师2009-6-17 下午 公共601 陈炳为老师题形选择名词解释填空简答题计算分析题第一章概念1 同质、变异2 总体、个体与样本3 统计量、参数统计资料分类type of data 定量资料的描述1 集中趋势的描述(平均数) 均数:正态分布或近似正态 几何均数:经过对数变换后为正态的偏态资料如:正比资料; 中位数:少数数据过大或过小,分布不规则或有开口。 众数2 离散程度的描述 方差、 标准差、 极差、四分位间距、变异系数。变异系数: 不同单位的几组资料比较; 均数相差很大的几组资料的比较。 第三章 分类资料的统计描述频率、强度、

2、相对比间的差别应用相对数时应注意的问题(1)分母不能太小;(2)正确计算合计率;(3)注意资料的可比性。 医学人口统计常用指标人口总数、人口构成(人口金字塔等)、人口死亡统计指标有关生育的统计指标标准化的意义和基本思想直接法间接法动态数列及其指标 绝对增长量、发展速度、增长速度 平均增长速度、平均发展速度第五章 常用概率分布1) 二项分布的应用条件 相对结果,相互独立。2) 二项分布的正态近似 n5且n(1-)53)计算公式:至少、至多、不少于、不多于 如: 至少8例 P(X8)泊松分布的性质二式分布与泊松分布的参数个数。正态分布1)正态分布的性质: 两个参数:均数与标准差2)正态分布下面积(

3、百分位数法) (1.96,-)3)何为参考值范围?4) 参考值范围计算公式: X-us, X+us , Xus ,(P2.5, P97.5)6 统计推断内容 1)假设检验H0 2) P值与值,及其关系 3)单双侧 4) 拒绝域、接受域 Ch7 假设检验1 基本思想2 假设检验的步骤1 选择检验方法,建立检验假设,确定检验水准。2 计算统计量3 确定P值,做出结论。(1) t检验样本均数与总体均数t检验(单样本资料):配对t检验:成组设计的t检验(两组独立样本)。 (3) Z检验的公式 样本例数较大。检验方法假设检验与区间估计关系1 置信区间具有假设检验的主要功能2 置信区间可提供假设检验没有提

4、供的意义。3 假设检验提供,置信区间不能提供的。一类错误与二类错误(1)何为一类错误?何为二类错误?何为检验效能?(2)一类错误与二类错误间的关系。4 随机区组设计方差分析: SS总=SS处理+SS配伍+SS误差 v总=v处理+v配伍+v误差 v总=n-1; v处理=g-1; v配伍=b-1; v误差=n-g-b+1析因设计方差分析:5 多个样本均数两两比较: SNK(q) Dunnet t LSD6 方差分析应用条件: (1) 各组为正态分布 (2) 方差齐性1检验的基本思想假设: 两组的总体率相同,即 。理论上两者的总体有效率等于样本的合计的有效率。基本思想:实际频数和理论频数吻合的程度四

5、格表形式四格表资料的 检验 检验的计算公式 A 为实际频数 T 为理论频数四格表专用公式公式中的a,b,c,d分别为四格表中四个实际频数A11,A12,A21,A22,=a+b+c+d。22检验的条件T 5且n 40时, 不须校正1 T5, 而n 40时, 需计算校正值, 或改用确切概率计算法。T1或n40时, 需用确切概率计算法。 四格表 值的校正 适用条件四格表若有理论频数小于1, 或n40时用其他检验方法所得概率接近检验水准时确切概率法二 多分类的情形-Rc的列联表基本原理和检验步骤与四格表2检验相似1 计算理论频数,计算统计量2 直接计算统计量行列表检验时的注意事项 2检验要求理论频数

6、不宜太小, 一般认为行列表中不宜有1/5以上格子的理论频数小于5, 或有一个理论频数小于1。关于单向有序行列表的统计处理。多个样本率比较的2分割 当2检验结论为拒绝H0,只能说明多组中至少两组的有效概率不同。 进行两两比较,检验水准还取为0.05,将增大型错误。这时,须进行2分割 。若 b+c50mg或0.5mg以下)非参数检验的优缺点 优点:资料分布特征的要求较低,适用范围广缺点:统计效率较低检验的基本思想: 假定两个或多个总体分布相同,将它们混合排秩,然后计算各组的平均秩次,若其平均秩相差较大,则有理由认为0不成立。几种类型的秩和检验配对设计的符合秩和检验完全随机设计的两组独立样本的秩和检

7、验完全随机设计的多组独立样本的秩和检验随机区组的秩和检验查表法近似法CH11 两变量关联性分析线性相关(定量资料与定量资料)秩相关(定量资料与定量资料、定量资料与等级资料、等级资料与等级资料)分类变量的关联性分析 (两分类与两分类资料、两分类与多分类、多分类与多分类)直线相关的目的: 研究两个变量X与Y之间的是否有线性关系及其密切程度。 利用pearson相关系数来表达。相关系数的意义相关系数的假设检验假设检验的目的0假设检验的方法 t检验法 直接查表法秩相关的概念等级相关,可用于如下资料:当资料不满足双变量正态分布的假设时;两个变量中至小有一个变量为定量时;当变量的分布未知时。基本思想 对于

8、不符合正态分布的资料,不用原始数据计算相关系数,而是按其取值由小到大排秩,然后根据这种秩次来计算相关系数。分类资料的关联性分析交叉分类四格表的关联分析配对资料的关联性分析R*C表的关联性分析关于关联性检验的卡方检验与组间比较的卡方检验目的不同设计不同基本思想不同结果解释不同计算公式相同第十二章 简单线性回归简单回归目的: 找出一条最能代表数量依存关系(Y随着X变化而变化)的直线。基本概念直线回归方程:截距回归系数 直线回归的原理: 最小二乘法条件: 线性、独立、正态、等方差回归参数的估计回归系数的假设检验方差分析法2 t检验法直线回归与直线相关的区别与联系概念不同:直线回归研究两个变量之间的数

9、量依存关系;直线相关研究两变量之间相互联系的密切程度。对资料的要求不同:直线 回归要求Y为数值变量且服从正态分布,X为人为控制或精确测量;而直线相关要求X和Y都服从正态分布。统计量不同:回归系数b有单位,相关系数r没有单位。直线回归与直线相关的联系对同一资料计算r与b,它们的符号一致r与b的假设检验等价,即对同一样本有r与b可以互相换算:可以用回归解释相关:确定系数R2说明应变量Y的总变异中归因于X的部分。 第十三章 多重线性回归用回归方程描述一个应变量与多个自变量的依存关系偏回归系数表示在其他自变量固定条件下,某自变量每增减一个单位对y的平均效应.标准化回归系数的意义模型的假设检验整体回归模型的假设检验 偏回归系数的t检验决定系数、复相关系数、校正决定系数Ch19 寿命表现时寿命表法队列寿命表 年龄组 X 平均人口数 Px 实际死亡人数 Dx年龄组死亡率 mx 死亡概率 qx 尚存人数 lx 死亡人数 dx 生存人年数 Lx 生存总人年数 Tx 平均预期寿命 ex第十九章 Logistic回归分析回归系数的解释第二十

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论