下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章2选1总体:总体(population )是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一 变量值的集合。可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总 体。样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。3选1小概率事件:我们把概率很接近于0 (即在大量重复试验中岀现的频率非常低)的事件称为小概率事件。P值:P值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P值反应结果真实程度,一般以 P 0.05认为有统计学意义,P
2、 0.05.反之,如u 1.96, 则Pv 0.05.t值要和某自由度的t界值相比较,确定 P值。如果t值v t界值,故P 0.05.反之,如t t界值,则Pv 0.05.相同自由度的情况下,单侧检验的t界值 要小于双侧检验的t界值,因此有可能出现算得的t值大于单侧t界值,而小于双侧t界值的情况,即单侧检验显著,双侧检验未必就显著,反之, 双侧检验显著,单侧检验必然会显著。即单侧检验更容易岀现阳性结论。当P 0.05时,接受零假设,认为差异无统计学意义,或者说二者不存在质的区别。当Pv 0.05时,拒绝零假设,接受备择假设,认为差异有统v 0.01甚至Pv 0.001,都不说明差异相差很在质的
3、区别。但即使检验结果是 差异。假设检验时应注意的事项(一)要有严密的抽样研究设计;样本必须是从同质总体中随机抽取的;要保证组间的均衡性和资料的可 比性。(二)根据现有的资料的性质、设计类型、样本含量大小(三)对差别有无统计学意义的判断不能绝对化,因检验计学意义时,是指无效假设 h0被接受的可能性只 能拒h0,但尚不能排除有5%或 1%出现的 第二类错误。,(四)统计学上差别显著与否,与实际意义是有区别的。如应用某药治疗高血压,平均降低舒张压0.5kpa,并得出差别有高度统计学意义的结论。从统计学角度,说明该药有降压作用,但实际上,降低0.5kpa是无临床意义。因此要结合专业作岀恰如其分的结论。
4、5%或不水准只是人为规定的界限,是相对的。差别有统到迢甚至不到1%根据小概率事件一次不可;同样,若不拒绝h0,可能产生2选1) err第一类错误与第二类错误(名解 I型错误又称第一类错误(type I 一 通常用表示。G可取单尾也可取双尾,假设检验 或暑=0.01,其意义为:假设检验中如果拒绝_ 结论中,平均有5次或1次是错误的。|H型错误又称第二类错误(type n error ):不拒绝实际上不成立的 率通常用表示。只取单尾,假设检验时的差值P (如)、样本含量以下图说明两类错误:实际上成立的需要确疋殳错误的概率为,为“弃真”的错误,其概率值大小,一般规定门=0.05 5%或1%,即100
5、次拒绝的,为“存伪”的错误,其概 值一般不知道,在一定情况下可以测算出,、和检验水准沁埶曲如已知两总体假设检验示盲圉第四章为什么等级资料不可用方差分析?资料不相互独立方差分析的基本思想 应用条件(简答)方差分析(analysis of variance,ANOVA)的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sum of squares of deviations from mean, SS和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加 以解释,如各组均数的变异SS组间可由处理因素的作用加以解释。
6、通过各变异来源的均方与误差均方比值的大小,借助F分布作岀统计推断,判断各因素对各组均数有无影响。方差分析的应用条件(1)各样本是相互独立的随机样本,且来自正态分布总体。(2) 各样本的总体方差相等,即方差齐性(homoscedasticity) 。第五章分类资料的统计描述(几个常用相对数指标填空题)率(强度相对数,频率相对数)、构成比、相对比应用相对数时应注意的问题(简答题六条)计算相对数的分母一般不宜过小。分析时不能以构成比代替率。不能用构成比的动态分析代替率的动态分析。对观察单位数不等的几个率,不能直接相加求其总率。在比较相对数时应注意可比性。对样本率(或构成比)的比较应随机抽样,并做假设
7、检验。率的标准化的基本思想,应注意的问题(分析题)率的标准化的基本思想:要比较两个总率时,发现两组资料的内部构成(如年龄、性别构成等)存在明显不同,而且影响到了 总率的结果,这时就不宜再直接比较总率,而应考虑采用标准化法。标准化法的基本思想,就是采用统一的标准(统一的内部构成)计算出消除内部构成不同影响后的标 准化率(调整率),然后再进行比较。二、直接标准化法的计算方法当已知所比较资料各组率 Pi,可选用直接法计算标化率。三、 间接标准化死亡比的计算方法-二二一 当所比较的资料已知各自某现象总发生数r及各分组观察单位数时,宜采用间接法计算标化率。,-第六章-二项分布,Piosson分布在什配对
8、与完全随机设计下的四格表的计算第七章(考计算题)列四格表公式选择给个例题丹旅肥胖者与正常体重者的静脉曲张发生情况无羞别 肥胖者与正常体重者的静脉曲张发生情况不同 a = 0.05为研究静脉曲张是否与肥胖有关,:观察1 122对同胞兄弟,每对同胞兄弟中有一个属肥胖, 常体重,记录得静脉曲张发生情况见表8-2,试分析之。评析这是一个配对设计的资料,,因此用配对衍孑订:縊验公式计算。竄,._二-.第八章参数统计与非参数统计(名解 2选1)1. 参数统计样本所来自的总体分布具有某个已知的函数形式,而其中有的参数是未知的,统计分析的目的就是对 这些未知的参数进行估计或检验。此类方法称为参数统计。2. 非
9、参数统计样本所来自的总体分布难以用某种函数式来表达,还有一些资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,解决这类问题的一种不依赖总体分布的具体形式的统计方法。由于这 类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics ),或称为不拘分布(distribution-free statistics)的统计分析方法,又称为无分布型式假定( assumption freestatistics)的统计分析方法。它检验的是分布,而不是参数。非参数统计不需对总体分布(总体参数)作出特殊假设。非参数统计的特点和适用范围(简答)1 .特点(1)
10、 样本所来自的总体的分布形式为任何形式,甚至是未知的,都能适用。(2) 收集资料方便,可用“等级”或“符号”来评定观察结果。(3) 多数非参数方法比较简便,易于理解和掌握。(4) 缺点是损失信息量,适用于参数统计法的资料用非参数统计方法进行检验将降低检验效能。2适用范围(1) 等级资料。(2) 偏态分布资料。当观察资料呈偏态或极度偏态分布而又未作变量变换,或虽经变量变换仍未达到 正态或近似正态分布时,宜用非参数检验。(3 )各组离散程度相差悬殊,即方差明显不齐,且不能变换达到齐性。(4) 个别数据偏离过大,或资料为单侧或双侧没有上限或下限值。(5 )分布类型不明。(6 )初步分析。有些医学资料
11、由于统计工作量大,可采用非参数统计方法进行初步分析,挑选其中有 意义者再进一步分析(包括参数统计内容)。(7)对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作岀估计,在这种 情况下可用非参数统计方法。非参数检验的优缺点:(简答)非参数统计与传统的参数统计相比,有以下优点:1、非参数统计方法要求的假定条件比较少,因而它的适用范围比较广泛。2、多数非参数统计方法要求的运算比较简单,可以迅速完成计算取得结果,因而比较节约时间。3、大多数非参数统计方法在直观上比较容易理解,不需要太多的数学基础知识和统计学知识。4、大多数非参数统计方法可用来分析如象由等级构成的数据资料,而对计量水
12、准较低的数据资料,参 数统计方法却不适用。5、当推论多达3个以上时,非参数统计方法尤具优越性。但非参数统计方法也有以下缺点:1、由于方法简单,用的计量水准较低,因此,如果能与参数统计方法同时使用时,就不如参数统计方 法敏感。若为追求简单而使用非参数统计方法,其检验功效就要差些。这就是说,在给定的显著性水平下 进行检验时,非参数统计方法与参数统计方法相比,第H类错误的概率B要大些。2、对于大样本,如不采用适当的近似,计算可能变得十分复杂。注意:凡符合或经过变换后符合参数检验条件的资料,最好用参数检验。当资料不具备参数检验的条件时, 非参数检验是一种有效的分析方法。配对设计的符号秩和检验方法(简答
13、)(1) 假设:H0:差值总体中位数 Md=0H1: Mck 0a =0.05(2) 求差值(3) 编秩次:依差值的绝对值从小到大编秩次。编秩次时遇差数等于0 ,舍去不计,同时样本例数减1;遇绝对值相等差数,符号相同顺次编秩次,符号相反取平均秩次,且符号相反。(4) 求秩和并确定检验统计量:分别求出正负秩次之和,正秩和以T+表示,负秩和的绝对值以T-表示。 T+及T-之和应等于n(n+1)/2 ,任取T+(或T-)作检验统计量T。(5) 确定P值和作出推断结论:当 n 50时,查T界值表,得出P值。若检验统计量T值在上、下界值范围内,其P值大于表上方相应概率水平;若T值在上、下界值上若范围外,
14、其P值小于表上方相应概率水平。第九章线性相关系数(名解)线性相关系数:表示两个变数线性相关方向及程度的统计数或参数。又叫直线相关系数,简称相关系数。,|R|的极值为1,|R|越大(接近1),则直线关系越好。线性相关系数取值范围(填空)-1 w r w 1样本相关系数r的假设检验(填空题)(1)r界值表法;(2)t检验法。线性相关或回归应用应注意的问题(简答)作回归分析和相关分析时要有实际意义,不能把毫无关联的两种现象作回归、相关分析,必须对两 种现象间的内在联系有所认识。在进行回归分析和相关分析之前,应绘制散点图。但观察点的分布有直线趋势时,才适宜作回归、 相关分析。如果散点图呈明显曲线趋势,
15、应使之直线化再行分析。散点图还能提示资料有无可疑异常点。直线回归方程的应用范围一般以自变量的取值范围为限。若无充分理由证明超过自变量取值范围外 还是直线,应避免外延。双变量的小样本经t检验只能推断两变量间有无直线关系,而不能推断相关的紧密程度,要推断相关的紧密程度,样本含量必须很大。相关或回归关系不一定是因果关系,也可能是伴随关系,有相关或回归关系不能证明事物间确有内 在联系。秩相关的应用适用范围(简答)秩相关,又称等级相关(rank correlation ),是用双变量等级数据作直线相关分析,适用于下列资 料:1. 不服从双变量正态分布而不宜作积差相关分析;2. 总体分布型未知;3. 用等
16、级表示的原始数据。相关与回归的区别与联系(简答)区别:1. 意义:相关反映两变量的相互关系,即在两个变量中,任何一个的变化都会引起另一个的变化,是 一种双向变化的关系。回归是反映两个变量的依存关系,一个变量的改变会引起另一个变量的变化,是一 种单向的关系。2. 应用:研究两个变量的相互关系用相关分析。研究两个变量的依存关系用回归分析。3. 研究性质:相关是对两个变量之间的关系进行描述,看两个变量是否有关,关系是否密切,关系的 性质是什么,是正相关还是负相关。回归是对两个变量做定量描述,研究两个变量的数量关系,已知一个 变量值可以预测出另一个变量值,可以得到定量结果。4. 相关系数r与回归系数b : r与b的绝对值反映的意义不同。r的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高。b的绝对值越大,回归直线越陡,说明当X变化一个单位时,Y的平均变化就越大。反之也是一样。联系:1. r与b值可相互换算;2. r与b正负号一致;3. r与b的假设检验等价;4. 回归可解释相关。相关系数的平方r2(又称决定系数)是回归平方和与总的离均差平方和之比,故回归平方和是引入相关变量后总平方和减少的部分。回归系数的估计原则:最小二乘 (least squares) 原则(填空)应用直线回归时的注意事项(简答)应用直线
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 算法设计与分析 课件 5.4.3-动态规划-0-1背包问题-空间优化
- 2024年濮阳资格证客运题库
- 专题1名词的数-2023年中考英语核心语法逐个突破(原卷版)
- 吉首大学《程序设计基础》2021-2022学年期末试卷
- 吉林艺术学院《艺术展览策划》2021-2022学年第一学期期末试卷
- 吉林艺术学院《人体造型训练》2021-2022学年第一学期期末试卷
- 吉林艺术学院《合唱Ⅴ》2021-2022学年第一学期期末试卷
- 吉林艺术学院《版面与图式》2021-2022学年第一学期期末试卷
- 吉林师范大学《羽毛球教学与训练》2021-2022学年第一学期期末试卷
- 2024年大小水库转让协议书模板范本
- 2022中央机关遴选公务员笔试题
- 安全生产费用提取 和使用管理制度(3篇)
- 《眼科学基础》期末复习题库含答案
- 西师版数学一年级上册一、二单元测试题参考范本
- 夹杂物控制攻关方案
- 1+X智能财税初级企业管家考试试题与答案
- 第四章离心铸造
- 管道管网非开挖修施工措施
- 西亚教学设计与反思
- 河北省普通高中学业水平考试历史试卷及答案
- 常暗之厢(7规则-简体修正)
评论
0/150
提交评论