已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1.变异:同质事物之间的差别。2.频数分布的两个特征:集中位置,离散趋势3.数据分布的类型:对称分布和非对称分布。非对称分布又称偏态分布,包括正偏态和负偏态。单峰分布,双峰分布,多峰分布。4.统计描述:用统计表、统计图和统计指标等方法对资料的数量特征与分布规律进行描述。5.集中位置的描述,集中位置指标又称平均数指标。有哪些及适用条件?(1)算数平均数:最适用于单峰对称分布资料的平均水平的描述,特别是正态分布资料(2)几何平均数:适用于等比资料 对数正态分布资料(3)中位数和百分位数:适用于偏态分布的资料 开口资料 资料分布不明等6.离散趋势的描述(1)全距亦称极差,适用于单峰小样本资料(2)四分位数间距,适用于单峰小样本资料(3)方差和标准差,适用于对称分布尤其是正态分布资料(4)变异系数,常用于比较度量衡单位不同的两组或多种资料的变异度 比较均数相差悬殊的两组或多组资料的变异度7.常用相对数(1)率,是二分类指标(2)构成比(3)比8.正确应用相对数应注意几个问题:(1)计算相对数的分母不宜过小(2)分析时不能以构成比代替率(3)对观察单位数不等的几个率,不能直接相加求其总率(4)计算率时要注意资料的同质性,对比分析时应注意资料的可比性(5)也有抽样误差,需要假设检验。9.率的标准法(1)基本思想:采用统一的标准,以消除病情构成不同对治愈率比较的影响,使算得的标准化治愈率有可比性。(2)目的:控制混杂因素对研究结果的影响。10.正态分布(1)概念P16(2)标准正态分布,u变换:u=,u是标准正态离差,是均数,是标准差。uN(0,1)(3)正态分布的特征:是单峰分布,高峰位置在均数X=处。以均数为中心,左右完全对称。取决于两个参数,均数和标准差。为位置参数,越大,则曲线沿横轴向右移动;越小,则曲线沿横轴向左移动。为形态参数,表示数据的离散程度,若小,则曲线形态“瘦高”;大,则曲线形态“矮胖”。有些指标不服从正态分布,但通过适当的变换后服从正态分布,如对数正态分布。正态分布曲线下的面积是有规律的:总面积恒定为1,对称区域面积相等,对应区域面积相等。(4)几个u界值:90:双侧=单侧=1.64 95:双侧=单侧=1.96 99:双侧=单侧=2.5811.二项分布(1)样本率的标准差的估计值计算公式:=,p是样本率(2)样本个数n和概率如何影响二项分布的图形? 给定n后,形状取决于。当=0.5时,分布对称;当0.5时分布呈负偏态。随n的增大,分布逐渐逼近正态分布。如果n或n(1-)大于5时,则可用正态近似原理处理二项分布的相关问题。(3)应用条件:对立性,重复性,独立性。12.Poisson分布(1)概念,描述罕见事件发生次数的概率分布,是特殊的二项分布。(2)均数与方差相等,均为。(3)形状取决于的大小,为正偏态分布,越小分布越偏;随着的增大,分布逐渐趋于对称,当=20时,已基本接近对称分布;当50时,可按正态分布原理处理Poisson分布的有关问题。(4)Poisson分布具有可加性。(5)应用条件:对立性,重复性,独立性。即事件的发生是相互独立的,且发生的概率不变,结果是二分类的(发生或不发生)13.参考值范围(1)概念:绝大多数正常人某指标的波动范围。(2)正态分布法计算100(1) 正常值范围:双侧 S 单侧 S(高侧) +S(低侧)注意取值:双侧95 1.96S 单侧95 高侧+1.64S(3)百分位数法:知道求得第几个百分位数P2614.抽样误差(1)概念:由于个体变异的存在,由抽样引起的样本统计量与总体参数间的差异。(2)产生的两个必备条件:抽样研究 个体变异,是根本原因(3)中心极限定理的涵义从均数为、标准差为的正态总体中独立、重复、随机抽取含量为n的样本,样本均数的分布仍为正态分布,其均数为,标准差为。XN(,)XN(,)即使从非正态总体(均数为、标准差为)中独立、重复、随机抽取含量为n的样本,只要样本含量足够大(如n50),样本均数也近似服从均数为,标准差为的正态分布。(4)标准误意义:1.用来衡量抽样误差的大小 2.= 标准误与个体变异成正比,与样本含量n的平方根成反比(5) 标准误的估计值的计算公式:样本标准差s代替总体标准差,=(6) 标准差与标准误的关系区别标准差s标准误意义个体变异统计量的抽样误差用途正常值范围(1.96s)总体均数的可信区间(1.96)与n关系n,s趋于稳定n,趋于联系:两者都是变异指标,说明个体之间的变异用标准差,说明统计量之间的变异用标准误; 当样本量不足时,标准差大,标准误也大,均数的标准差与标准误成正比。=15. 医学统计学:运用概率论和数理统计等数学的原理和方法,研究医学领域中资料的搜集、整理、分析和推断的一门学科。16. 三类资料:定量资料(数值资料)定性资料(无序分类资料)等级资料(有序分类资料)17. 总体:按研究目的所确定的研究对象中,所有观察单位某项指标取值的集合。18. 样本:从研究总体中,随机抽取具有代表性的部分观察单位某项指标取值的集合。19. 同质性:具有相同性质的事物。20. 参数:描述某总体特征的指标。21. 统计量:描述某样本特征的指标。22. 概率:随机事件发生可能性大小的一个度量,取值范围为0P123. 小概率事件:发生概率0.05的事件。24. 小概率原理:小概率事件发生的可能性很小,进而认为其在一次抽样中不可能发生。25. 理解和解释可信区间26. 统计推断:根据样本所提供的信息,以一定的概率推断总体的性质。包括两方面的内容:参数估计和检验假设。27. 可信区间的两个要素:可靠性,精确性28. 均数的可信区间:从正态分布总体N(,)中随机抽取一个样本,则t=服从自由度=n-1的t分布。总体均数的(1-)可信区间定义为(,+)。如n100,可用标准正态分布代替t分布,相应的100(1-)可信区间为(,+)。29. 率的可信区间:(1)率的标准差又称率的标准误,为=(2)总体率的区间估计用正态近似法的条件:样本含量n足够大,且样本率p和(1-p)都不太小时,如np和n(1-p)均大于5时,的可信区间为(p,p+)。30.事件数的可信区间:当X50也可以查附表7“Poisson分布的可信区间”,得到的95或99可信区间。31.假设检验(1)基本思想:(2)4个基本步骤:建立检验假设:= :、之间不等或不全相等。确定检验水准(拒绝时的最大允许误差)计算检验统计量并求值界定P值并作结论(要回下结论):,拒绝,接受; ,不拒绝。(3) 型错误:真实时被拒绝。P0.05却拒绝H0接受H1(4) 型错误:不真实时不拒绝。H1真实即P2时,q检验的检验功效高于q检验,所以当实验研究设计为一个对照组与多个实验组均数比较时,q检验科得到较高的功效。定性资料的分析39. 假设检验步骤P7340. 检验(1) 基本思想:(2)应用条件:n40,T5,用检验n40但1T5,需用校正检验T1或n40,改用确切概率法。(3)理论频数T的计算公式:=(4)RC表的自由度=(行数-1)(列数-1),故四格表=1(5)要记的界值:=3. 8441.配对检验的应用条件:b、c为结果不同部分(甲阳乙阴、甲阴乙阳)b+c40时不用校正 = =120b+c40时要校正 = =142. RC表的应用条件:多个率或构成比的比较,其自由度大于1RC表中不宜有以上格子的理论频数小于5,或不宜有一个理论频数小于143. 对理论频数太小的样本的处理办法:增加样本例数删去理论频数太小的行或列将太小理论频数所在的行或列的实际频数,与性质相近的邻行或邻列的频数,合并。44. 参数检验:以特定的总体分布(如正态分布、二项分布)作为前提,对总体的参数进行的假设检验,限制条件:总体正态分布、总体方差齐性。45. 非参数检验:不依赖于总体的分布类型,不针对总体参数,只针对总体分布是否相同的检验方法;常用于解决总体分布未知的统计问题。46. 秩和检验(1) 基本思想:两组秩和相加等于N(N+1)/2。(+=N)(2) 两组比较的秩和检验基本思想:若A、B两组等级分布相同,则含量为的样本之实际秩和T与其理论秩和(N+1)/2之差纯系抽样误差所致,因此差值不会很大,差值越大的概率越小。方法步骤:P88仔细弄明白1建立检验假设:两组分布相同; :两组分布不同。 =0.052编秩3求秩和T4确定检验统计量T5确定P值,作出推断性结论(3) 配对秩和检验:设n为非0差值的个数,则+=n(n+1)/2。(4) 秩和检验的使用范围:理论上可用于任意分布的资料等级资料定量资料,开口资料定量资料,分布极度偏态,或个别数值偏离过大而不属于“过失误差”者定量资料,各组离散程度相差悬殊,即使经变量变换,也难以达到方差齐性定量资料,分布型尚未确知兼有等级和定量性质的资料(5) 秩和检验的优缺点:P9547. 直线相关(1)概念:用来描述两个呈正态分布的变量之间的线性共变关系。(2)应用条件:双变量正态分布48.相关系数(1)概念:表达两变量间线性相关的程度和方向的一个统计指标。(2)特征:无量纲取值范围为-1r1。相关系数小于0为负相关;大于0为正相关;等于0为零相关相关系数的绝对值越大,表示两变量间的相关程度越密切;相关系数越接近于0,表示相关越不密切。(3) 相关系数的假设检验用t检验为相关系数的标准误 = r有公式 t=/建立检验假设:=0,与无相关关系; :0,与有相关关系。 =0.05计算检验统计量,r,t,=n-2作结论:按=8查t界值表得P0.001。按=0.05水准拒绝,接受。故可认为与之间有正相关关系。50. 何时用等级相关?51. 直线回归(1) 自变量x,应变量y(2) 直线回归方程的一般表达式:=a+bXa、 b是决定回归直线的两个参数:a为回归直线在y轴上的截距;b为回归系数,即回归直线的斜率。(3) b的意义:表示自变量增加一个单位时,应变量的平均改变量。要会解释,例如b=0.2385(/kg),表示体重增加1(kg),则体表面积平均递增0.2385()。(4) 的意义:表示给定X时Y的平均值的估计。例如X=12(kg)时,=5.3832(),其意义是:所有体重为12(kg)的3岁男童,估计其平均体表面积为5.3832()。 (5) Y-的意义:称为剩余、残差,是y的观察值与对应的估计值之差。在回归图中表示各散点到回归直线的纵向距离。=0(6) 的意义:剩余平方和。坐标系中,每一条直线均可计算散点到该直线的纵向距离之平方和;但只有各散点到回归直线的纵向距离之平方和,即是唯一最小的。以此为准则,可导出a、b的最小二乘估计(公式)。52. 回归系数的假设检验用t检验(1) 为剩余标准差,常用于评价啊回归方程的拟合精度。扣除x的影响后,y本身的变异程度。=(2) 为样本回归系数的标准误 =/(3) 检验假设:总体回归系数=0,即与无回归关系; :总体回归系数0,即与有回归关系。 =0.05。计算检验统计量:,=,=n-2作结论:按=8查t界值表得P0.001。按=0.05水准拒绝,接受。故可认为与有回归关系。(4) =,因为自由度相同,故回归系数是否为0的假设检验与相关系数是否为0的假设检验是等价的。相关系数的假设检验更简单。53. 应变量总变异的分解=+=+=+;=n-1;=1;=n-254. 回归方程的方差分析 要会填表P125=,即在直线相关与回归分析中,相关系数的t检验、回归系数的t检验、回归方程的方差分析是等价的。55. 直线回归与直线相关的区别及联系(1) 区别对资料的要求:回归只要求应变量y是随机变量且服从正态分布,变量x有两种:精确测量和严格控制的变量(型回归)、随机变量(型回归)。相关:x、y均为随机变量且服从双变量正态分布应用:回归反映两变量间的依存关系;相关反映两变量间的相互关系。计量单位:r没有单位;b的单位是:y单位/x单位(2) 联系正负符号:在
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 包含2024年度特色的铲车及翻斗车租赁合同
- 二零二四年版权质押合同
- 承包2024年度大型购物中心厕所设计与施工合同
- 二零二四年度高级管理人员雇佣合同
- 二零二四年度船舶制造OEM合作与技术交流合同
- 2024年度电机产品生产工艺改进与优化合同2篇
- 二零二四年度电子产品生产销售合同
- 二零二四年度智能化安防系统设备采购合同
- 瓷砖铺贴工程2024年度合同
- 辽宁省重点高中沈阳市郊联体2024-2025学年高二上学期11月期中考试 语文 含解析
- 《颈椎病病人的护理》PPT课件(完整版)
- 广州供电局输电部高压电缆运行工作介绍
- (完整版)电子科技大学微电子器件习题
- 学校课程规划方案
- 幼小衔接的主要内容
- 四年级数学期中质量分析ppt
- 兴趣小组活动
- 营运资金测算表
- 人教版八年级上册第一章《机械运动》单元备课教案
- 隧道检测报告二衬
- 舞蹈老师实习周记Word版
评论
0/150
提交评论