![医学统计学重点要点_第1页](http://file2.renrendoc.com/fileroot_temp3/2021-11/29/b8396185-db42-496a-8127-fa4d6bbea284/b8396185-db42-496a-8127-fa4d6bbea2841.gif)
![医学统计学重点要点_第2页](http://file2.renrendoc.com/fileroot_temp3/2021-11/29/b8396185-db42-496a-8127-fa4d6bbea284/b8396185-db42-496a-8127-fa4d6bbea2842.gif)
![医学统计学重点要点_第3页](http://file2.renrendoc.com/fileroot_temp3/2021-11/29/b8396185-db42-496a-8127-fa4d6bbea284/b8396185-db42-496a-8127-fa4d6bbea2843.gif)
![医学统计学重点要点_第4页](http://file2.renrendoc.com/fileroot_temp3/2021-11/29/b8396185-db42-496a-8127-fa4d6bbea284/b8396185-db42-496a-8127-fa4d6bbea2844.gif)
![医学统计学重点要点_第5页](http://file2.renrendoc.com/fileroot_temp3/2021-11/29/b8396185-db42-496a-8127-fa4d6bbea284/b8396185-db42-496a-8127-fa4d6bbea2845.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学统计学医学统计学重点第一章绪论1 .基本概念:总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。样本:从总体中随机抽取部分个体的某个变量值的集合。总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。频率:若事件A在n次独立重复试验中发生了 m次,则称m为频数。称m/n为事件A在n次试 验中出现的频率或相对频率。概率:频率所稳定的常数称为概率。统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律
2、 进行刻画和描述。统计推断:包括参数估计和假设检当用样本统计指标 (统计量)来推断总体相应指标(参数), 称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别, 称为假设检验。2 .样本特点:足够的样本含量、可靠性、代表性。3 .资料类型:(1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所 得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的 数值,有度量衡单位。(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由各分组标志及其
3、频数构成。包括二分类资料和多分类资料。二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。多分类:将观察对象按多种互斥的属性分类等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单 位的个数所得的资料。4 .统计工作基本步骤:统计设计、资料收集、资料整理、统计分析第二章实验研究的三要素1 .实验设计三要素:被试因素、受试对象、实验效应2 .误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差。3 .实验设计的三个基本原则: 对照原则、随机化分组原则、重复原则。4 .实验设计方法有 /析因设计 正交试验设计 均匀试验设计交互作用/两组:异体配对设
4、计一同体配对设计一交叉设计无、随机同期对照实验设计 < (单因素两水平)扩展多组:单因素多水平一配伍组设计一 拉丁方设计(两因素多水平)(三因素多水平) 配伍组设计:也称随机区组设计,将条件相近的受试对象配伍,每个配伍组中的对象随机分配 到各处理组中。析因设计:考察两个或两个以上的处理因素,将各个因素的水平进行全面组合 ,每个组合下至 少有两个以上的观察对象重复测量。一般来讲,应尽可能安排等重复试验,以简化计算,2-3个水平数。优点是全面性和均衡性较好,可同时分析处理因素的效应及因素间的交互作用。拉丁方设计:用于三因素等水平无交互。第三章定量资料的统计描述、参考值范围1.频数表编制过程(
5、了解)(1)找出样本数据的最大值和最小值,计算极差R;(2)分组:确定分组的组距d和组数k;一般 n<50, 5-6 组;n 在 100 左右,7-10 组;n>100, 10-15 组(3)求频率密度:统计频数,算出频率、频率密度和累积频率;(4)画出直方图。2 .频数表和直方图的作用:用于观察个数较多资料的统计描述,可以直观提示资料的分布 特征和分布类型。3 .集中趋势、离散趋势的指标及适用范围(1)集中趋势:X, G M R, M算术均数:适用于对称分布;不适用于偏态分布和资料中出现极值的资料。几何均数:适用于呈倍数关系的资料或对数正态分布的资料,尤其是正偏态分布 不适用与观
6、察值中有0或正负数值同时出现的资料。中位数:适用于大样本偏态分布或分布情况不明的资料或资料中有不确定数值的资料。百分位数的作用:多个百分位数结合使用,全面描述数据分布的特征;用于确定医学参考值范围(偏态或分布不明的资料)。众数:适用于大样本,较粗糙。(2)离散趋势:极差:优点:简单明了、容易使用。缺点:只反映最大值和最小值间的差异,不能反映其他观察值的变异程度。样本容量越大,极差可能越大。极差的抽样误差大,不稳定。四分位数间距:适用于确定医学参考值范围,与中位数一起描述偏态分布资料变异程度 缺点:类似于极差,利用度低。方差与标准差:与均数一起描述对称分布,特别是正态分布的分布特征。变异系数:适
7、用于:适用于比较度量衡单位不同资料的变异度。比较均数相差悬殊的资料的变异度。衡量实验精密度和稳定性的常用指标。(3)频数分布特征高峰在中间,左右大致对称,称为对称分布。平均数二中位数二众数高峰偏向小值的一侧(左侧),称正偏态分布(亦称右偏态)平均数 >中位数 >众数高峰偏向大值的一侧(左侧),称负偏态分布(亦称左偏态)平均数 < 中位数 < 众数对称分布正(右)偏态分布负(左)偏态分布4 .正态分布图形的特点及意义(1)特点:f (x)关于x=p对称乂二小时取得最大值在x二N ±b处为拐点,且以x轴为水平渐近线f (x)大于0P (x=a) =0若f (x)在
8、点x处连续,则F' (x) =f(x)(2)意义: 亡f(x)=1, f (x)在负无穷到正无穷的积分值为1,即曲线下方面积为1。5 . w和1的意义小:位置参数,当固定时,以增大,曲线沿横轴向右移动;以减小,曲线沿横轴向左移动 一:形状参数,当以固定时,越大,曲线越矮胖;越小,曲线越高瘦。6 .标准化变换z= x_E x N(p, o-2) z N (0, 1) (TF (x)=(x一-) =c> (z) gp P(X<x) =c>( -一- )=RZ<z) (T(T_ 工 b 工 a- a_u, x-Li b_ Lt _ a_ u, b P (a<x&
9、lt;b) =F(b) -F(a)=( -)-中(-)P(-<- <-)=P( < Z < )OO(T(T(T(TOx轴上方中间面积一致7 .标准正态分布界值规定:界值右侧曲线下方面积等于它的下角标。下角标一致,亿<z上)=1-_ a(z>z 士 ) = 2下限:(z>zi-)=1- a(z<zi-)=a双侧界值:P (|z| <z© =1- aP (|z| > z _a) = a单侧界值:上限:P (z>z)=aP (z<z a) =1- a8 .正常值范围及意义概念:医学临床中,常将就诊者的某些生理、生化、免
10、疫学指标的测定结果,与排除了对研 究指标有影响的疾病和有关因素的大多数“正常人”的相应数值进行比较,以就诊者 的测定值是否超出了大多数“正常人”相应指标的波动范围,作为临床诊断的重要参 考,又称医学参考值范围。意义:95%勺参考值范围含义是指:样本中有 95%勺个体测定值在所求范围之内。以95%勺置信区间来说,意义是:该区间以 95%勺概率包含了待估计的参数,这种估计的可信度是95%会冒5%勺风险。公式: 双侧95%勺界限值:X ± 1.96s单侧95%勺上限值:X+1.645S单侧95%勺上限值:X-1.645s第四章 总体均数的估计、假设检验1 .标准误(1)概念:每次样本计算出
11、的x不同,这些x的标准差称为均数的标准误(2)意义:是衡量样本统计量抽样误差大小的统计指标。(3)与标准差的区别:二者都是描述变异程度的指标,标准差描述个体值的变异,标准误描 述统计量的变异。(4)均数标准误的公式:SX= s 、n2 .置信区间(1)定义:设9为总体的未知参数,若由样本确定的两个统计量9 1(X1、X2、xn)和9 2(x1、X2、Xn),且8 1< 8 2,对于预先给定的值a (0< a <1),若满足P( 6<比)=1- a ,则称随机区间(01, 0)为8的1- a置信区间,其中称为仇置信下限,称为0 置信上限,1- a称置信度。(2)意义:区间
12、(9i,叼 包含有参数9的概率为1- a ,不能说8在(01, 02)的概率为1-a 0例:可以说(a, b)包含均数仙的概率为95%不能说以在(a, b)的概率为95%(3)公式:单个正态总体均数 小的区间估计已知:(双侧:x+z工即X 士 z人一 心a (x x2 Vn2Z 分布单侧:X±Z"4即X±ZCT. n-(T未知:s 一双侧:x±ta-=即 x±tasx i n4小样本(n< 50) t分布l单侧:x±3十即x±tasxs双侧:x ±za 即 x + zaSk2 v'n1大样本(n>
13、;50) z分布 i 单侧:x士z0f搭 即 x±ztsx '.n'(4)两要素:准确度:由1- a决定,1- a越大,准确度越高。精确度:由区间长度决定。99% 置信区间准确度高于95%S信区间。95%S信区间精确度更高。3.抽样分布(1) t分布定义: 来自正态总体的一组样本,X和s分别是样本的均数和标准差。则t=*= s/ nt 分布,自由度df=n-1 ,极限分布是标准正态分布。图形分布特征:以0为中心,左右对称的单峰分布。自由度越大,越高瘦界化双侧:P (|t| <t f) =1- a PP (|t| * f ) = a P单侧:上限:P(t<t
14、 )=1- aP(t>t )= a(2) x2分布一a a(t<t )=1-a(t>t a )=-下限:P(t<t i)=aP(t>t i)=1- a23定义:若从均数为小,标准差的正态总体中,每次抽取样本含量为 n的样本,计算样本标准差s,则/= (n-1) s2/62服从自由度df=n-1的2分布图形分布特征:曲线偏向左边自由度越小曲线越偏界化双侧:P(X2>X2a) = -P万 2P(X2<X2a)=1- -P22单侧:上限:P(X2>X;) =aP(X2<X;) =1- a(3) F分布(X2> £-2)=12/ 2
15、 X21 -x a(X <X 2)=2下限:P(X2>X21)=1- aP(X2<X21)=a定义:如果分别从两个正态总体 N (邛,(T1)和N (邛,(T1)中随机抽取样本含量22n1、n2的两个样本,算出样本均数和方差分别为 X1,s12和72, s2,则F=S2鸟S2 /二 2服从 df1=n1-1 , df2=n2-1 的 F 分布。2若X1、X 2分别服从自由度df1、df2的X2分布,则F= 1/df1df1df225图形分布特征曲线偏向左边df 1、df2同时增大,曲线趋向于对称倒数性质:F (1-?),(df1df 2) =1 ,21F (df 1,df 2
16、)界化双侧:P(F>Fa) = £P(F>F )=1-221G 2P(F<F)=1-2单侧:上限:P(F>F)=aP(F<F)=1- a- aP (F< F -.)=-1 -22NPP下限:(F>E-a)=1- a(F<F1)=a4.假设检验(1)基本思想:反证法、小概率事件原理(2)基本步骤:建立假设,确定检验水准H0 :原假设,差异存在但不显著或差异无统计学意义H1 :备择假设,差异显著或差异有统计学意义在原假设成立条件下,选择统计方法并计算检验统计量。(认为误差由抽样产生) 参数检验统计量要求满足:i) 在H0成立的条件下,服从特
17、定的抽样分布;ii) 必须包含要检验的总体参数;iii) 对于给定的样本数据,能计算出该检验统计量的数值。对于给定的a值做出检验结论,并给以专业解释判断P值:(与界值比较,反查界值表确定范围,软件计算)若P>a ,则接受Ho,拒绝Hi ;若P<a ,则拒绝Ho,接受Hi 。(3)检验方法:正态性检验、方差齐性检验、t检验(4)两类错误实际情况判断接受H0拒绝H0H0止确止确1- a第一类错误aH0不止确第二类错误B止确1- B第一类错误又称弃真错误、假阳性错误,第二类错误又称取伪错误、假阴性错误。P& a时,拒绝H0,可能犯I类错误(a)。此时,P值越小,犯I类错误的概率越
18、 小,结论越可靠。P>a时,接受H0,可能犯R类错误(B )。此时,虽然B未知,但P值越大,犯R 类错误的概率越小,结论越可靠。减少(增加)I型错误,将会增加(减少)II型错误增大n,可以同时降低两类错误。第五章方差分析1 .方差分析基本思想目的:根据各个总体的样本观测值,检验各个总体均值间和两两总体均值问是否存在显著性 差异。基本思想:根据离差来源的不同,将总离差平方和分解为两部分:由试验的随机因素(误差)引起的组内离差,由因素的作用(即处理水平不同)引起的组间离差。总离差平方和=组内离差平方和+组间离差平方和(SST= SSe + SSa)2 .方差分析单因素方差分析、配伍组设计方差
19、分析、析因设计方差分析拉丁方设计方差分析、正交设计方差分析交叉设计方差分析、组内分组设计方差分析第六章双变量相关与回归1 .散点图特征正相关完全正相关负相关完全负相关不相关2 .相关系数意义及分类(1)意义:相关系数r的大小反映随机变量X和Y之间线性关系的密切程度:若r=0 ,则X与Y不相关;若|r|=1 ,则X与Y完全相关。相关系数r的符号反映随机变量X和Y之间线性关系的相关方向:若0<r<1,则X与Y正相关;若-1<r<0,则X与Y负相关。(2)分类:积差相关系数:双变量为服从正态分布的计量资料等级相关系数:等级或相对数资料;不服从正态分布;总体分布类型未知。(3)
20、适用范围:两个变量必须是随机变量,即变量的取值在实验前或测定前是无法预先知道的3.线性相关分析和回归分析的联系与区别(1)联系:r= bJl xx/ l xylxx、lxy分别是x、y的标准差方向一致,r与b方向一致r与b的假设检验等价,即同一样本存在:tr=tb回归强度与相关强度:R2=SS回/SS总=2 (仅限n型回归)(2)区别:资料相关:x,y必须是随机变量回归:x是确定变量称I型回归,y必须是随机变量 4x 是随机变量称II型回归计量单位:r不受单位影响,b受单位影响意义:相关说明相关关系,相关关系描述变量间关系的密切程度与方向。回归说明依存关系,回归方程描述变量间的数量依存关系。取
21、值范围:|r| <1, be R4 .最小二乘法把观测点(x i, y i)标在直角坐标系下作成散点图,则必存在着一条直线,使每个点(x i, y i)距这条直线在纵方向上的距离的平方和为最小,此平方和称为残差平方和,这就是最小二乘法。5 .决定系数的意义R2=SS回/$总=(SS总-SS 剩)/SS >»= (1-SS 剩)/SS 总0 < R2 <1, R2越接近于1,表示回归平方和在总平方和中所占的比重越大,回归效果越好第七章两分类资料的统计描述与推断1 .相对数指标两个有联系的指标之比。常用的有率和比(构成比、相对比)。(1)率:频率,说明某现象发生的
22、频率和强度。总体率:冗,样本率:p。多 某现象实际发生的例数一率=K可能发生该现象的总例数(2)构成比说明某事物内部各组成部分在总体中所占的比重或分布。心中小 某一组成部分的观察单 位数 dnno/构成比=100%同一事物各组成部分观察单位总数(3)相对比:两个有关指标 A B之比,说明两者的对比水平,A是B的若干倍或百分之几对比的数值可以是绝对数、相对数或平均数。第八章RX C表资料的分析1 .列联表分类及统计方法(1)双向无序:多个样本率或构成比比较一 /检验(2)单向有序:分组变量有序一 X2检验(同双向无序)结果变量有序一秩和检验或Ridit分析(3)双向有序:属性相同一 McNema
23、r Kappa检验属性不同一秩相关分析、线性趋势检验、秩和检验或Ridit分析2 .列联表注意事项(1) RX C表中不宜有20犯上的格子的T<5,不能有T<1。理论数太小处理办法:最好增加样本例数以增大理论数删去理论数太小的行和列将太小理论数所在行或列的实际数与性质相近的邻行/列合并 采用Fisher检验(2) RX C表 2检验未考虑等级顺序关系,若处理效应按强弱或优劣分为有序等级时采用秩 和检验或Ridit分析。(3)拒绝H0时不能确定是不全相等还是全不相等,需进行两两比较。第九章非参数检验、Ridit分析1 .参数检验和非参数检验特点(D参数检验:特点:总体分布的类型为已知
24、,只是一个或几个参数未知,对未知参数进行检验。优点:检验效能高,允许应用样本提供的数据缺点:受应用条件限制(2)非参数检验:特点:又称任意分布检验,是与总体无关的检验方法,它不比较参数,而是比较分布的 位置,允许根据分布情况而不是总体参数做出推论。优点:不依赖总体分布类型,应用广泛缺点:符合参数检验的用非参数检验会降低检验效能。2 .检验方法符号秩和检验、成组秩和检验、多组秩和检验、配伍秩和检验。检验方法1 .正态性检验(1)目的:在做t检验方差分析之前首先判断是否服从正态分布(2)过程:假设H0:总体服从正态分布;H:总体不服从正态分布。a(3) SPSS吉果:看sig值,sig> a
25、,接受H0,服从正态;sig< a ,接受H,不服从正态2 .方差齐性检验(1)目的:利用样本信息推断总体方差是否相等(2)前提:正态分布(3)过程:建立假设:假设H0:仃2=仃2即方差齐;H:仃2金仃2。aS2 /0 2 S2计算统计量:F =s2" 2 = s2 df i=ni-1 df 2=n2-1P值:F<F.(df 1, df2)WJ P>a ,接受 H0F>E(df 1, df2)贝U P<a ,拒绝 H0(4) SPSS吉果:sig> a ,接受H,满足方差齐性;sig< a ,接受H,不满足方差齐性。3 .单样本t检验(1)目
26、的:推断一组样本代表的总体均数与已知总体均数间的差异。(2)前提:单组设计计量资料(非分类)资料服从正态分布(3)过程:建立假设:假设H0: N =(i0; Hi:(1*(10。a计算统计量:2=土;或1=之一0 / 、 n s/ . nP值:zvz.df1,则P>a ,接受Hz>z«df 1,贝U P<a ,拒绝 HO(4) SPSS吉果:sig> a ,接受H0,差异无统计学意义;sig< a,接受Hi,差异有统计学意义4.配对t检验(1)目的:推断两组样本代表的总体均数的差值是否为零(2)前提:配对设计计量资料(非分类)差值服从正态分布(3)过程:
27、建立假设:假设H0: 口=0 ; H: -W0。a计算统计量:t= 一d产df=n-1 Sd / nP值:t<t “d" 则P>a,接受H0 ,t>t adfi,则P<a ,拒绝代t<t?dfi,则 P>a,接受 H0 ,t> t : dfi,贝U P<a,拒绝HO(4) SPSS吉果:sig> a ,接受H),差异无统计学意义;Sig< a,接受Hi,差异有统计学意义5 .成组t检验(1)目的:推断两组样本代表的总体均数是否有显著性差异(2)前提:完全随机成组设计;计量资料(非分类);独立性;正态性;方差齐性。(3)过程:
28、方差齐性检验建立假设:假设H0: (11=(12;Hl:呼*(!2(或 呼>(I2,仙1<(! 2) o 0C计算统计量:t或t '(方差不齐)df=n i+n2-2P值:t<t .(df 1, df2),则 P>a,接受代,t>t ”(df 1, df2),则 Pva ,拒绝 H)t< t 外df 1,df 2),则 P>a ,接受 HO ,t> t二(df 1df2),则 P<a ,拒绝 HO(4) SPSS吉果:sig> a ,接受H0,差异无统计学意义;Sig< a,接受Hi,差异有统计学意义6 .单因素方差分析
29、(1)目的:推断多组样本代表的总体均数是否有显著性差异。(2)前提:完全随机多组设计;计量资料(非分类);独立性;正态性;方差齐性。(3)过程:正态性检验和方差齐性检验建立假设:假设H0: 11=12- n; Hl: N 1、仙2、口不全相等或全不相等。0C 计算统计量:P化P>a,接受H0 , P<a ,拒绝H0(4) SPSS吉果:sig> a ,接受H0,差异无统计学意义;sig< a,接受Hi,差异有统计学意义。 方差分析表:变异 来源离差平 方和自由度F值P值组问S8K-1MS=SS/(k-1)F=MSMSEF>R (k-1,N-k),P< a组内
30、SGN-kMS=SS/(N-k)总和SSN-1(5)注意:组内变异:随机误差组问变异:随机误差+处理因素若代成立:组内变异弋组间变异若H成立:组内变异 < 组间变异7 .配伍设计的方差分析(1)目的:推断多组样本代表的总体均数是否有显著性差异(2)前提:完全随机多组设计;计量资料(非分类);独立性;每个因素的各水平正态性;每个因素的各水平方差齐性。(3)模型设计:双因素且无交互作用:处理因素一一重要实验因素配伍因素一一主要非处理因素SS总=$处理+SS酣e+SS误差(3)过程:正态性检验和方差齐性检验建立假设:处理组:假设H0: Nl=N2=-=Nn; Hi:1、仙2、卜n不全相等或全不
31、相等。配伍组:假设H0:1= 2=-=n; Hi:邛、(12、一、(In不全相等或全不相等。0C计算统计量:P化P>a,接受代,P<a ,拒绝H0(4) SPSS吉果:sig> a ,接受H0,差异无统计学意义;sig< a,接受Hi,差异有统计学意义 方差分析表变异来 源离差 平方和自由度F值P值处理因素ASSK-1MS=SS/(k-1)Fa=MS/MSe配伍因素BSSB-1MS=SS/(b-1)Fb=MS/MSe误差SS(k-1)(b-1)MS=SS/(k-1)(b-1)总和SSKb-1F a(k-1,(k-1)(b-1)Fa(b-1,(k-1)(b-1)8 .析因
32、设计的方差分析(1)目的:推断多组样本代表的总体均数是否有显著性差异。(2)前提:完全随机多组设计;计量资料(非分类);独立性;每个因素的各水平正态性;每个因素的各水平方差齐性。(3)过程:正态性检验和方差齐性检验建立假设:因素A:假设H0: 1=(! 2=- = In; H: 、仙2、N n不全相等或全不相等。因素B:假设H0: (11=(1 2=- = In; H:U、以2、n不全相等或全不相等。交互作用:假设H0:iii=ii2- = 11 n;H:ii i>仙2、口不全相等或全不相等。a计算统计量:P化P>a,接受H0 , P<a ,拒绝H0(4) SPSS吉果:si
33、g> a ,接受H),差异无统计学意义;sig< a,接受Hi,差异有统计学意义。 方差分析表变异来源离差 平方和自由度F值P值因素ASSR-1MSFa因素BSSS-1MSFbA BSS将(r-1)(s-1)MS将Fa xb误差SSrs(l-1)MS总和SSRsl-1F«(r-1,rs(l-1)Fa(s-1,rs(l-1)F-1)(s-1),rs(l-1)9 .线性相关分析(1)目的:分析两变量间是否有直线相关关系(2)前提:x、y必须都是随机变量(3)过程:计算样本相关系数r的大小r= lxy = -(x-X)(y-y)2=x xy-nxy df=n-2Ixxixy X
34、(x-x) X(y-y) (n-1)SxSy将r与界值表界值比较:当|r|>r “时,P<a ,拒绝H0 ,认为有直线相关关系。当|r|<r ,时,P>a ,接受H ,认为没有直线相关关系。根据r, df=n-2检验p是否为0假设总体相关系数p=0,即无关系;H:总体相关系数p *0,即有关系。a 结合专业知识评价相关分析是否有价值P 值:P>a ,接受代,P<a ,拒绝H0 , P<a ,拒绝代(4) SPSS吉果:sig> a ,接受H,无直线相关关系;sig< a ,接受Hi,有直线相关关系。10 .线性回归分析(1)目的:就是寻找出
35、具有相关关系变量之间的函数关系,并进行统计推断。(2)前提:y必须是随机变量(3)过程:计算反映两个变量依赖关系的直线回归方程,即计算方程的截距a,斜率bo? = a + bx 意义:x每增加1, y增加a+bxn_'、(xi -x)(yi -y)n_% (xi -x)2 i 1根据截距a,斜率b,检验样本所抽自的总体截距a是否为0,总体斜率B是否为0做法1:直接查相关系数的临界值表做法2:费舍尔t检验法:t =匚*=df=n-21-r2做法3: F检验假设H0:芹0,即无回3关系;H:0,即有回归关系。民F=S0 / df回SSM df剩df=n-1结合专业知识,评价此直线回归方程是
36、否有实用价值。F<F “ df ,则P>a ,接受H0,无回归关系F>R df ,则P<a ,拒绝H0 ,有回归关系(4) SPSS吉果:sig> a ,接受H0,无直线回归关系;sig< a,接受H,有直线回归关系11 .列联表X2检验(1)目的:推断两个或多个总体率或构成比之间的差异;分析行列两种属性或两个变量之间有无关联性(相关分析);频数分布的拟合优度检验。(2)前提:小样本,非二项分布(行列变量独立或无相关性)(行列变量不独立或有相关性),ax (c-1)(3)过程:建立假设:H0:总体率或构成比无显著性差异H1:总体率或构成比有显著性差异计算最小理论频数Tj ,并计算X2。一般公式:2 =N(Z - -1) df= (r-1) nrnc I c四格表公式:(最小理论频数:T)基本公式:n>40且T52八(A-T) /T2n(ad - bc)(a b)(c d)(a c)(b d)n 22n(|ad -bc| -)校正公式:n>40 且 1<T< 5X2 =£ (| A-T |-0.5) /T =2(a b)(c d)(a c)(b d)特殊公式:n<40 , T<1四格表确切概率法(Fi
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年冶金工业托轮链项目可行性研究报告
- 2025至2030年中国面包垫纸数据监测研究报告
- 2025至2030年中国锥柄钻头数据监测研究报告
- 2025至2030年聚氯乙烯绝缘和护套控制电缆项目投资价值分析报告
- 2025至2030年中国解热止痛散数据监测研究报告
- 2025至2030年中国胶柄电烙铁数据监测研究报告
- 2025至2030年中国硫酸锆数据监测研究报告
- 2025至2030年密码式门禁控制器项目投资价值分析报告
- 2025至2030年再生聚乙颗粒项目投资价值分析报告
- 2025至2030年中国压阻式压力传感器数据监测研究报告
- 2024-2025学年初中七年级上学期数学期末综合卷(人教版)含答案
- 体育活动策划与组织课件
- 公司违规违纪连带处罚制度模版(2篇)
- 2025届高考物理二轮总复习第一编专题2能量与动量第1讲动能定理机械能守恒定律功能关系的应用课件
- 内业资料承包合同个人与公司的承包合同
- 2024年计算机二级WPS考试题库(共380题含答案)
- 【履职清单】2024版安全生产责任体系重点岗位履职清单
- 跨学科实践活动10调查我国航天科技领域中新型材料新型能源的应用课件九年级化学人教版(2024)下册
- 2022年全国医学博士英语统一考试试题
- 学校工作总结和存在的不足及整改措施
- Petrel中文操作手册(1-3)
评论
0/150
提交评论