医学统计学重点_第1页
医学统计学重点_第2页
医学统计学重点_第3页
医学统计学重点_第4页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学重点第一章 绪论1. 基本概念:总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。样本:从总体中随机抽取部分个体的某个变量值的集合。总体参数: 刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。统计量: 刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。抽样误差: 由随机抽样造成的样本统计量与相应的总体参数之间的差异。频率:若事件 A 在 n 次独立重复试验中发生了 m次,则称 m为频数。称 m/n 为事件 A 在 n 次试验中出现的频率或相对频率。概率:频率所稳定的常数称为概率。统计描述: 选用合适统计指标 ( 样本统计量 ) 、统计图、统计表

2、对数据的数量特征及其分布规律进行刻画和描述。统计推断: 包括参数估计和假设检验。用样本统计指标 ( 统计量 ) 来推断总体相应指标 ( 参数 ) ,称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别, 称为假设检验。2. 样本特点: 足够的样本含量、可靠性、代表性。3. 资料类型:( 1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。( 2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)计数资料:是将观察单位按某种属性或类别分组,清点

3、各组观察单位的个数( 频数 ) ,由各分组标志及其频数构成。包括二分类资料和多分类资料。二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。多分类:将观察对象按多种互斥的属性分类等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单位的个数所得的资料。4. 统计工作基本步骤: 统计设计、资料收集、资料整理、统计分析。精品文库第二章实验研究的三要素1. 实验设计三要素: 被试因素、受试对象、实验效应2. 误差分类: 随机误差(抽样误差、随机测量误差)、系统误差、过失误差。3. 实验设计的三个基本原则: 对照原则、随机化分组原则、重复原则。4. 实验设计方法有析

4、因设计正交试验设计均匀试验设计交互作用两组 :异体配对设计同体配对设计交叉设计无随机同期对照实验设计(单因素两水平)扩展多组:单因素多水平配伍组设计拉丁方设计(两因素多水平)(三因素多水平)配伍组设计: 也称随机区组设计, 将条件相近的受试对象配伍, 每个配伍组中的对象随机分配到各处理组中。析因设计: 考察两个或两个以上的处理因素,将各个因素的水平进行全面组合, 每个组合下至少有两个以上的观察对象重复测量。一般来讲,应尽可能安排等重复试验,以简化计算,2-3个水平数。优点是全面性和均衡性较好,可同时分析处理因素的效应及因素间的交互作用。拉丁方设计: 用于三因素等水平无交互。第三章定量资料的统计

5、描述、参考值范围1. 频数表编制过程(了解)( 1)找出样本数据的最大值和最小值,计算极差R;( 2)分组:确定分组的组距 d 和组数 k ;一般 n<50,5-6 组; n 在 100 左右, 7-10 组; n>100,10-15 组( 3)求频率密度:统计频数,算出频率、频率密度和累积频率;( 4)画出直方图。2. 频数表和直方图的作用: 用于观察个数较多资料的统计描述, 可以直观提示资料的分布特征和分布类型。欢迎下载2精品文库3. 集中趋势、离散趋势的指标及适用范围( 1)集中趋势: x , G, M, Px,M0算术均数:适用于对称分布;不适用于偏态分布和资料中出现极值的

6、资料。几何均数:适用于呈倍数关系的资料或对数正态分布的资料,尤其是正偏态分布。不适用与观察值中有0 或正负数值同时出现的资料。中位数:适用于大样本偏态分布或分布情况不明的资料或资料中有不确定数值的资料。百分位数的作用:多个百分位数结合使用,全面描述数据分布的特征;用于确定医学参考值范围(偏态或分布不明的资料)。众数:适用于大样本,较粗糙。( 2)离散趋势:极差:优点:简单明了、容易使用。缺点:只反映最大值和最小值间的差异,不能反映其他观察值的变异程度。样本容量越大,极差可能越大。极差的抽样误差大,不稳定。四分位数间距: 适用于确定医学参考值范围, 与中位数一起描述偏态分布资料变异程度。缺点:类

7、似于极差,利用度低。方差与标准差:与均数一起描述对称分布, 特别是正态分布的分布特征。变异系数:适用于:适用于比较度量衡单位不同资料的变异度。比较均数相差悬殊的资料的变异度。衡量实验精密度和稳定性的常用指标。( 3)频数分布特征高峰在中间,左右大致对称,称为对称分布。平均数 =中位数 =众数高峰偏向小值的一侧(左侧),称正偏态分布(亦称右偏态)。平均数 >中位数 >众数高峰偏向大值的一侧(左侧),称负偏态分布(亦称左偏态)。平均数 <中位数 <众数对称分布正(右 ) 偏态分布负(左 ) 偏态分布欢迎下载3精品文库4. 正态分布图形的特点及意义( 1)特点: f (x)关

8、于 x=对称x= 时取得最大值在 x=± 处为拐点,且以x轴为水平渐近线 f (x) 大于 0P=0(x=a)若 f(x)在点 x处连续,则 F=f(x)( x)( 2)意义:f ( x) =1,f( x)在负无穷到正无穷的积分值为,即曲线下方面积为1。15. 和2 的意义:位置参数,当 固定时, 增大,曲线沿横轴向右移动; 减小,曲线沿横轴向左移动。 2:形状参数,当 固定时, 越大,曲线越矮胖; 越小,曲线越高瘦。6. 标准化变换z=x x N( ,2 ) z N(0,1)F (x) = ( x) = (z)即 P(X x) =( x) =P(Z z)P=F-Fb - a a x

9、 - b a b (a<x<b)(b)(a)=()()(<<)= (<Z<)7. 标准正态分布界值规定:界值右侧曲线下方面积等于它的下角标。下角标一致,x 轴上方中间面积一致。双侧界值:PP(|z| z ) =1- P(z<z ) =1-222(|z| z ) =P(z>z ) = 222单侧界值:上限:下限:P (z>z ) =P(z>z 1- ) =1- P (z<z ) =1- P(z<z 1- ) =欢迎下载4精品文库8. 正常值范围及意义概念:医学临床中,常将就诊者的某些生理、生化、免疫学指标的测定结果,与排除了

10、对研究指标有影响的疾病和有关因素的大多数“正常人” 的相应数值进行比较, 以就诊者的测定值是否超出了大多数 “正常人” 相应指标的波动范围, 作为临床诊断的重要参考,又称医学参考值范围。意义: 95%的参考值范围含义是指:样本中有95%的个体测定值在所求范围之内。以 95%的置信区间来说,意义是:该区间以 95%的概率包含了待估计的参数,这种估计的可信度是 95%,会冒 5%的风险。公式: 双侧 95%的界限值: x ±1.96s单侧 95%的上限值: x +1.645s单侧 95%的上限值: x -1.645s第四章 总体均数的估计、假设检验1. 标准误(1)概念:每次样本计算出的

11、x 不同,这些 x 的标准差称为均数的标准误。(2)意义:是衡量样本统计量抽样误差大小的统计指标。(3)与标准差的区别:二者都是描述变异程度的指标,标准差描述个体值的变异,标准误描述统计量的变异。(4)均数标准误的公式: Sx = sn2. 置信区间(1)定义:设为总体的未知参数, 若由样本确定的两个统计量 (1 x1、x2、xn) 和 2(x 1、x、x) ,且 <,对于预先给定的值 (0< <1),若满足 P(<)=1- ,212n12则称随机区间()为 的 1- 置信区间,其中称为置信下限,称为1,212置信上限, 1- 称置信度。欢迎下载5精品文库(2)意义:区

12、间(,12)包含有参数 的概率为 1- ,不能说 在(1,2)的概率为1-。例:可以说( a,b)包含均数 的概率为 95%,不能说 在( a, b)的概率为 95%。(3)公式:单个正态总体均数 的区间估计已知:双侧: x z即 x z x2n2z分布单侧: xz即 x zxn未知:双侧: xts即 xtsxn22小样本( n 50) t分布单侧: xts即 xtsxn双侧: xzs即 xz sxn22大样本( n>50) z 分布单侧: xzs即 xz sxn(4)两要素:准确度:由 1- 决定, 1- 越大,准确度越高。精确度:由区间长度决定。99%置信区间准确度高于 95%置信区

13、间。 95%置信区间精确度更高。3. 抽样分布(1)t 分布定义: 来自正态总体的一组样本,x 和 s 分别是样本的均数和标准差。则 t= xs/nt分布,自由度 df=n-1 ,极限分布是标准正态分布。图形分布特征:以 0 为中心,左右对称的单峰分布。自由度越大,越高瘦欢迎下载6界值:双侧:P(|t| t ) =1- P(t<t) =1-精品文库2P (|t| t ) =P2单侧:2 2(t>t) = 2 2上限:下限:P(t<t ) =1- P(t<t 1- ) =P(t>t ) =P(t>t 1- ) =1- (2) 2 分布定义:若从均数为 ,标准差

14、 的正态总体中,每次抽取样本含量为 n 的样本,计算样本标准差 s,则 2 =( n-1 )s2/ 2 服从自由度 df=n-1 的2 分布。图形分布特征:曲线偏向左边自由度越小曲线越偏界值:双侧:P22P2>x21( x >x ) =2( x2)=1-2x22P22P2<1( x <x ) =1-( x2 ) =222单侧:上限:下限:P22(22) =1-(x>x )Px>x=1- P22=1- P( x22) =(x<x )<x1- (3)F 分布定义:如果分别从两个正态总体N( 1, 1)和 N(1,1 )中随机抽取样本含量22n122和

15、2,则 Fs1 /1、n 的两个样本,算出样本均数和方差分别为x1,x2,22s1s2s2/2服从 df 1 =n1-1 , df 2=n2-1 的 F 分布。2/ df 12分布,则 F=1df 1df 2若 1、2 分别服从自由度 df 1、df 2 的 22 / df 2欢迎下载7精品文库图形分布特征曲线偏向左边df1、df 2 同时增大,曲线趋向于对称倒数性质: F (1 ),(df 1,df 2 ) =1F ( df 1,df 2)界值:双侧:P (F>F ) = P(F> F) =1- 22221P(F< F ) =1- P(F< F) = 22221单侧:

16、上限:下限:P(F>F ) =P(F>F1- ) =1- P(F<F )=1- P(F<F) =1-4. 假设检验(1)基本思想:反证法、小概率事件原理(2)基本步骤:建立假设,确定检验水准H0:原假设,差异存在但不显著或差异无统计学意义H1:备择假设,差异显著或差异有统计学意义在原假设成立条件下,选择统计方法并计算检验统计量。(认为误差由抽样产生)参数检验统计量要求满足:i) 在 H0 成立的条件下,服从特定的抽样分布;ii) 必须包含要检验的总体参数;iii) 对于给定的样本数据,能计算出该检验统计量的数值。对于给定的 值做出检验结论,并给以专业解释判断 P 值:(

17、与界值比较,反查界值表确定范围,软件计算)若 P>,则接受 H 0,拒绝 H1 ; 若 P<,则拒绝 H0 ,接受 H1 。欢迎下载8精品文库(3)检验方法:正态性检验、方差齐性检验、t 检验(4)两类错误实际情况判断接受 H0拒绝 H0H0 正确正确 1- 第一类错误H0 不正确第二类错误正确 1- 第一类错误又称弃真错误、假阳性错误,第二类错误又称取伪错误、假阴性错误。P 时,拒绝 H0,可能犯类错误( )。此时, P 值越小,犯类错误的概率越小,结论越可靠。P>时,接受 H0,可能犯类错误( )。此时,虽然 未知,但 P 值越大,犯类错误的概率越小,结论越可靠。减少(增

18、加) I 型错误,将会增加(减少)II型错误增大 n,可以同时降低两类错误。第五章方差分析1. 方差分析基本思想目的:根据各个总体的样本观测值, 检验各个总体均值间和两两总体均值间是否存在显著性差异。基本思想:根据离差来源的不同,将总离差平方和分解为两部分:由试验的随机因素(误差)引起的组内离差,由因素的作用(即处理水平不同)引起的组间离差。总离差平方和 = 组内离差平方和 + 组间离差平方和( SST = SSE + SS A)2. 方差分析单因素方差分析、配伍组设计方差分析、析因设计方差分析拉丁方设计方差分析、正交设计方差分析交叉设计方差分析、组内分组设计方差分析欢迎下载9精品文库第六章双

19、变量相关与回归1. 散点图特征正相关完全正相关负相关完全负相关不相关2. 相关系数意义及分类(1)意义:相关系数 r 的大小反映随机变量X 和 Y 之间线性关系的密切程度:若 r=0 ,则 X 与 Y 不相关;若 |r|=1 ,则 X 与 Y 完全相关。相关系数 r 的符号反映随机变量X 和 Y 之间线性关系的相关方向:若 0<r<1 ,则 X 与 Y 正相关;若 -1<r<0 ,则 X 与 Y 负相关。(2)分类:积差相关系数:双变量为服从正态分布的计量资料等级相关系数:等级或相对数资料;不服从正态分布;总体分布类型未知。(3)适用范围:两个变量必须是随机变量,即变量

20、的取值在实验前或测定前是无法预先知道的。欢迎下载10精品文库3. 线性相关分析和回归分析的联系与区别(1)联系:r= bl xx / l xyl xx 、 l xy 分别是 x、y 的标准差方向一致, r 与 b 方向一致r 与 b 的假设检验等价,即同一样本存在:t r =t b22回归强度与相关强度:R=SS回 /SS 总 =r(仅限型回归)(2)区别:资料相关: x,y 必须是随机变量回归:x是确定变量称型回归,y必须是随机变量x是随机变量称型回归计量单位: r 不受单位影响, b 受单位影响意义:相关说明相关关系,相关关系描述变量间关系的密切程度与方向。回归说明依存关系,回归方程描述变

21、量间的数量依存关系。取值范围: |r| 1, bR4. 最小二乘法把观测点(x i , y i )标在直角坐标系下作成散点图,则必存在着一条直线,使每个点 (x i , y i ) 距这条直线在纵方向上的距离的平方和为最小,此平方和称为残差平方和,这就是最小二乘法。5. 决定系数的意义R 2=SS回 /SS 总 =( SS总 -SS 剩 )/SS 总 =(1-SS 剩 )/SS 总0 R2 1,R2 越接近于 1,表示回归平方和在总平方和中所占的比重越大,回归效果越好。欢迎下载11精品文库第七章两分类资料的统计描述与推断1. 相对数指标两个有联系的指标之比。常用的有率和比( 构成比、相对比 )

22、 。(1)率:频率,说明某现象发生的频率和强度。总体率: ,样本率: p 。某现象实际发生的例数率K可能发生该现象的总例数(2)构成比说明某事物内部各组成部分在总体中所占的比重或分布。某一组成部分的观察单位数构成比100%同一事物各组成部分观察单位总数(3)相对比:两个有关指标A、B 之比,说明两者的对比水平,A是 B 的若干倍或百分之几。对比的数值可以是绝对数、相对数或平均数。第八章R× C表资料的分析1. 列联表分类及统计方法(1)双向无序:多个样本率或构成比比较2 检验(2)单向有序:分组变量有序 2 检验 ( 同双向无序 )结果变量有序秩和检验或Ridit分析(3)双向有序:

23、属性相同 McNemar、 Kappa检验属性不同秩相关分析、线性趋势检验、秩和检验或Ridit分析2. 列联表注意事项(1)R×C表中不宜有 20%以上的格子的 T<5,不能有 T<1。理论数太小处理办法:最好增加样本例数以增大理论数删去理论数太小的行和列将太小理论数所在行或列的实际数与性质相近的邻行/ 列合并采用 Fisher 检验欢迎下载12精品文库(2)R×C表 2 检验未考虑等级顺序关系, 若处理效应按强弱或优劣分为有序等级时采用秩和检验或 Ridit分析。(3)拒绝 H0 时不能确定是不全相等还是全不相等,需进行两两比较。第九章非参数检验、 Ridi

24、t分析1. 参数检验和非参数检验特点(1)参数检验:特点:总体分布的类型为已知,只是一个或几个参数未知,对未知参数进行检验。优点:检验效能高,允许应用样本提供的数据缺点:受应用条件限制(2)非参数检验:特点:又称任意分布检验,是与总体无关的检验方法,它不比较参数,而是比较分布的位置,允许根据分布情况而不是总体参数做出推论。优点:不依赖总体分布类型,应用广泛缺点:符合参数检验的用非参数检验会降低检验效能。2. 检验方法符号秩和检验、成组秩和检验、多组秩和检验、配伍秩和检验。欢迎下载13精品文库检验方法1. 正态性检验(1)目的:在做 t 检验方差分析之前首先判断是否服从正态分布(2)过程:假设

25、H0:总体服从正态分布; H1:总体不服从正态分布。(3)SPSS结果:看 sig 值, sig> , 接受 H0,服从正态; sig< , 接受 H1,不服从正态。2. 方差齐性检验(1)目的:利用样本信息推断总体方差是否相等(2)前提:正态分布(3)过程:建立假设:假设 H0:2=2即方差齐; H1:22。 1212222计算统计量: Fs1 /1s1df 1=n1-1 df2=n2-122 =2s2 /2s2P 值: F<F (df1,df 2 )则 P>,接受 H0F>F (df,df)则 P<,拒绝 H120(4)SPSS结果: sig> ,

26、 接受 H0,满足方差齐性; sig< , 接受 H1,不满足方差齐性。3. 单样本 t 检验(1)目的:推断一组样本代表的总体均数与已知总体均数间的差异。(2)前提:单组设计计量资料(非分类)资料服从正态分布(3)过程:建立假设:假设H0: =0 ;H1:0 。计算统计量: zx或 t=x/ ns/ nP 值: z<z df 1, 则 P>,接受 H0z>zdf , 则 P<,拒绝 H10(4)SPSS结果: sig> , 接受 H0 ,差异无统计学意义; sig< , 接受 H1,差异有统计学意义。欢迎下载14精品文库4. 配对 t 检验(1)目的

27、:推断两组样本代表的总体均数的差值是否为零。(2)前提:配对设计计量资料(非分类)差值服从正态分布(3)过程:建立假设:假设H0: d=0 ;H1: d 0。 ddf=n-1计算统计量: t=sd /nP 值: t<t df 1,则 P> ,接受 H0 ,t>t df 1 ,则 P<,拒绝 H0t< t 2df 1 ,则 P>,接受 H0 ,t> t 2df 1,则 P< ,拒绝 H0(4)SPSS结果: sig> , 接受 H0 ,差异无统计学意义; sig< , 接受 H1,差异有统计学意义。5. 成组 t 检验(1)目的:推断两

28、组样本代表的总体均数是否有显著性差异。(2)前提:完全随机成组设计;计量资料(非分类);独立性;正态性;方差齐性。(3)过程 :方差齐性检验建立假设:假设H0: 1=2 ;H1: 1 2(或 1>2, 1 < 2)。 计算统计量: t 或 t (方差不齐) df=n 1+n2 -2P 值: t<t (df 1,df 2 ),则 P> ,接受 H0 , t>t (df 1, df 2),则 P<,拒绝 H0 t< t 2 (df 1,df 2),则 P>,接受 H0 ,t> t 2 (df 1,df 2),则 P<,拒绝 H0(4)SP

29、SS结果: sig> , 接受 H0 ,差异无统计学意义; sig< , 接受 H1,差异有统计学意义。欢迎下载15精品文库6. 单因素方差分析(1)目的:推断多组样本代表的总体均数是否有显著性差异。(2)前提:完全随机多组设计;计量资料(非分类);独立性;正态性;方差齐性。(3)过程 :正态性检验和方差齐性检验建立假设:假设 H0: 1=2 = = n;H1: 1、 2、 n 不全相等或全不相等。 计算统计量:P 值: P>,接受 H0 ,P< ,拒绝 H0(4)SPSS结果: sig> , 接受 H0 ,差异无统计学意义; sig< , 接受 H1,差异

30、有统计学意义。方差分析表:变异离差平自由度均方F 值P 值来源方和组间SSK-1MS=SS/(k-1)F>FAAA(k-1,N-k),F=MS/MSAE组内SSEN-kMSE=SSE/(N-k)P< 总和SSTN-1( 5)注意:组内变异:随机误差组间变异:随机误差 +处理因素若 H0 成立:组内变异组间变异若 H1 成立:组内变异 < 组间变异7. 配伍设计的方差分析(1)目的:推断多组样本代表的总体均数是否有显著性差异。欢迎下载16精品文库(2)前提:完全随机多组设计;计量资料(非分类);独立性;每个因素的各水平正态性;每个因素的各水平方差齐性。(3)模型设计:双因素且无

31、交互作用:处理因素重要实验因素配伍因素主要非处理因素SS 总 =SS处理 +SS配伍 +SS误差(3)过程 :正态性检验和方差齐性检验建立假设:处理组:假设 H0: 1=2=n;H1: 1、2 、 n 不全相等或全不相等。配伍组:假设 H0: 1=2=n;H1: 1、2 、 n 不全相等或全不相等。 计算统计量:P 值: P>,接受 H0 ,P< ,拒绝 H0(4)SPSS结果: sig> , 接受 H0 ,差异无统计学意义; sig< , 接受 H1,差异有统计学意义。方差分析表变异来离差自由度均方F 值P 值源平方和处理因SSK-1MS=SS/(k-1)FA=素 A

32、AAAMS/MSAE配伍因SSB-1MS=SS/(b-1)FB=素 BBBBMSB/MSE误差SSE(k-1)(b-1)MSE=SSE/(k-1)(b-1)总和SSTKb-1F(k-1,(k-1)(b-1)F(b-1,(k-1)(b-1)欢迎下载17精品文库8. 析因设计的方差分析(1)目的:推断多组样本代表的总体均数是否有显著性差异。(2)前提:完全随机多组设计;计量资料(非分类);独立性;每个因素的各水平正态性;每个因素的各水平方差齐性。(3)过程 :正态性检验和方差齐性检验建立假设:因素 A:假设 H0:1 = 2=n; H1:1 、2、 n 不全相等或全不相等。因素 B:假设 H0:1

33、 = 2=n; H1:1 、2、 n 不全相等或全不相等。交互作用:假设 H0: 1=2 = = n;H1: 1、 2、 n 不全相等或全不相等。 计算统计量:P 值: P>,接受 H0 ,P< ,拒绝 H0(4)SPSS结果: sig> , 接受 H0 ,差异无统计学意义; sig< , 接受 H1,差异有统计学意义。方差分析表变异来源离差自由度均方F 值P 值平方和因素 ASSAR-1MSAFA因素 BSSBS-1MSBFBA BSSA×B(r-1)(s-1)MSA×BFA×B误差SSErs(l-1)MSE总和Rsl-1F(r-1,rs

34、(l-1)TSSF (s-1,rs(l-1)F(r-1)(s-1),rs(l-1)欢迎下载18精品文库9. 线性相关分析(1)目的:分析两变量间是否有直线相关关系(2)前提: x、y 必须都是随机变量(3)过程 :计算样本相关系数r 的大小r=l xy=( xx)( yy)=xy n xydf=n-2l xx l xy(x x)2( yy)2( n 1) sx sy将 r 与界值表界值比较:当|r|>r 时, P<,拒绝 H0 ,认为有直线相关关系。当|r|<r 时, P>,接受 H0 ,认为没有直线相关关系。根据 r ,df=n-2 检验 是否为 0假设 H0:总体相

35、关系数 =0,即无关系; H1:总体相关系数 0,即有关系。 结合专业知识评价相关分析是否有价值P 值: P>,接受 H0 ,P< ,拒绝 H0 , P<,拒绝 H0(4)SPSS结果: sig> , 接受 H0,无直线相关关系; sig< , 接受 H1,有直线相关关系。10. 线性回归分析(1)目的:就是寻找出具有相关关系变量之间的函数关系,并进行统计推断。(2)前提: y 必须是随机变量(3)过程 :计算反映两个变量依赖关系的直线回归方程,即计算方程的截距a,斜率 b。?bx意义: x 每增加 1,y 增加 a+bxy an?( xix)( yi y)i 1

36、a? y bxbn(xi x) 2i 1根据截距 a,斜率 b,检验样本所抽自的总体截距是否为 0,总体斜率 是否为 0。做法 1:直接查相关系数的临界值表r n2做法 2:费舍尔 t 检验法: tdf=n-21r 2欢迎下载19精品文库做法 3:F 检验假设 H0 :=0,即无回归关系; H1: 0,即有回归关系。 SS回 / df回F=df=n-1SS剩 / df剩结合专业知识,评价此直线回归方程是否有实用价值。F<F df,则,接受0,无回归关系P>HF>Fdf,则,拒绝0,有回归关系P<H(4)SPSS结果: sig> , 接受 H0,无直线回归关系; s

37、ig< , 接受 H1,有直线回归关系。11. 列联表 2检验(1) 目的:推断两个或多个总体率或构成比之间的差异;分析行列两种属性或两个变量之间有无关联性 ( 相关分析 ) ;频数分布的拟合优度检验。(2)前提:小样本,非二项分布(3)过程 :建立假设: H0:总体率或构成比无显著性差异( 行列变量独立或无相关性 )H1:总体率或构成比有显著性差异( 行列变量不独立或有相关性 ) ,计算最小理论频数 Tij ,并计算 2。一般公式:2N (A2×( c-1)1) df= (r-1)nr nc四格表公式:(最小理论频数: T)基本公式: n40 且 T5校正公式:n40 且 1 T 522( A2n(ad bc) 2T )/ Tc)(bd )(a b)(c d )( an(| adbc |n)222(| AT |0.5) / T( a b)(cd )(ac)(b d )特殊公式: n<40 , T<1四格表确切概率法(Fisher )2<222。01P 值:若 df 则 P> ,接受

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论