版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计分析数值变量分类变量变量类型 分类变量的统计分析1分类变量的统计描述2常用相对数应用相对数的注意事项率的标准化法绝对数与相对数的概念绝对数(absolute number): 分类变量资料整理后所得到的原始数据,通常不具有可比性。相对数(relative number): 指两个有联系的指标之比,是分类变量统计描述指标的统称。3相 对 数率构成比相对比第一节 常用相对数4概 念计 算又称频率指标,说明某现象发生的频率或强度。一、率(rate) 56比例基数K的取法: 可取百分率(%) 、千分率() 、万分率(1/万) 、十万分率(1/10万) 等,主要根据习惯用法和使结果保留一、二位整数。
2、医学上常用的率: 发病率、患病率、死亡率、病死率、治愈率、 生存率等。 某年某市三个区的肠道传染病发病率 7市区 人口数 发病人数 发病率() 甲 98740 503 5.09 乙 75135 264 3.51 丙 118730 466 3.92合计 292605 1233 4.21概 念计 算又称构成指标,表示事物内部某组成部分占其全部的比重或分布,常以百分率(%)作为比例基数。二、构成比(proportion) 8病情严重程度 住院人数 病死数 死亡构成(%) 病死率(%) 轻 300 12 26.7 4.0 中 350 18 40.0 5.1 重 150 15 33.3 10.0 合计
3、800 45 100.0 5.692000年某医院某病的住院人数和死亡人数白细胞分类 分类计数 构成比(%) 中性粒细胞 140 70.0 淋巴细胞 50 25.0 单核细胞 5 2.5嗜酸粒细胞 4 2.0嗜碱粒细胞 1 0.5 合计 200 100.010某正常人的白细胞分类计数构成比构成比的特点11各组成部分的构成比之和为100%。事物内部某一部分构成比发生变化,其它部分的构成比也相应地发生变化。特点概 念计 算又称对比指标,指两个相关指标数值大小的比值,说明两者的对比水平,常以倍数或百分率(%)表示。三、相对比(relative ratio) 12例1 2000 年我国第五次人口普查结
4、果,男性 65355万人,女性 61228 万人,试计算人口男女性别比。6535561228性别比 = = 1.067例1 我国2010年第六次人口普查总人数中,男性为686852572人,女性为652872280人,试计算人口男女性别比例。结果说明,我国男性人数为女性人数的1.052倍,或者表达成男:女为 105.20:100。(2000年第五次普查结果为 106.74:100) 686852572652872280男女性别比例 = 1.052015例2 某市乙型脑炎的发病率1990年为 4.48/10万,2000年为0.88/10万,则这两年相对比为:16例3 某医院2005年医护人员为8
5、75人,同年平均开病床1436张,则该医院2005年病床数与医护人员的相对比为:17 2005年某研究组对武汉市江汉区中学生的吸烟情况、吸烟原因进行了调查。共调查1722人,男生839人中172人吸烟;女生883人中17人吸烟,抽烟的主要原因见表。试计算: (1)男女生吸烟率。 (2)男女生吸烟率之比。 (3)计算各种吸烟原因所占的百分构成比,并找出前三位的吸烟原因。常用相对数求法举例性别 人数 吸烟人数 吸烟率(%) 男 839 172 20.50 女 883 17 1.93合计 1722 189 10.98182005年某地区中学男、女生吸烟率比较男、女生吸烟率相对比=20.50/1.93
6、=10.62吸烟原因 人数 构成比(%) 位次解除烦恼 64 33.86 1显示气派 45 23.81 2 帮助社交 43 22.75 3帮助思考 16 8.47 4 显示富有 12 6.35 5 其 它 9 4.76 6 合 计 189 100.0 19189名吸烟者的吸烟原因构成比第二节 应用相对数的注意事项1.计算相对数时,分母不宜过小2.正确区分构成比和率3.比较相对数时,应注意资料的可比性:率的标准化4.分母不同的率不能简单相加求平均率5.样本率或构成比的比较应进行假设检验WARNING20 为了消除相比较组间因内部构成不同对所比较指标的影响,采用统一的标准构成对总率进行调整,使算得
7、的标准化率具有可比性,得出科学的结论。21率的标准化的概念与基本思想:第三节 率的标准化法 住院人数 治愈人数 治愈率(%) 甲医院 乙医院 甲医院 乙医院 甲医院 乙医院 内科 1500 500 975 315 65.0 63.0 外科 500 1500 470 1365 94.0 91.0 传染病科 500 500 475 460 95.0 92.0 合计 2500 2500 1920 2140 76.8 85.6 22 科别甲、乙两医院的治愈率标准化率的计算1.选定标准 选择有代表性、较稳定、数量较大的人群,如全国、全省的历年累计数据;也可将比较组的人口合并;任选其中一组作为标准。2.计
8、算标化率 直接法 间接法3.比较得出结论 2324直接法 已知各科的真实治愈率。 原治愈率 Pi (%) 预期治愈人数 Ni Pi 甲医院 乙医院 甲医院 乙医院 内科 2000 65.0 63.0 1300 1260 外科 2000 94.0 91.0 1880 1820传染病科 1000 95.0 92.0 950 920 合计 5000 76.8 85.6 4130 4000 25科别标准人口Ni甲、乙两医院的标准化治愈率(直接法)甲医院标准化后的治愈率:乙医院标准化后的治愈率:264130500040005000= 80%= 82.6%100%100% 原治愈率 Pi (%) 预期治愈
9、率 Ni/NPi (%) 甲医院 乙医院 甲医院 乙医院 内科 0.4 65.0 63.0 26.0 25.2 外科 0.4 94.0 91.0 37.6 36.4传染病科 0.2 95.0 92.0 19.0 18.4 合计 1.0 76.8 85.6 82.6 80.0 27科别标准人口构成比Ni / N甲、乙两医院的标准化治愈率(直接法) 住院人数 治愈人数 治愈率(%) 甲医院 乙医院 甲医院 乙医院 甲医院 乙医院 内科 1500 500 975 315 65.0 63.0 外科 500 1500 470 1365 94.0 91.0 传染病科 500 500 475 460 95.
10、0 92.0 合计 2500 2500 1920 2140 76.8 85.6 28 科别甲、乙两医院的治愈率 间接法 未知:各科真实治愈率 已知:医院总治愈人数和各科住院人数 各科标准治愈率和总的标准治愈率(文献获得) 住院人数 Ni 预期治愈人数 Ni Pi 甲医院 乙医院 甲医院 乙医院 内科 61.0 1500 500 915 305 外科 92.0 500 1500 460 1380传染病科 94.0 500 500 470 470 合计 87.5 2500 2500 1845 2155 29科别标准 治愈率Pi (%)甲、乙两医院的标准化治愈率(间接法)P甲P乙87.5%1920/
11、1845= 87.5%1.04 = 91%87.5%2140/2155= 87.5%0.99 = 86.6%30 当Pi代表死亡率时,r/(niPi)是被标化组的实际死亡人数与预期死亡人数的比值,称为标准化死亡比(standard mortality ratio , SMR) 。 31当各比较组内部构成不同,而且对总率有影响时,应对率进行标准化,然后再比较。选用的标准不同,计算出的标准化率也不同。标准化率只反映各被标化组的相对水平,不代表其实际水平。各年龄组的率出现明显交叉时,不宜用标准化法。若是抽样研究,样本标化率的比较应作假设检验。率的标准化应注意的问题WARNING统计分析统计描述统计推
12、断统计分析32用样本信息来推断总体的特征,称为统计推断。参数估计parameter estimate假设检验hypothesis test统计推断statistical inference一、率的抽样误差 由抽样造成的样本率与总体率之间的差异以及在同一总体中抽取的各样本率间的差别。 反映率抽样误差大小的指标是率的标准误。第四节率的抽样误差和总体率的估计率的标准误的计算:理论值:估计值:35 例 欲了解某种新药对慢性乙型肝炎的疗效,对100名患者进行治疗,其中90人有效,试计算其标准误。 本例n=100 p = 90100 = 0.9,标准误为:360.03二、总体率的可信区间估计37 根据已知
13、条件,总体率可信区间的估计有2种方法:正态近似法查表法38二项分布从某个二项分类总体中随机抽取含量一定的样本,发生阳性结果的次数x的概率分布服从二项分布(binomial distribution),即样本中阳性数概率等于二项式展开后各项。若总体阳性率为、样本含量为n,阳性数为X,则样本中出现X个阳性事件的概率可由下式求得。 39已知:=0.3,n =5;=0.3,n =10;=0.3,n=15;=0.5,n=10。根据上述公式求各阳性数事件的概率并作概率分布图。 率的抽样分布图 40P(X)XXXa. n=5b. n=10c. n=30=30%的二项分布示意图P(X)P(X)41率的抽样分布
14、特征1. 为离散型分布;2. 当=0.5 时,呈对称分布;3. 当 n 增大时,只要不太接近0或1,二项分布 逐渐逼近正态分布。 一般认为,当n和n(1-)5时, 可近似看作 正态分布。 42 1. 正态近似法 当n足够大(n50),且np和n(1p) 5总体率95%可信区间:总体率99%可信区间:总体率可信区间估计的方法 上例中某地治疗100名患者,90人有效,得出 有效率90%,试估计该新药有效率95%置信区间。 n=100,p = 0.9,np=90 5,n (1-p) =10 5 前已算得 ,则其95%CI为:43 = 0.9 1.960.03 =(0.8412,0.9588) 即该新
15、药有效率95%置信区间为84.12%95.88%。0.032.查表法 如果n、p不满足上述条件(n50),可根据二项分布的原理估计总体率的置信区间。 即根据样本含量n和阳性数X查表得到总体率的置信区间。当xn/2时,直接查表可得;当xn/2时,应以n-x查表,然后用100减去查得的数字,即为所求的区间。44 例 某社区抽取40岁以上居民30人测量血压,查出高血压10名,试估计该社区40岁以上居民高血压患病率的95%置信区间。 n=30,阳性患者数 x=10。查百分率的置信区间表(P331)得:45即该社区40岁以上居民高血压患病率的95%CI为17%53%1753上例若 n=30,阳性患者数
16、x=20,求总体率95%CI。 第一步:n-x=30-20=10 查表(n=30, x=10)得:17%53% 第二步:100%17%83% 100%53%47%得总体率95%可信区间为 47%83%一、样本率与总体率的比较 目的是推断样本所代表的未知总体率与已知的总体率0是否相同。 已知的总体率0一般为理论值、标准值或经过大量调查所获得的稳定值。 应用条件:n足够大(n50),np和n(1p) 5第五节 率的 u 检验47例 某地区一般人群乙肝的阳性率约为15%,今对该地区150名流浪者进行检查,其中阳性30人,问当地流浪者乙肝的阳性率是否高于一般人群?48本例: n=150,p=30/15
17、0=20%,np和n(1-p) 5, 满足u检验条件, 0= 15% 491. 建立假设,确定检验水准 H0:=0 H1:0 =0.05 2. 选定检验方法,计算统计量 1.715503. 确定P值,作出推断结论查t界值最后一行,单侧u0.05=1.645,双侧u0.05=1.96本例 u=1.715单侧u0.05,所以P0.05。按=0.05水准,拒绝H0,接受H1,差异有统计学意义,可认为当地流浪者乙肝阳性率高于一般人群。 二、两个大样本率的比较 应用条件: n1足够大(n50) ,n1p1和n1(1p1)5 n2足够大(n50) ,n2p2和n2(1p2)551 例 欲了解从事工农业生产
18、的50岁以上人群患高血压的情况。调查了首钢工人1281人,高血压患者386人,患病率为30.13%;石景山区农民387人,高血压患者65人,患病率为16.80%,试问这两类人群高血压患病率有无差别?5253本例: n1=1281,X1=386;n2=387,X2=65,满足u检验条件。P1=0.3013, P2=0.1680 1. 建立假设,确定检验水准 H0: 1=2 H1: 12 =0.05 2. 选定检验方法,计算统计量 54386+651281+387= 0.27040.30130.168= 5.17553. 确定P值,作出推断结论双侧u0.05=1.96 ,u0.01=2.58,本例
19、 u=5.172.58,所以P0.01。按= 0.05水准,拒绝H0,接受H1,差异有统计学意义,可认为这两类人群高血压患病率有差别。第六节 2检验(Chi-square test) 是现代统计学的创始人之一,英国统计学家K.Pearson于1900年提出的一种具有广泛用途的假设检验方法。常用于计数资料的统计推断。 检验(Chi-square test )主要用于计数资料的统计分析,研究的变量是分类变量,而观察值以频数表示。该方法可用于推断两个及多个总体率(或构成比)之间有无差别、分类资料的关联度分析等。 例 某医生欲比较A、B两种药物治疗老年抑郁症的效果,将病情相近的60名患者随机分为两组,
20、分别用两种药物治疗,结果见下表:58A、B两种药物的疗效比较 分组 有效 无效 合计 有效率(%) A药 19 11 30 63.33 B药 15 15 30 50.00 合计 34 26 60 56.67 一、2检验的基本思想 阳性数 阴性数 合 计 阳性率(%) A组 a b a+b a/(a+b) B组 c d c+d c/(c+d)合计 a+c b+d n (a+c)/n 59四格表2检验的基本结构60A、B两种药物的疗效比较 分组 有效 无效 合计 有效率(%) A药 19(a) 11(b) 30(a+b) 63.33 B药 15(c) 15(d) 30(c+d) 50.00 合计
21、34(a+c) 26(b+d) 60(n) 56.67理论频数计算公式为:R行(row)C列(column)62假设H0 :1=2=56.67%=(a+c)/n成立,则四个格子的理论数用 T 表示:T11 = 3034/60 = 17 T12 = 3026/60 = 13T21 = 3034/60 = 17 T22 = 3026/60 = 13A、B两种药物的疗效比较 分组 有效 无效 合计 有效率(%) A药 19(a) 11(b) 30(a+b) 63.33 B药 15(c) 15(d) 30(c+d) 50.00 合计 34(a+c) 26(b+d) 60(n) 56.6763如果无效假
22、设成立,四个格子的实际数A与T应比较接近;如果假设不成立,则A与T相差较大。卡方检验就是看A与T之间吻合的程度。统计学家Pearson提出,在无效假设H0成立时统计量 2值的分布规律,称为2分布。64A、B两种药物的疗效比较 分组 有效 无效 合计 有效率(%) A药 19(17) 11(13) 30(a+b) 63.33 B药 15(17) 15(13) 30(c+d) 50.00 合计 34(a+c) 26(b+d) 60(n) 56.67 (1917)2 17=+ (1113)2 13 (1517)2 17 (1513)2 13+= 1.09 不同自由度的 分布曲线图 值的大小除了取决于
23、A-T的差值外,还与格子数有关,因为每个格子的(A-T)2/T都是正值,所以会随着格子数的增加而变大。严格地说,分布与自由度有关。 2检验的自由度 指可以自由取值的基本格子数 自由度一定时,其2值的概率分布也就确定。根据自由度 和检验水准查2界值表,可得2界值,若2值20.05(),则P0.05,可按=0.05检验水准拒绝H0;若2值20.05(),则P0.05, 不能拒绝H0。67(p336)68 二、四格表的2检验 四格表专用公式:四格表2 公式的使用原则: 当n40,所有T 5时,用普通 2 检验 当n40,任一格子1 T5时,用校正 2 检验 当n40或任一格子T 1时,用Fisher
24、确切概率法 69校正公式:70 2检验步骤:1. 建立假设,确定检验水准 H0: 1 2,两种药物有效率相同 H1: 1 2,两种药物有效率不同 = 0.05 2. 计算统计量2值71T11 = 3034/60 = 17 T12 = 3026/60 = 13T21 = 3034/60 = 17 T22 = 3026/60 = 13n = 60,且所有的T5故用普通 2 检验,不用校正72= (19151115)260 30303426= 1.09A、B两种药物的疗效比较 分组 有效 无效 合计 有效率(%) A药 19(a) 11(b) 30(a+b) 63.33 B药 15(c) 15(d)
25、 30(c+d) 50.00 合计 34(a+c) 26(b+d) 60(n) 56.67=733. 确定P值,作出结论 =(21) (21)=1,按=1查 2界值表, 20.05(1)=3.84, 本例2 =1.093.84,所以P0.05。 按=0.05水准,不拒绝H0,差异无统计学意义, 不能认为两种药物的有效率不同。74 2f(2) =1自由度 =1的2分布值示意图3.84 =0.051.0975 方法 有损伤 无损伤 合计 损伤率(%) 手术 22 6 28 78.57 放疗 7 8 15 46.67 合计 29 14 43 67.44例 两种方法治疗脑胶质瘤患者后脑功能损伤率比较7
26、6 2检验步骤:1. 建立假设,确定检验水准 H0: 1 2,两种方法脑功能损伤率相同 H1: 1 2,两种方法脑功能损伤率不同 = 0.05 2. 计算统计量2值77T11 = 2829/43 = 18.88 T12 = 2814/43 = 9.12T21 = 1529/43 = 10.12 T22 = 1514/43 = 4.88n = 43,且T22 5故应用校正 2检验 方法 有损伤 无损伤 合计 损伤率(%) 手术 22 6 28 78.57 放疗 7 8 15 46.67 合计 29 14 43 67.4478 ( 22867 43/2)243 28152914= 3.19= 方法
27、 有损伤 无损伤 合计 损伤率(%) 手术 22 6 28 78.57 放疗 7 8 15 46.67 合计 29 14 43 67.44793. 确定 P 值,作出结论 =(21) (21)=1,按=1查 2界值表, 20.05(1)=3.84, 本例2 = 3.193.84,故P0.05。 按=0.05水准,不拒绝H0,差异无统计学意义, 不能认为两种治疗方法脑功能损伤发生率不同。如果不校正: ( 22867 )243 28152914= 4.528 3.84 = 20.05(1)故P0.05,可认为两种治疗方法的脑功能损伤发生率不同。 四格表确切概率法(Fishers Exact Tes
28、t) 在四格表资料中若有n40或任一格子T1时,尤其是用其它检验方法所得的概率接近显著性水平(0.05)时,宜用直接概率法算出确切的概率。 本法的基本思想是在四格表的行合计、列合计不变的前提下,出现各种组合的概率服从超几何分布,每一种组合的概率可用公式直接计算。疗法 治愈未治愈合计治愈率%新疗法 72 977.78保守疗法 2 6 825.00合计 9 8 17 52.94本例n=1740,宜用四格表确切概率法。 两种疗法对腰椎间盘脱出症的疗效 三、配对四格表的2检验(McNemar检验)样 品甲乙 n份abcd配对四格表资料的基本结构甲 法 乙 法 a b a+b c d c+d合 计 a+
29、 c b+ d n合 计配对四格表 2值的计算b+c40 时:b+c40 时需校正:例 有50份痰液标本,每份分别接种在甲、乙两种培养基中,观察结核杆菌生长情况,结果见下表,试比较两种培养基的效果。 乙培养基 27 12 39 3 8 11合 计 30 20 5086两种培养基培养效果比较甲培养基合 计87 2检验步骤:1. 建立假设,确定检验水准 H0:B = C,两种培养基的阳性率相同 H1:BC,两种培养基的阳性率不同 = 0.05 2. 计算统计量2值 本例 b+c=12+3=1540,故使用校正公式:883. 确定P值,作出结论 本例=(21) (21)=1,按=1查2界值表, 20
30、.05(1)=3.84,算得2 =4.273.84,故P0.05。 按=0.05水准,拒绝H0,接受H1,差异有统计学意义,可以认为甲、乙两种培养基的阳性率不同。 ( 123 1 )2 12+3= 4.27 当四格表的行数或列数大于2时,称为行列表或RC表,用于多个样本率或构成比的比较。行列表专用公式:89 四、RC表资料的2检验 家庭关系 满意度 合计 满意率(%) 满意 不满意 和 睦 174 60 234 74.36 一 般 36 57 93 38.71 差 6 10 16 37.50 合 计 216 127 343 62.97343例离退休老人的家庭关系与生活满意度 (一)多个率的比较
31、 T33 = 16127/343 = 5.92Tmin =91 2检验步骤:1. 建立假设,确定检验水准 H0: 1=2=3 H1: 1、2、3不等或不全等 = 0.05 2. 计算统计量2值92=343(1742/234216+602/234127+102/161271 )= 40.94 家庭关系 满意度 合计 满意率(%) 满意 不满意 和 睦 174 60 234 74.36 一 般 36 57 93 38.71 差 6 10 16 37.50 合 计 216 127 343 62.973. 确定P值,作出结论 本例=(31) (21)=2,按=2查表,20.05(2)=5.99, 20.01(2)=9.21,算得2 =40.949.21,所以P0.01。 按=0.05水准,拒绝H0,接受H1,差异有统计学意义,可以认为三种不同家庭关系的老人生活满意度不同或不全同,家庭和睦的老人生活满意率最高。 民族 职业 合计 干部 工人 农民 其他 汉族 20 56 62 7 145 回族 14 40 32 11 97 满族 18 28 45 8 99 合 计 52 12
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 银行高层装修方案
- 二零二五年度教育机构校园装修工程协议书2篇
- 二零二五年度个人教育培训资金延期使用合同4篇
- 二零二五年创新型企业投资与国际贸易指导服务协议3篇
- 二零二五年度高端建筑涂料工程分包合同标准版3篇
- 二零二五年度个人肖像权授权使用合同音乐MV个人形象使用4篇
- 清洁能源技术转让合同
- 快递合作合同
- 二零二五年度集体土地承包经营权转让合同范本3篇
- 2025版水电节能改造与咨询服务协议3篇
- 2024年产权管理部年终工作总结例文(3篇)
- 高三日语一轮复习日语助词「に」和「を」的全部用法课件
- 机场地勤劳动合同三篇
- 2024年山东省高考政治试卷真题(含答案逐题解析)
- 《用锐角三角函数解决问题(3)》参考课件
- 执业医师资格考试《临床执业医师》 考前 押题试卷绝密1 答案
- 订婚协议书手写模板攻略
- 风水学的基础知识培训
- 施工组织设计方案针对性、完整性
- 2002版干部履历表(贵州省)
- 第21课《邹忌讽齐王纳谏》对比阅读 部编版语文九年级下册
评论
0/150
提交评论