![常见统计学错误_第1页](http://file4.renrendoc.com/view/795194a11a135ff889b705efdc3a509f/795194a11a135ff889b705efdc3a509f1.gif)
![常见统计学错误_第2页](http://file4.renrendoc.com/view/795194a11a135ff889b705efdc3a509f/795194a11a135ff889b705efdc3a509f2.gif)
![常见统计学错误_第3页](http://file4.renrendoc.com/view/795194a11a135ff889b705efdc3a509f/795194a11a135ff889b705efdc3a509f3.gif)
![常见统计学错误_第4页](http://file4.renrendoc.com/view/795194a11a135ff889b705efdc3a509f/795194a11a135ff889b705efdc3a509f4.gif)
![常见统计学错误_第5页](http://file4.renrendoc.com/view/795194a11a135ff889b705efdc3a509f/795194a11a135ff889b705efdc3a509f5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
常见统计学错误第1页,共31页,2023年,2月20日,星期一1.随机区组设计不可用成组分析方法例1有5件标本I,II,III,IV,V,每一件均匀分成4份,随机分配给4种处理A,B,C,D,得下表资料,试比较处理间的差别。不恰当做法:视纵向4列为4组数据,进行4组间比较。第2页,共31页,2023年,2月20日,星期一多次t检验?!
分别作两组比较的t检验,得认为:A与B,A与C,A与D差异具有统计学意义;
B与C,B与D,C与D差异无统计学意义。第3页,共31页,2023年,2月20日,星期一单因素方差分析?!
同时比较A,B,C,D四个处理组均数间的差异,得F=0.55,P=0.59认为:四个处理组均数的差异无统计学意义。第4页,共31页,2023年,2月20日,星期一为什麽不对?
(1)辜负了设计的苦心——随机区组设计!*同一件标本为一个区组;*同一区组内4种处理有较好的可比性。无视区组的存在,组内个体间变异较大,识别差异的能力大大降低。(2)不能翻来覆去比较!*6次t检验会增大第一类错误!设每次t检验犯第一类错误的概率为0.05,则6次t检验中一次不错的概率=(1-0.05)6
第一类错误的概率
=至少一次出错的概率=1-(1-0.05)6=0.27第5页,共31页,2023年,2月20日,星期一正确作法:随机区组资料的方差分析将处理间的差别与扣除区组间变异后的随机误差进行比较,识别差异的能力大大提高。
本例,处理组间F=8.23,P=0.003差别有统计学意义区组间F=1.21,P=0.36差别无统计学意义第6页,共31页,2023年,2月20日,星期一2.析因设计不能用单因素方差分析例2
收集甲状腺术中正常甲状腺组织做成16份标本,按析因设计随机分为四个处理组。将处理后的标本分别行免疫组化染色,作单位面积HLA-Ⅱ抗原阳性细胞计数。试分析如下数据:第1组(经95%空气和5%CO2培养7天):2.5,2.4,2.6,2.5第2组(经95%空气和5%CO2培养14天):1.8,1.9,1.7,1.8第3组(经95%O2和5%CO2培养7天):2.2,2.3,2.1,2.2第4组(经95%O2和5%CO2培养14天):1.9,1.8,1.7,1.9第7页,共31页,2023年,2月20日,星期一单因素方差分析?!
直接比较四组资料间的差别F=60.00,P=0.00认为:四组间差别具有统计学意义表2析因设计下的实验结果(均数)第8页,共31页,2023年,2月20日,星期一这是典型的两因素2水平的析因设计!i)有负初衷——分析各因素的效应!ii)直接比较四组资料,组间变异大,不敏感!为什麽不对?第9页,共31页,2023年,2月20日,星期一正确作法:析因设计的方差分析i)主效应:某一因素各水平间的平均差别。A因素的主效应=[(第三组均数+第四组均数)(第一组均数+第二组均数)]/2=[(2.2+1.9)(2.5+1.8)]/2=0.1ii)交互效应:若某因素的单独效应随另一因素水平的变化而有较大变化,则称这两个因素间存在交互效应。AB的交互效应
=[(第四组均数第二组均数)(第三组均数第一组均数)]/2=[(1.9-1.8)-(2.2-2.5)]/2=0.2第10页,共31页,2023年,2月20日,星期一检验iii)A的主效应:F=1.37,P=0.26;B的主效应:F=47.13,P=0.00A与B的交互效应:F=0.03,P=0.87
结论:B因素(培养天数)的效应具有统计学意义。第11页,共31页,2023年,2月20日,星期一检验
A的主效应:F=1.37,P=0.26;B的主效应:F=47.13,P=0.00A与B的交互效应:F=0.03,P=0.87
结论:B因素(培养天数)的效应具有统计学意义。第12页,共31页,2023年,2月20日,星期一3.剂量-反应关系
不能用单因素方差分析例3有人分析蛇毒因子(CVF)的剂量对血液白细胞噬菌率的影响,得表3的数据,欲讨论剂量-反应关系。第13页,共31页,2023年,2月20日,星期一i)单因素方差分析?!F=0.701,P>0.5,
均数间差别无统计学意义
为什麽不对?有负初衷——探讨反应随剂量变化的趋势*由多个剂量组的比较只能得知均数间是否有差异*有差异不等于有剂量反应关系第14页,共31页,2023年,2月20日,星期一均数关于log(剂量)的回归分析?!
为什麽不对?均数做因变量造成假象!*回归方程是否有统计学意义与反应的变异状况有关*以诸个体反应值的均数作回归计算,掩盖变异性,造成假象回归方程:Y=61.786-6.886log(剂量)决定系数:R2=0.914。第15页,共31页,2023年,2月20日,星期一正确作法:用个体资料作回归分析回归方程:Y=61.782-6.884log(剂量)决定系数:R2=0.095。回归方程无统计学意义,无剂量反应关系!若反应和剂量间散点图呈曲线状,剂量可作适当变换。第16页,共31页,2023年,2月20日,星期一4.重复测量资料不能逐个时间点两组比较例4为研究某食物对血清胆固醇浓度的影响,各取7只兔子,分别以正常食物和待研究食物喂养,在实验前、喂养5周、10周后,各取血测量其中胆固醇浓度,其自然对数转换后的数据见表22.1,问血清胆固醇浓度随时间变化的趋势是否受该食物的影响。第17页,共31页,2023年,2月20日,星期一例5某药物有新、旧两种剂型。为了比较这两种剂型的代谢情况,对16例某病患者服药后0、4、8、12小时的血药浓度作了测量,问该药新旧两种剂型的血药浓度-时间曲线的差别是否具有统计学意义。
第18页,共31页,2023年,2月20日,星期一第19页,共31页,2023年,2月20日,星期一
常见的不妥
i)对每个时间点,分别计算均数、标准差;将各时间点测量值的均值用线连接,标出“误差”线ii)在各时间点做t检验或Mann-WhitneyU检验第20页,共31页,2023年,2月20日,星期一为什麽不对?(1)连接各时间点测量值均数的方法将掩盖个体曲线位置和形状的特点;(2)各均数所对应的点连起来形成的曲线形状可能与诸个体的曲线形状毫不相干;(3)各时间点相应的标准差是一种误导;(4)上述方法无法体现不同时间点的数据来自同一个体,而每一个体的多次重复测量值间具有相关性。(关键所在)第21页,共31页,2023年,2月20日,星期一正确做法:1)综合指标法(summarymeasuresapproach)或派生变量法(derivedvariableapproach)采用少数独立的综合指标来概括每个个体多个时间点的测量值;用单变量方法比较各组的差异第22页,共31页,2023年,2月20日,星期一综合指标第23页,共31页,2023年,2月20日,星期一2)重复测量资料的方差分析
先做“球形检验”不同时间点上数据之间没有相关性?任何两个时间点之间的相关性都一样?重复测量资料的方差分析!
例6对表4资料进行单变量方差分析。处理因素(group):F=31.69,P=0.0001
测量时间(time):F=11.93,P=0.0003
时间与处理交互效应项(time×group):
F=10.57,P=0.0005结果:食物对家兔血清胆固醇有影响;家兔血清胆固醇浓度随时间变化;所研究的食物对血清胆固醇浓度随时间变化的趋势也有影响。第24页,共31页,2023年,2月20日,星期一5.多维列联表资料不可反复做检验例7某地区呼吸系统疾病的患病率较高,有人怀疑与当地室内点香的习惯有关,经抽样调查,得数据如下第25页,共31页,2023年,2月20日,星期一合并后作检验?!
第26页,共31页,2023年,2月20日,星期一为什麽不对?i)点香与不点香者患病率不可比!年龄组合并掩盖了:
点香(B1)与不点香(B2)者年龄结构不同ii)不同年龄组患病率不可比!点香与不点香者合并掩盖了:
不同年龄组中点香与不点香者比例的不同第27页,共31页,2023年,2月20日,星期一正确作法:对数线性模型或logistic回归i)对数线性模型平等地讨论A,B,C三因素对各格子中频数的影响仅当其他变量的影响与某变量无关时,才可通过合并消除该变量ii)logistic回归
反应变量:患病与否,解释变量:点香和年龄交互效应:点香×年龄第28页,共31页,2023年,2月20日,星期一小结设计类型和变量类别决定分析方法:1.随机区组设计不能用成组分析方法不能用t检验或单因素方差分析要用随机区组设计资料的方差分析2.析因设计不能用单因素方差分析要用析因设计资料的方差分析第29页,共31页,2023年,2月20日,星期一3.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024湖北十堰融资担保集团有限公司招聘5人笔试参考题库附带答案详解
- 2025-2030年数字化零售管理企业制定与实施新质生产力战略研究报告
- 2025-2030年噪音污染监测耳塞行业深度调研及发展战略咨询报告
- 2025-2030年文化传统节日行业深度调研及发展战略咨询报告
- 2025-2030年数据加密与安全传输企业制定与实施新质生产力战略研究报告
- 2025-2030年地质勘察风险管理软件行业深度调研及发展战略咨询报告
- 2025-2030年数学游戏电子学习板企业制定与实施新质生产力战略研究报告
- 2025-2030年复古电影道具馆行业深度调研及发展战略咨询报告
- 2025-2030年手工面食社区团购企业制定与实施新质生产力战略研究报告
- 2024年中国邮政集团有限公司河南省分公司国际业务专业责任中心社会招聘7人笔试参考题库附带答案详解
- 北京中考英语词汇表(1600词汇)
- JJF(鄂) 143-2024 路面材料强度试验仪校准规范
- 七年级生物上册(人教版2024)新教材解读课件
- 2024年巴西摩托车赛车级轮胎市场机会及渠道调研报告
- 2021-2022学年海南省三亚高一下学期开学考试物理试卷
- 台州事业单位笔试真题2024
- 父母房产继承协议书范本
- 期末模拟试卷 (试题)-2023-2024学年六年级下册数学人教版
- 51个行业领域重大事故隐患判定标准和重点检查事项汇编
- 塑料 聚氨酯生产用聚醚多元醇 碱性物质含量的测定
- 2024年高二化学教案 选择性必修2(配人教版)第1课时原子结构与性质
评论
0/150
提交评论