药学统计学介绍_第1页
药学统计学介绍_第2页
药学统计学介绍_第3页
药学统计学介绍_第4页
药学统计学介绍_第5页
已阅读5页,还剩171页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、药学统计学介绍Pharmaceutical Statistics(Pharmacometrics) 主讲教师:李伟 药学院药物分析系 药物分析教研室药学院楼432 email: 讲课24学时,学分1.5 / 讲课16学时,学分 指定选修课:药学专业 自由选修课:全校各专业 考试形式教材和主要参考书教材: 罗旭 毕开顺 医药统计学 高等教育出版社 2010年 主要参考书:罗旭 化学统计学科学出版社 2001年参考书:1 方积乾 卫生统计学 人民卫生出版社 2003年2 孙振球 医学统计学 人民卫生出版社 2010年3 杨德 试验设计与分析 中国农业出版社出版 2002年4 徐叔云 药理实验方法学

2、 人民卫生出版社 2009年5 张均用 现代药理实验方法 北京医科大学/协和医科大学出版社 2002年教材和主要参考书参考书: 6 郭祖超 医用数理统计方法第三版 人民卫生出版社 1988年7 相秉仁 计算药学 中国医药科技出版社 1990年 8 许禄 化学计量学方法 科学出版社 1995年9 蔡元龙 模式识别 西北电讯工程学按出版社 1990年10 王玺 化学统计学基础习题 沈阳药科大学 1995年11 Sanford Bolton, Pharmaceutical Statistics 1998年12 PHARMACOMETRICS THE SCIENCE OF QUANTITATIVE P

3、HARMACOLOGY, A JOHN WILEY & SONS, INC., PUBLICATION, 2007其他推荐参考资料 药学科学前沿与发展方向 吴镭,北京:中国医药科技出版社,2000 新药设计原理与方法 徐文方,北京:中国医药科技出版社,1997 分子生物学与中医药研究 王明艳等,上海中医药大学出版社,2000 计算机辅助药物设计-原理、方法及应用陈凯先等, 上海科学技术出版社,2000 分子结构、性质与活性王连生等,北京:化学工业出版社,1997 蛋白质的结构预测与分子设计来鲁华等,北京:北京大学出版社,1995 药物化学总论郭宗儒,北京:中国医药科技出版社,1994 组合化学

4、(英) Nicholas K. Terrett, 北京:北京大学出版社,1999 遗传算法原理及应用周明等,北京:国防工业出版社,2000 化学因子分析潘忠孝等,合肥:中国科技大学出版社,1992 化学计量学导论俞汝勤,长沙:湖南教育出版社, 1991 现代分析化学中的信息理论基础俞汝勤,长沙:湖南大学出版社,1987 计算化学 陈念贻等,上海:上海科技出版社,1985 神经网络导论胡守仁等,长沙:国防科技大学出版社,1993前言统计学的意义All knowledge is, in final analysis, history.All sciences are, in the abstrac

5、t, mathematics.All judgments are, in their rationale, statistics. 在终极的分析中,一切知识都是历史; 在抽象的意义下,一切科学都是数学; 在理性的基础上,所有的判断都是统计学。 C.R.Rao 统计与真理:怎样运用偶然性前言统计学的产生人类对数据研究的需要matters of state (国事) - Statistics 词源概率论(probability theory) 博弈论(Game Theory)关于竞争、合作和游戏规则的数学理论 win-win / lose-lose / zero-sum (win-or-lose)

6、前言统计学的发展古典统计学的萌芽时期(17世纪中叶18世纪末)近代统计学的形成时期(19世纪初19世纪末)现代统计学的发展时期(20世纪初)亚伯拉罕棣莫弗 (Abraham De Moivre) 166717541697年,英国皇家学会会员1735年,柏林科学院院士1754年,法国巴黎科学院会员主要成就:概率论、中心极限定理卡尔弗里德里希高斯 (Johann Carl Friedrich Gauss) 17771855数学家、物理学家和天文学家“数学王子”、“数学家之王” “最伟大的数学家之一”相关成就:误差正态分布的最小二乘理论 三次观测法确定谷神星的位置 Stiglers law of e

7、ponymy Stigler名字由来法则No scientific discovery is named after its original discoverer.“ (没有科学发现是以它最初的发现者命名的)Named the sociologist Robert K. Merton as the discoverer of Stiglers law, so as to avoid this law about laws disobeying its very own decree.Robert K. Merton ( 1910.7.4 2003.2.23 )Matthew effect (

8、or accumulated advantage) (the rich get richer and the poor get poorer“) 马太效应(积累优势、两极分化现象)威廉戈塞 William Sealy Gosset,18761937现代统计方法小样本理论研究的先驱化学家、数学家与统计学家相关成就:1908年,以笔名“Student”在生物计量学杂志发表论文平均数的规律误差 1907-1937年间发表的22篇统计学论文于 1942年以“学生”论文集为书名重新发行统计学的分类 描述统计学 与 推断统计学描述统计学(descriptive statistics)是研究如何取得反映客观

9、现象的数据,并通过图表形式对所搜集的数据进行加工处理和显示,进而通过综合概括与分析得出反映客观现象的规律性数量特征的一门学科。推断统计学(inferential statistics)是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。描述统计学和推断统计学区别:描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的方法。联系:现代统计学的两个组成部分,相辅相成、缺一不可。描述统计学现代统计学的基础和前提推断统计学现代统计学的核心和关键前言统计学的发展正

10、态分布(normal distribution / Gaussiandistribution)观测误差理论(Theory of errors of observation) 如果影响一个量的独立随机因素众多而且每个因素的影响小,则这个量呈现为概率密度两头小、中间大的分布p(x)前言近代和现代统计学的发展 t分布 显著性检验方法 方差分析未来统计学的发展趋势依赖数学、结合计算机技术与实质性学科、统计软件、现代信息相结合从描述现状、反映规律,向抽样推断、预测未来变化发展前言统计学的一般定义和解释是以概率论和数理统计为基础,对研究对象的数据进行搜集、整理和分析,揭示事物总体特征和规律的方法论科学。研

11、究数据的搜集或产生、描述、分析、综合和解释,以获得新知识或新信息,或做出新推断的学科。前言统计学的学科分支经济计量学 econometrics技术计量学 technometrics 生物计量学 biometrics, biometry化学计量学 chemometrics医学统计学 medical statistics卫生统计学 health statistics生物统计学 biostatistics学科分级:化学 分析化学 化学统计学前言药学统计学的产生和发展学科的继承性和交叉学科的形成统计学方法在药学研究中的应用新技术和新方法在药学研究中的应用 PR (Pattern Recognition

12、) ANN (Artificial Neural Network) DM (Data Mining) KDD (Knowledge Discovery in Databases)统计学和数学软件SAS Statistical Analysis SystemSPSS Statistical Product and Service Solutions (2010后称为 IBM SPSS)BMDP Bio Medical Data Processing曾与SAS、SPSS并称为三大统计软件包Statistica、Stata、S-PLUS、Graphpad Prism数学软件: Mathematica

13、 、 MATLAB、Maple前言药学统计学的定义 (pharmaceutical statistics, pharmacometrics) 研究数据的搜集或产生、描述、分析、综合和解释,以获得新的药学知识或信息,或做出新的药学推断的学科学科分级: 药学 药学统计学药学统计学的应用片剂含量均匀度计量型检验方案的研究中药质量化学模式识别的研究中药方剂处方的筛选和优化SGI图形工作站 SGI O2WorkstationRISC架构的MIPS并行处理器64位UNIX操作系统:IRIX分子模拟及分子建模软件 TriposSybyl & MSIInsight II数据库系统 Oracle 数据库管理台M

14、DL药物数据报告三维数据库(MDDR/3D)Chapman&Hall天然产物数据库(CHDNP)CambridgeSoft NCI 2D/3D & INDEXNET数据库第一章 数据误差的叠加 误差及其种类误差:测量值(给出值)与客观真值之差分析结果误差实验误差数据处理误差系统误差随机误差抽样误差过失误差舍入误差算法误差人为误差相对误差 误差及其种类系统误差系统误差 (systematic error)可定误差 确定原因引起的误差性质: 重复性 多次测定重复出现 单向性 正误差或者负误差 确定性 误差基本恒定不变 无抵偿性 无法通过多次测定取平均值减免 分布多样性 未知分布可按均匀分布处理 改

15、变实验条件才能发现它 误差及其种类系统误差系统误差 (systematic error)影响测定结果的准确性无法应用概率统计方法减弱或消除重复测定不能发现或减少 误差及其种类系统误差系统误差(systematic error)误差分类恒差 绝对误差 (absolute error) 保持不变,与称样量无关,相对误差 (relative error) 随被测组份含量的增大而减小比例误差 相对误差不变,绝对误差随样品量增大而增大 误差及其种类系统误差系统误差(systematic error)误差来源 方法误差 仪器和试剂 个人误差检查和减免方法试验设计对照试验空白试验回收试验标准加入法A:加入标

16、准后测得量B:未加入标准前测得量C:加入标准量 误差及其种类随机误差随机误差(random error)偶然误差、不可定误差 不确定原因引起的误差性质:随机性 单次测定误差大小和符号无法估计 多次观测服从概率统计规律正态性 分布为正态分布抵偿性 多次重复测定取平均值可减免 误差及其种类随机误差影响测定结果的精密度系统误差和随机误差的关系抽样误差样品个体差异对取样的影响样本均值之间、样本均值与总体均值都可能不相等过失误差因操作失误产生的误差 准确度与精密度准确度 (accuracy) 观测值的正确性精密度 (precision) 观测值彼此符合的程度极差偏差平均(绝对)偏差方差(variance

17、)标准差 (Standard Deviation,SD)相对标准差(Relative Standard Deviation,RSD)变异系数(Coefficient of Variation,CV ) 准确度与精密度精密度的层次连续测定的精密度相同条件下,同一时间内对同一样品进行n次重复测定重复性精密度(Repeatability precision)相同条件下,不同时间内对同一样品进行m回n次重复测定 m回 m个样本 n次 相互独立进行中间精密度 (intermediate precision)变动因素:不同时间,不同人员,不同仪器设备 准确度与精密度第 i 回的连续精密度重复性精密度 准确

18、度与精密度精密度的层次再现性精密度(Reproducibility precision) 不同条件下,对同一样品进行m回n次重复测定 药典用语重现性耐用性(robustness)通用性 测试条件有微小改变时测试结果不受影响的承受能力研究分析方法时,通过系统适用性试验考察 准确度与精密度分析方法的精密度影响因素:样品、样品的均匀性、被测量值大小、所用仪器、试剂、分析者、实验条件、测定次数仅在测定次数无限多,条件固定,对特定样品而言,标准差是一个常数。在相对条件下,针对具体样品来研究方法的精密度。准确度表示测量的正确性,精密度表示测量的重现性精密度是保证准确度的先决条件,只有在消除了系统误差后,才

19、可用精密度同时表达准确度一组测量值精密度高,其平均值的准确度不一定就高可能包含一种恒定的系统误差,结果总是偏高或偏低精密度低,准确度也常常较低平均值与真实值很接近也是出于偶然,并不可取精密度和准确度都高的测量结果才准确准确度与精密度的关系不精密则不准确,精密不一定准确,准确必需精密1.3 误差的叠加系统误差的叠加 和差的绝对误差等于各观测值误差的和差 积商的相对误差等于各观测值的相对误差的和差1.3 误差的叠加随机误差的叠加极值误差法标准差法极值误差法1.3 误差的叠加 极值误差法极值误差法 例 容量分析法K 换算因数(一般为相对分子量)C 标准溶液的物质的量浓度V 滴定体积W 称样量1.3

20、误差的叠加 极值误差法极值误差法 例 吸收光度分析法被测组分含量 被测组分百分含量 1.3 误差的叠加 极值误差法 例 间接分析法 同时测定两组分含量的吸收光度分析:对A1, A2进行偏微分,并令A1=A2组分含量小的相对误差大组分含量大的相对误差小组分含量相近的相对误差大约相等1: xcx+ycy=A1 2: xcx+ycy=A2cx=cy=1.3 误差的叠加 标准差法标准差法 根据概率分布规律处理随机误差的叠加使用条件:观测值足够多 各个观测值彼此独立 观测次数有限时,用样本方差S2来估计2和差标准差的平方等于各步观测值标准差的平方和积商的相对标准差的平方等于各步观测值相对标准差的平方和1

21、.3 误差的叠加 例 :某药物的规定剂量为200mg,制成200mg/片,S=10mg,每次服用1片。也可制成50mg/片,S=3mg,每次服用4片。从保证用药的安全和有效方面考虑,服用哪一种标示量的片剂更有利? 提示: 服用4片药物时: S2=S12+S22+S32+S42=432 S=6mg 1.3 误差的叠加 例 :容量分析法SV=0.02ml V=20mlSW=0. 2mg W=200mg1.4 有效数字与计算规则有效数字(significant figure)组成:可靠数字和最后一位不确定数字(欠准数字)常数、无理数、系数、H2SO4含量测定项下 “ 每1ml的xxx滴定液()”规格

22、项下:0.3mg, 1ml:25mg, etcpH值1.4 有效数字与计算规则数值修约(rounding off for numerical values)通过省略原数值的最后若干位数字,调整所保留的末位数字,使最后所得到的值最接近原数值的过程数值修约规则新标准( GB/T 8170-2008 )中,增加了术语“数值修约”和“极限数值”,删除了术语“有效位数”、“单位修约”、“单位修约”数值修约规则新标准:GB/T 8170-2008 数值修约规则与极限数值的表示和判定(Rules of rounding off for numerical values & express and judge

23、ment of limiting values 国家质量监督检验检疫总局、国家标准化管理委员会2008-07-16 发布,2009-01-01实施 )原标准:GB/T 8170-1987 数值修约规则(Rules for rounding off of numberical values)(国家标准局 1987-08-19 批准) 数值修约规则修约间隔(rounding interval)修约值的最小数值单位确定修约保留数位的一种形式修约间隔修约值10-nn位小数1个位10n十、百、千位数字的进舍规则4舍6入5留双连续修约错误: 15.454615.455 15.46 15.5 16 修约间隔

24、实测值修约值102126813102110.5021110-11.0501.00.3500.410-30.132510.133数字的进舍规则药典的补充规定准标准和域标准 (例:异戊巴比妥钠的干燥失重)药典用语:称定、精密称定;量取,精密量取“精确度可根据数值的有效数位来确定”修约间隔实测值上报值最终结果值116.5316.51716.4816.51616.5016.516数字的进舍规则“精确度可根据数值的有效数位来确定”称取质量(g)称重范围(g)0.10.060.1421.52.52.01.952.052.001.9952.005确定数学运算有效数字位数的普适规则结果的相对误差与运算中最大的

25、相对误差相当例如:99.7% 和 100.3%第二章 显著性检验前言统计推断从样本到总体 1)统计估计: 样本统计量的计算,总体参数的估计 2)假设检验:接受还是放弃H0?数据组间差异存在的原因偶然还是必然?显著性检验的任务参数检验和非参数检验方法第二章 显著性检验 显著性检验2.2 2检验2的齐性2.3 拟合优度的2检验2.4 独立性检验2.5 非参数检验2.6 逸出值检验2.7 显著性检验中注意的几个问题2.1 显著性检验 显著性检验的步骤:1)提出检验统计量并进行试验2)提出零假设H0和备择假设Ha3)规定显著性水平4)计算检验统计量5)界定P值和作出结论 几种参数检验方法: Z检验,t

26、 检验,比率差检验, F检验、 2检验2.1 显著性检验Z检验:1)样本均值与总体均值比较2)两样本均值的比较标准正态分布常用的临界值(双侧检验):2.1 显著性检验t检验:1)样本均值与总体均值比较2)两样本均值的比较3)成对t检验1)2)2.1 显著性检验t检验:2)两样本均值的比较 方差齐性检验方差齐性方差非齐性2.1 显著性检验对照组 (滴数/min)46 30 38 48 48 6046 26 58 46 48 44用药组 (滴数/min)54 46 50 52 52 5864 56 54 54 58 36例 24只豚鼠离体肺脏作支气管灌流试验,记录如下:试验结果能否说明该药对支气管

27、有扩张作用?n1=12 n2=12 S1=9.815 S2=6.952 2.1 显著性检验t检验:3)成对t检验 例 为判断大翅猪毛菜对降低血压是否有效,随机测得10例患者在治疗前、后的平均血压的数值如下:编号 No.12345678910治疗前117127141107110114115138127122治疗后12310812010710098102152104107d-619210101613-1423152.1 显著性检验3)成对t检验编号 No.12345678910治疗前117127141107110114115138127122治疗后1231081201071009810215210

28、4107d-619210101613-1423152.1 显著性检验比率差检验1)关于【2015】届毕业生2015届1663名本科毕业生修业结果, 有1592名被授予学士学位。未被授予学位71人;比率:4.27%2)关于【2014】届毕业生2014届本科毕业生共1405名。1375名授予学位,没有获得学位30人;比率:2.14%2.1 显著性检验比率差检验1)样本比率与总体比率比较2)两样本比率的比较2.1 显著性检验1)样本比率与总体比率比较 【例】:某产品要求次品率不超过2%,现在对某批次产品随机抽取30件样品,其中1件是次品,问是否应该拒绝这批样品?2.1 显著性检验2)两样本比率的比较

29、发病人数未发病人数发病率(%)甲(免疫组)5147214770.388乙(对照组)87361236992.35292508451761.777【例】 观察流感活疫苗的接种效果,得如下数据:2.1 显著性检验疫苗分类第一类疫苗免费提供,公民依照政府的规定受种的疫苗,包括国家免疫规划确定的疫苗,省、自治区、直辖市人民政府在执行国家免疫规划时增加的疫苗,以及县级以上人民政府或者其卫生主管部门组织的应急接种或者群体性预防接种所使用的疫苗。第二类疫苗由公民自费并且自愿受种的其他疫苗。2.1 显著性检验疫苗分类第一类疫苗计划免疫类疫苗国家支付费用保障不受传染病威胁的第一道防线主要包括卡介苗、乙肝疫苗、脊灰

30、疫苗、百白破疫苗、白破疫苗、麻疹疫苗、麻风疫苗、麻腮疫苗、麻腮风疫苗、乙脑减毒活疫苗、甲肝减毒活疫苗、A群流脑疫苗、 A+C群流脑疫苗,等等总共13种,22针次2.1 显著性检验疫苗分类第二类疫苗计划免疫外疫苗公民自费: 儿童注射由父母承担接种费用包括水痘疫苗、HIB疫苗、轮状病毒疫苗和流感疫苗等辉瑞(Pfizer) 七价肺炎球菌疫苗“Prevenar”商品名: 沛儿 接种方案:肌肉注射 参考价格:单价860元赛诺菲安万特(Sanofi-Aventis) B型流感嗜血杆菌偶联疫苗“ActHIB”商品名: 安尔宝 接种方案:皮下/肌肉注射 参考价格:单价160元部分计划内免疫疫苗根据疫苗的性质产

31、地等也有部分收费灭活乙脑疫苗不收费,乙脑活苗需要收费,咨询医生选择第二类疫苗计划免疫外疫苗公民自费: 儿童注射由父母承担接种费用包括水痘疫苗、HIB疫苗、轮状病毒疫苗和流感疫苗等辉瑞(Pfizer) 七价肺炎球菌疫苗“商品: 沛儿 接种方案:肌肉注射 参考价格:单价860元赛诺菲安万特(Sanofi-Aventis) B型流感嗜血杆菌偶联疫苗“商品名: 安尔宝 接种方案:皮下/肌肉注射 参考价格:单价160元部分计划内免疫疫苗根据疫苗的性质产地等也有部分收费灭活乙脑疫苗不收费,乙脑活苗需要收费,咨询医生选择偶合症 指受种者在接种时正处于某种疾病的潜伏期或者前驱期,接种后偶合发病,它与预防接种无

32、因果关系,纯属巧合,即不论接种与否,这种疾病都必将发生。截至2009年11月30日,中国H1N1甲流疫苗接种后报告疑似异常反应发生率为万,偶合症约占7%;异常反应报告发生率未超过国内外临床试验结果。2013年12月乙肝疫苗接种致死事件 湖南3名婴儿接种乙肝疫苗后出现严重不良反应,其中2人死亡。涉事两个批号产品已暂停使用。疫苗生产企业康泰公司发出澄清公报称,致死原因缘于偶合症,与疫苗无关。2.1 显著性检验F检验样本方差与总体方差比较分析方法重复性差异比较方差齐性检验123456710min35.436.435.234.833.334.635.315min33.635.234.734.935.9

33、35.336.1例 混合罐中混合两种物质A和B,检查混合效率,运行10min和15min时分别在7处取样测定物质A的百分数(%):2.1 显著性检验F检验123456710min35.436.435.234.833.334.635.315min33.635.234.734.935.935.336.1例 混合罐中混合两种物质A和B,检查混合效率,运行10min和15min时分别在7处取样测定物质A的百分数(%):2.1 显著性检验2检验2分布:Z变量平方和的分布2分布特性:非负性;加和性;只有自由度一个参数可用于关于样本方差或样本标准差概率的陈述2.1 显著性检验2用于关于样本方差或样本标准差概

34、率的陈述例:从总体标准差为的正态分布总体中取出容量为10的样本,其样本标准差大于的概率是多少?概率:1.0%2.5% ,大约2%2.2 2检验2的齐性 2检验2的齐性多组数据方差是否有显著差异巴特莱特方法(Bartletts method):2.2 2检验2的齐性 巴特莱特方法例 来自三个实验室的数据试验室niiSi2iSi2lgSi2i lgSi21430.05390.1617-1.2684-3.80532430.011830.0355-1.9270-5.7813540.029080.1163-1.5364-6.145613100.3135-15.73192.3 拟合优度的2检验观测频数与期

35、望频数差异的显著性检验数字OiEiOi-Ei(Oi-Ei)2/Ei035201511.2511620-40.8021520-51.2531720-30.4541720-30.4551920-10.0561120-94.0571620-40.8083020105.009242040.80200200024.902.4 独立性检验 分类标准差异的显著性检验列联表(contingency table)按两个或更多不同标准、原则、属性分类所编制列出的频数表 22 列联表 mk 列联表 配对计算资料的2检验2.4 独立性检验 22 列联表 22 列联表 例 某医院收得乙型脑炎重症患者206人,随机分为两

36、组,分别用同样的中药方剂治疗,但其中一组加一定量的人工牛黄,治疗效果如下表。问人工牛黄能否增强乙脑中药方剂的疗效?组别总人数治愈人数甲乙脑方剂7832乙乙脑方剂+人工牛黄128782.4 独立性检验 22 列联表例 acbd治愈人数未愈人数甲324678乙785012811096206组别总人数治愈人数甲乙脑方剂7832乙乙脑方剂+人工牛黄12878H0:用药和疗效是独立的,没有联系。 人工牛黄没有增强疗效作用。 两组治疗率相同。Ha: 用药和疗效有联系,两组治疗率 不同。根据H0 ,将两组的总治疗率作为理论治疗率:110/206 100% =53.4%2.4 独立性检验 22 列联表例OiE

37、iOi-Ei(Oi-Ei)2/Eia3241.65-9.652.24b4636.359.652.56c7868.359.651.36d5059.65-9.651.567.72 =(m-1)(k-1)=(2-1)(2-1)=12 =7.72 2 (0.01, 1) = 6.63 2.4 独立性检验 22 列联表耶梯斯连续性校正(Yates correction) 2 无需校正:(满足任一条件)自由度 2| Oi-Ei N 602 相加2.4 独立性检验 22 列联表2的加和性 2的加和也是2分布实验结果趋势相同时, 2直接加和进行2检验实验结果趋势不同时, 先计算2开平方后的数值,根据实验结果的

38、趋势不同,加上正负号,之后计算代数和,按下列公式计算Z值k 四格表数目2.4 独立性检验 22 列联表例 用止血粉做狗股动脉截断止血试验,共进行6批试验,结果如下表:问加药后3min和5min的止血成功率有无显著差别?No.动物数成功次数压迫3min压迫5min1163521679316511416812516611616272.4 独立性检验 22 列联表例No.动物数成功次数压迫3min压迫5min116352167931651141681251661161627成功次数失败次数3min313165min5111682432第一次试验结果数据2.4 独立性检验 22 列联表第一次试验结果数

39、据2232425262 总 2=14.80 2(0.05,6)成功次数失败次数3min313165min51116824322.4 独立性检验 22 列联表如果直接用总结果计算:2=0.00527 2(0.05,1)成功次数失败次数3min3165965min554196861061922.4 独立性检验 22 列联表例 用甲乙两种止血粉做狗股动脉截断止血试验,加药后压迫3min, 共做了6批试验,结果如下表:问甲乙两种止血粉的止血成功率有无显著差别?No.动物数成功次数甲药乙药116232161173161054168851676616622.4 独立性检验 22 列联表例成功次数失败次数甲

40、药21416乙药3131652732第一批试验结果数据No.动物数成功次数甲药乙药116232161173161054168851676616622.4 独立性检验 22 列联表计算其它各批数据总 Z=1.92 2(0.01,4)2.4 独立性检验 配对计算资料的2检验配对计算资料的2检验问两药的抗休克效果有无区别?东莨菪碱(甲)有效无效氯丙嗪(乙)有效9211无效1361922830例 比较东莨菪碱和氯丙嗪的临床抗休克效果,将病人按其休克程度配对,在每对休克程度相近的病人中除常规处理外,甲用东莨菪碱治疗,乙用氯丙嗪治疗,共观察了30对病人,其疗效结果如下表:2.4 独立性检验 配对计算资料的

41、2检验问两药的抗休克效果有无区别?东莨菪碱(甲)有效无效氯丙嗪(乙)有效9 a2 b11无效13 c6 d19228302(0.05,1)= 2(0.01,1)= 2.5 非参数检验 非参数检验 Nonparametric tests(分布自由方法 Distribution-free methods)不考虑研究对象总体分布具体形式检验中不涉及有关总体分布的参数(如:均值、方差 )通过检验样本所在总体分布形式的一致性得出统计结论符号检验 (Sign test) 秩和检验 (Ranks test)游程检验 (Runs test)2.5 非参数检验 非参数检验方法适用范围未知分布、分布不明、分布不稳

42、定样本数太少 (n6) 而使得分布状况尚未显示出来半定量数据 只能以严重程度、优劣等级、效果大小、名次 先后以及综合判断等方式记录其符号或等级偏态分布组内个别随机变量偏离过大多组数据离散程度相差悬殊2.5 非参数检验 非参数检验优点对总体假定较少适用范围广,无需考虑总体分布形式计算简便,在急需初步统计结果时可采用易于理解和掌握可用于不便精确测量的资料或等级资料2.5 非参数检验 非参数检验缺点信息利用不充分检验效率低,出错可能性比参数检验大虽计算简便,但有些问题的计算仍显繁冗获取临界值表不易2.5 非参数检验 符号检验 (Sign test)适用于配对的实验设计。利用各对数据之差的符号来检验两

43、个总体分布的显著性差异。如果两总体服从相同分布,则每对数据之差的符号为正和负的概率应该相等。考虑到实验误差的存在,正号和负号出现的次数相差应该不大,如果太大,超过一定的临界值,就不能认定两个总体服从相同的分布,即差异显著。2.5 非参数检验 符号检验 (Sign test)例 某种新药治疗高血压患者18例,治疗前后的收缩压见表,问治疗前后的收缩压有无显著性差异?病例123456789101112131415161718治疗前184173181159148161172183194152173180162167154184172148治疗后17116917216213416116718019115

44、2162167160170152171169140符号+-+0+0+-+2.5 非参数检验符号检验 (Sign test) 当n超出符号检验表范围时,可采用正态近似法求Z值来确定P值: 2.5 非参数检验 秩和检验 (Ranks test, rank sum test) 建立检验假设,确定显著性水平 混合编秩 求秩和并确定检验统计量 确定P值和作出推断结论2.5 非参数检验 秩和检验 (Ranks test, rank sum test)常用于配对、两样本和多样本比较。 将两组试验数据混起来按照大小次序编号,每个数据的对应号码(名次)称为它的秩,对于大小相等的两个数,则以对应号的平均数赋秩。计

45、算容量较少的那些值所对应的秩的和用T表示。若两组数据无显著差异时,两组的秩和不会过分悬殊,即T值应处于一定的上下限之间。根据n1,n2, 查秩和检验表得到T1下限和T2上限,若TT1 或TT2 ,接受Ha,认为存在显著性差异;若 T1TT2 ,则不存在显著性差异。2.5 非参数检验 秩和检验 (Ranks test, rank sum test)例 两个品种的家兔,分别测定其停食18小时后的血糖如表所示。试问两品种家兔的血糖有无显著性差异?秩123456789101112131415甲101104116117121123124128乙1001121131141211361372.5 非参数检验

46、 秩和检验 (Ranks test, rank sum test) 当n120或(n2-n1)10时,可采用正态近似法求Z值来确定P值: 显著性检验方法比较数据类型 参数检验 非参数检验 两独立样本 t检验 Wilcoxon秩和检验两配对样本 配对t检验 符号秩和检验多样本 方差分析 Kruskal-Wallis秩和检验2.5 非参数检验游程检验 (Runs test)从两个总体中独立抽取的两个样本的观察值混合排列,观察游程个数,进行比较。用游程的个数来检验样本的随机性,或总体的分布特征。 两组数据混合排列 相邻数据属于同组者即构成一个游程 连接若干同组的数据也构成一个游程 游程所含的数据个数

47、成为游程的长度,游程总数记为R2.5 非参数检验游程检验 (Runs test)例 比较两种不同的饲料(甲:高蛋白;乙:低蛋白)喂养大白鼠对体重增加的影响。试问两种饲料的影响是否显著?甲8397104108113119123124129134乙70859499101107117118126序列10110110100110001002.6 逸出值检验逸出值(离群值、野值,异常数据)逸出值检验的一般步骤1) 用给定的公式计算统计量2) 根据需要选定显著性水平3) 按观测次数n和选定的显著水平从相应的统计 数据表中查找统计量的临界值4) 计算值 临界值, 数据异常,应舍弃 计算值 临界值,数据应保留

48、2.6 逸出值检验逸出值检验的标准对不同的总体分别考虑:1) 正态分布总体异常值的判断和处理GB48832) 指数分布总体异常值的判断和处理GB80563) I型极值分布总体异常值的判断和处理GB6380逸出值检验方法简介格拉布斯检验法(Grubbs)狄克逊检验法(Dixon)格拉布斯检验法(Grubbs)1) x1或xn 可疑2) x1 , xn 均可疑 G(,n)2.6 逸出值检验2.6 逸出值检验狄克逊检验法(Dixon)样本大小nX1可疑Xn可疑3-78-1011-1314-202.6 逸出值检验例 某醋酸泼尼松制剂的标示百分含量(%)六次重复测定结果分别为:,其中是否有可疑数据需要剔

49、除?显著性检验中注意的几个问题单侧与双侧检验第一类错误与第二类错误关于显著性水平的选择“差别无显著意义”和“差别有显著意义”显著性检验的结论单侧与双侧检验显著性检验中注意的几个问题p(x)00/2/2p(x)0p(x)显著性检验中注意的几个问题单侧与双侧检验0p(x)【例】:参加本课程期末考试要求上课考勤的出勤率要高于40%,则12次课中抽查出勤率点名6次,至少要出勤几次?(Z(),男生计算)显著性检验中注意的几个问题单侧与双侧检验0p(x) 【例】:参加本课程考试要求上课考勤的缺勤率要低于60%,则12次课中抽查出勤率6次,最多可以有几次考勤未到?(Z(),女生计算)第一类错误和第二类错误I

50、 have no need of that hypothesis. LaplaceThere are only two tragedies in life: One is not getting what you want, the other is getting it.第一类错误 (错误 ) :事实上不存在真正的差异,但作出了差异显著的结论。 犯了以真为假的错误:舍弃了正确的零假设。第二类错误 (错误 ) :事实上存在真正的差异,但作出了差异不显著的结论。 犯了以假为真的错误:接受了错误的零假设。显著性检验中注意的几个问题第一类错误和第二类错误显著性检验中注意的几个问题p(x)00p(x)

51、显著性检验中注意的几个问题关于显著性水平的选择“差别无显著意义”和“差别有显著意义”差别有无意义均指概率水平而言差别有显著意义具此差别的不同样本在同一总体中出现的概率很小,已达到了可以确认他们有差别的概率水平。差别无显著意义具此差别的不同样本在同一总体中出现的概率(可能性)并不小于统计上公认的概率水平。显著性检验中注意的几个问题显著性检验的结论小概率原理:一个事件如果发生的概率很小,那么可认为它在一次实验中是不会发生的 具有概率性质的反证法Logic from absurd premises. -HegelI think, therefore I am. -DescartesThe Man F

52、rom Earth & Phone Booth- THINKING MANS MOVIES! VERY DEEP AND VERY PHILOSOPHIC THOUGHTFUL. -HIGHLY RECOMMENDED!第三章 方差分析变差:生产和试验过程受到诸多因素的影响,结果因此有差异方差分析:确定引起结果有差异的诸因素中各自单独作用和交互作用的方法总变差条件变差试验误差原料、温度、压力、配比、化验员。随机因素的干扰、测量误差,即随机误差第三章 方差分析方差分析 ( analysis of variance, ANOVA ) 由数据的总变差中分出试验误差和条件变差,并赋予它们数量表示优点:

53、不受对比组数限制可同时分析多种因素的作用可分析因素间的交互作用 3.1 单因素方差分析方差分析的假定:样本观测值的随机性样本间的相互独立性样本分别服从N(i,i),即正态性样本方差具有齐性,即方差齐性试验数据是各因素(包括随机误差)综合作用结果,各因素的效应是可以迭加的,即可加性 3.1 单因素方差分析因素:影响试验结果的条件水平:因素在试验时分的等级处理:同一个试验条件下的试验根据试验影响因素的数目,方差分析可分为单因素方差分析和多因素方差分析 3.1 单因素方差分析观测得到的试验数据:X11 X12 X1nX21 X22 X2nXa1 Xa2 Xani=1, 2, a 水平数(分组数) j

54、=1, 2, n 重复次数(等重复试验)总试验次数 N=an 3.1 单因素方差分析符号定义和说明:第i组观测值之和任一观测值第i组观测值的均值所有观测值的总和总均值 3.1 单因素方差分析方差分析的数据可用数据结构式表示:总均值总变差条件变差误差变差总均值误差效应水平效应 3.1 单因素方差分析变差平方和 SS(sum of squares):总平方和因素平方和误差平方和 3.1 单因素方差分析自由度和方差: 3.1 单因素方差分析水平效应(组间效应)固定(效应)模型随机(效应)模型水平人为选定因素的水平可控i 效应值为确定数值结论只适用于特定水平众多水平中随机选出a个水平因素的水平不完全可

55、控ai 效应值是一个随机变量结论可推广到总体的所有水平【 I型 ANOVA 】【 II型 ANOVA 】 3.1 单因素方差分析符号说明:MSA 观测的组间方差MSe 观测的组内方差E(MSA) 组间的期望方差E(MSe) 组内的期望方差 因素A的方差成分 因素A的方差成分的估计值 误差的方差成分 误差的方差成分的估计值MS( ) 单一测定的观测方差 3.1 单因素方差分析随机模型固定模型以观测方差替代期望方差单次测定的观测方差 3.1 单因素方差分析 例 从数百名学生中随机选出4名学生,每人做4份试验测定水中铁含量(ppm)(仪器经过校准,使用相同试剂),试确定学生测定值是否有显著差异。No

56、.xijxixixxSi219.89.79.99.639.09.75152.79.5440.0166629.19.09.39.236.69.150.0166639.69.59.79.538.39.5750.00916649.59.69.99.838.89.700.03333 3.1 单因素方差分析方差分析步骤:方差齐性检验平方和、自由度以及方差的计算,方差分析显著性差异所在均值的推断 3.1 单因素方差分析方差齐性检验a) 最大方差比检验 b)巴特莱特方法(Bartlett)平方和、自由度以及方差的计算,方差分析显著性差异所在均值的推断a) Fisher 最小显著差值法(Least Signi

57、ficant Difference, LSD)b) Duncan (胆肯) 多范围检验法方差齐性检验a) 最大方差比检验 3.1 单因素方差分析方差齐性检验b)巴特莱特方法(Bartlett) 3.1 单因素方差分析 3.1 单因素方差分析(2) 平方和、自由度以及方差的计算,方差分析 3.1 单因素方差分析(2) 平方和、自由度以及方差的计算,方差分析 3.1 单因素方差分析ANOVA 表 (方差分析表)变差来源平方和SS自由度V观测方差MS方差比F临界值F(0.01,3,12)结论学生间0.891930.297315.65误差0.2275120.01905.95*总计1.119415 3.

58、1 单因素方差分析No.xijxixixxSi219.89.79.99.639.09.75152.79.5440.0166629.19.09.39.236.69.150.0166639.69.59.79.538.39.5750.00916649.59.69.99.838.89.700.03333 3.1 单因素方差分析显著性差异所在均值的推断a) Fisher 最小显著差值法(Least Significant Difference, LSD)b) Duncan (胆肯) 多范围检验法 3.1 单因素方差分析显著性差异所在均值的推断()风险率 = 1- (1-)n n 检验次数t-test 次数13610风险率0.050.140.240.40 3.1 单因素方差分析Fisher 最小显著差值法Least Significant Difference, LSD 3.2 多因素方差分析因素间的交互作用双因素试验设计分类(classification)a) 交叉分组(cross),又称多边分组b) 系统分组(hierarchic),又称多级分组c) 混合分组 3.2 多因素方差分析双因素交叉分组试验的方差分析:a)无重复b)有重复无重复的试验,方差分析的数据可用数据结构式表示: 3.2 多因素方差分析变差平方和 SS(sum of squares):总平方和因素A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论