版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 样本含量的估计样本含量的估计童新元 中国人民解放军总医院试验设计之三名人格言思而后行思而后行, ,以免做出愚蠢的事以免做出愚蠢的事, ,因为草因为草率的动作和言语率的动作和言语, ,均是卑劣的特征。均是卑劣的特征。 -毕达哥拉斯毕达哥拉斯( (古希腊哲学家古希腊哲学家, ,公元前公元前580-500)580-500)2000年全国第五次人口普查结果,中国年全国第五次人口普查结果,中国0-14岁少年儿童人口为岁少年儿童人口为28979万人,占万人,占总人口总人口22.89%。现某研究要了解中国少。现某研究要了解中国少年儿童的身体、心理和行为状况年儿童的身体、心理和行为状况. 试问怎样进行试问怎
2、样进行?普查普查抽样调查抽样调查 少年儿童现况调查少年儿童现况调查案例案例1 1 北京城市北京城市7-187-18岁儿童青少岁儿童青少年体成分及血脂现况调查年体成分及血脂现况调查 研究者 王筱桂1 孙颖2 曹若湘2 胡小琪1 孙文杰1 王京钟1 中国疾病预防控制中心营养与食品安全所, 北京市宣武区南纬路29号,100050;2 北京疾病预防控制中心学校卫生科2007年6月7日 研究对象和方法研究采取随机整群抽样的方法,调查北京7-18岁在校中小学生共1311人,男生669人,女生642人。按中国学龄儿童青少年超重、肥胖筛查BMI分类标准中超重的BMI参考值对调查对象进行筛查,了解超重和肥胖的总
3、检出率,及其在性别和年龄中的分布情况。案例2 2553名716岁儿童伤害的现况分析作者:李丽萍黄革马小红罗家逸单位:汕头大学医学院卫生学教研室 515031广东省卫生厅及国务院侨办重点学科科研基金资助项目 中华流行病学杂志 1999年第1期第20卷对象与方法对象与方法 采用整群抽样法抽取汕头市区2所小学16年级及1所中学初一、初二年级的所有学生为调查对象,收集自1996年10月1日至1997年9月30日期间儿童伤害发生情况,经预调查后制成统一调查表格,在正式调查前对被列为调查对象的班主任进行统一培训,按统一要求、标准及方法进行调查,如有以下任何一种情况者作为统计之列:经医院诊断为某一种损伤者;
4、由家长或教师对受伤作紧急处置和看护者;因伤休学半天以上者。 对收集的调查表经核查后用Foxpro2.5 for Windows建立数据库,采用SPSS 6.0 for Windows软件包进行统计分析,组间比较采用2检验。表表1不同性别及不同年龄组儿童伤害发生率性别伤害次数7岁10岁1316岁合计例数发生率(%)例数发生 率(%)例数发生率(%)例数发生率(%)男一次伤害6121.4826439.5822058.9854541.16二次伤害93.178412.5912433.2421716.39女一次伤害4315.5820233.3317951.5942434.50二次伤害72.54619.9
5、08424.2115212.37合计一次伤害10418.5746636.6139955.4296937.96二次伤害162.8614 511.3920828.8936914.45结果结果716岁儿童伤害发生率为37.96%,男性儿童伤害发生率明显高于女性(P0.05);38.1%的儿童一年中发生两次以上的伤害。随着年龄的增加发生率呈增长趋势;在发生的伤害类型中,跌伤的发生率占首位;居前4位的伤害原因是玩耍、运动、骑车及走路;伤害发生地点主 要在家中,其次为校内;伤害发生形式以自伤为主,其次为他伤;中度和重度伤害占8%,伤害致残率为1.214/千。案例3 硕士学位论文我国我国儿童儿童青少年心理问
6、题诊断和治疗青少年心理问题诊断和治疗现现况调查况调查 上海交通大学上海交通大学 硕士学位论文硕士学位论文 姓名:姓名:XX 申请学位级别:硕士申请学位级别:硕士 专业:精神病与专业:精神病与精 2007101方法和结果方法 通过现场和邮寄两种方式发放给我国内地633名精神科和儿科相关专业的医生,问卷回收后对数据进行统计分析。结果 我国儿童精神科和心理科相关专业的医生诊断正确率不高。从业医生的水平有待提高。样本含量讨论调查多少人数呢?-即样本含量估计样本含量多大为佳?进行一项科学试验,必须有可重复性即一定的样本含量.样本含量过少,则所得结果不稳定, 检验效能低,结论缺乏充分依据.样本含量过大,将
7、增加研究工作的困难,浪费人力,物力和财力.统计学中并非要求研究者无限追求大样本,但需要足够的样本含量。统计学中样本含量的估计是指在保证研究结论具有一定的可靠性和真实性的前提下,可获得有统计学意义的最少的观察例数.样本含量的估计影响样本含量的因素若要了解中国3千万大学生 的身高.问:要调查多少同学?试验对象的变异程度,标准差;最大容许误差或差值= ;允许的假阳性率(第一类错误的概率):x1.抽样调查样本含量的估计(1)均数的抽样公式: )( 2Sun公式的来源: /unSx均数抽样例子P179例例15-815-8 现要调查社区10岁正常儿童身高情况, 已知该社区正常儿童总数为2万人, 经预前对该
8、区正常儿童的调查测定身高的标准差约6cm, 现调查要求允许误差为0.5cm, 问正式调查时,采用单纯随机抽样需要调查多少人?CHISSCHISS的实现的实现点击点击: :设计设计样本含量的估计样本含量的估计 均数的抽样均数的抽样假定: 第一类错误的概率= 0.05(双侧), 估计标准差s = 6, 允许误差= 0.5所需样本量:需要例数:554结论: 正式调查时,采用单纯随机抽样需要调查554人。练习题:若某地区有100万大学生,现要了解其平均身高.若已知大学生身高的标准差为50CM,要求允许误差不超过3CM, 出现假阳性率不超过5%问:要调查多少同学?(2)率抽样调查的例数估计率的抽样公式
9、(6.13) )1( )(2un公式的来源: )1(unP率抽样例子例例15-9 15-9 现要调查地区65岁以上老年人高血压发病情况, 已知该地区65岁以上老年人总数约1万人, 经预前对该区65岁以上老年人的调查发病率约55%, 现调查要求允许误差为3%, 问正式调查时,需要调查多少人?CHISSCHISS的实现的实现点击点击: :设计设计样本含量的估计样本含量的估计 率的抽样率的抽样解题步骤:进入试验设计模块点击 设计设计实验设计实验设计样本含量样本含量率的抽率的抽样样假定: 第一类错误的概率= 0.05 估计总体率= 0.55 允许误差= 0.03所需样本量: 1057结论:正式调查时,
10、需要调查1057人。1.实验设计的样本含量估计(1)影响样本含量的因素样本含量 n 取决于以下四个因素: 实验对象的标准差(S);最大容许误差或差值,亦称组间的差别 ;假阳性率(第类错误的概率);假阴性率(第类错误的概率);和则需通过专业知识、历史资料或预试验(pilot study)做出估计。和由实验者根据研究目的事先给定定得越小,定得越小,差别越小,标准差越大,所需样本含量就越大。(2)两组样本均数检验的样本含量估计例例15-115-1 用两种处理作动物冠状静脉窦的血流量实验。A处理平均血流量增加1.8mlmin,B处理平均血流量增加2.4mlmin。设两处理的标准差相等,均为1.0mlm
11、in,若0.05,0.10,进行双侧检验,要得出两种处理差别有统计学意义的结论,需多少实验动物?两样本均数检验的样本含量估计样本含量估计公式 (6.15) )( )(22Stuun解:本例 2.41.80.6, s 1.0, 0.05, 0.1。 查u值表得,u0.051.96,u0.1 1.282,代入上式得n=58.4。故可认为每组需59只,两组共需118只动物。CHISSCHISS的实现的实现点击点击: :设计设计样本含量的估计样本含量的估计 两样本均数的检验两样本均数的检验两组均数检验样本含量估计:假定: 第一类错误的概率= 0.05(单侧检验) 第二类错误的概率= 0.05 两试验组
12、均数差值= 0.6 两试验组合并标准差s= 1每组所需样本含量:每组例数:59(3)配对差值均数比较的样本量估配对差值均数比较的样本量估计计 例例 15-215-2研究某种降血压药的疗效,经过预试验得知用药前后血压差值的标准差为10mmHg,用药前后血压差值3 mmHg,现要做正式临床试验,问:进行正式临床试验, 需要观测多少病人? 1.样本含量估计公式 (6.14) )( )(2Suun单样本均数的检验样本含量公式与此相单样本均数的检验样本含量公式与此相同同CHISSCHISS的实现的实现点击点击: :设计设计样本含量的估计样本含量的估计 单样本均数的检验单样本均数的检验假定: 第一类错误的
13、概率= 0.05(双侧检验) 第二类错误的概率= 0.1 试验组与总体均数差值= 3 个体间标准差s= 10所需样本含量:样本含量:117例例 15-3 15-3 据文献报道,脑血栓病人血浆纤维蛋白浓度的均数和标准差分别为4 (g/L)和 3.5(g/L)。现试验某治疗措施,要使血浆纤维蛋白浓度平均下降 1(g/L)才有专业意义,问正式试验时,至少需要观察多少病例?CHISSCHISS的实现的实现点击点击: :设计设计样本含量的估计样本含量的估计 单样本均数的检验单样本均数的检验假定: 第一类错误的概率= 0.05(双侧检验) 第二类错误的概率= 0.1 试验组与总体均数差值= 1 个体间标准
14、差s= 3.5所需样本含量:样本含量:129(4)多组样本均数检验的样本含量多组样本均数检验的样本含量估计估计例例 15-4 15-4 今今研究四种药物的退热效果,经预试验得到药物退热时间(天)的S分别为31.5,62,73, 93.5。问正式试验时,各组需观察多少病例?CHISSCHISS的实现:的实现:点击点击 设计设计样本含量的估计样本含量的估计 多样本均数的检验多样本均数的检验CHISSCHISS的实现的实现点击点击: :设计设计样本含量的估计样本含量的估计 多个样本均数的检验多个样本均数的检验假定: 第一类错误的概率= 0.05(双侧), 第二类错误的概率= 0.10 组号 均数 标
15、准差 1 3.00 1.500 2 6.00 2.000 3 7.00 3.000 4 9.00 3.500结果: 每组所需样本量:每组例数:7(5)单组样本率检验的样本含量估计例15-5 已知用常规方法治疗某病的有效率是70%,现试验一种新的治疗方法,预计有效率是80% 。给定0.05,0.20,问至少需要观察多少病例?单样本率检验的样本含量估计1.样本含量估计公式 (6.16) CHISSCHISS的实现:的实现:点击点击 设计设计样本含量的估计样本含量的估计 单样本率的检验单样本率的检验)1( )(2uunCHISSCHISS的实现的实现点击点击: :设计设计样本含量的估计样本含量的估计
16、 单个样本率的检验单个样本率的检验单样本率检验样本含量估计:假定: 第一类错误的概率= 0.05(单侧检验) 第二类错误的概率= 0.10 历史对照总体率 = 0.7 试验组总体率 = 0.8所需样本含量:样本含量:165(5)两组样本率检验的样本含量估计例例15-615-6 某药的临床试验中, 经预试验知,试验药和对照药的有效率分别为70和85。现进行临床试验,设,问每组需要观察多少病例才能发现两种方法的有效率有15%的差别?两样本率检验的样本含量估计1.样本含量估计公式 (6.17) CHISSCHISS的实现:的实现:点击点击 设计设计样本含量的估计样本含量的估计 两样本率的检验两样本率
17、的检验)21 ( 2) 11 ( 1 )(2uunCHISSCHISS的实现的实现点击点击: :设计设计样本含量的估计样本含量的估计 两个样本率的检验两个样本率的检验两样本率检验样本含量估计:假定: 第一类错误的概率= 0.05(单侧检验) 第二类错误的概率= 0.10 第一组总体率 = 0.7 第二组总体率 = 0.85每组所需样本含量:每组例数:135(6)多组样本率检验的样本含量估计例15-7 欲研究5种治疗方法A,B,C,D和E的治疗效果,经预试验观察得,5种疗法的有效率分别70%,55%,60%,65%,80%,,问正式试验需观察多少例病人?CHISSCHISS的实现的实现点击点击:
18、 :设计设计样本含量的估计样本含量的估计 多个样本率的检验多个样本率的检验假定: 第一类错误的概率= 0.05(双侧), 第二类错误的概率= 0.10 组数 = 5, 最小率 = 0.55, 最大率 = 0.8结果: 每组所需样本含量:105三三 临床试验样本量的估计临床试验样本量的估计在新药临床试验中,各期临床试验受试人数的估计可按两种方式进行。一是根据试验需要,按统计学要求估计试验例数。二是按SFDA公布实施的新药审批办法中的规定例数进行。办法中规定如下:I I期期临床试验受试人数的估计单次给药耐受性试验中, 剂量组常设5个单次给药的剂量组,最小与最大剂量之间设3组,剂量与临床接近的组人数
19、8至10人,其余各组每组5至6人。I期单次给药药代动力学试验和连续给药药代动力学与耐受性试验中,选择符合入选标准的健康男性青年志愿者8至10名。 期期临床试验受试人数的估计 期期 试验按规定需进行盲法随机对照试验100对,即试验药与对照药各100例共计200例。根据试验需要,按统计学要求估算试验例数。期期临床试验受试人数的估计期期 临床试验病例数试验组300例,未具体规定对照组的例数。可根据试验药适应症多少、病人来源多寡来考虑。单一适应症,一般可考虑试验组100例,对照组100例(1:1),试验组另200例不设对照,进行无对照开放试验。有2种以上主要适应症时,可考虑试验组与对照组各200例(1
20、:1),试验组另100例不设对照,进行无对照开放试验。若有条件,试验组300例全部设对照。 期期临床试验受试人数的估计期期 临床试验病例按SFDA规定,要求样本量大于2000例。 注 1 多个指标的样本含量估计 实际工作中往往要就同一观察对象,同时调查多个指标,这就需要对各指标分别估计以后,再加以综合判定。2 样本量的现实考虑统计学计算研究的阶段研究的层次经费,时间和成本各类特别要求四、 检验的效能检验的效能(power),即两总体确有差别时,通过该试验能发现它们有差别的能力.检验的效能计算公式:power=1- 一般,若一个试验检验的效能低于75%, 则假阴性率较大,试验效能低.1两样本均数
21、比较的功效例例15-1015-10用采随机对照试验研究某降压药的作用 , 两 组 患 者 服 用 4 周 后 收 缩 压 的 下 降 值(mmHg),如表15-1。:检验结果为t=-1.062, P= 0.29860.05,无统计学意义,认为两药降压效果无差别。问该结论是否可靠?分组n均数标准差试验12142.2对照15132.6CHISSCHISS实现:实现:点击点击 设计设计检验效能检验效能 两样本均数的比较两样本均数的比较检验水准检验水准= 0.05(双侧检验双侧检验) )第一组例数:第一组例数:12, 12, 均数:均数:14, 14, 标准差:标准差:2.22.2第二组例数:第二组例
22、数:15, 15, 均数:均数:13, 13, 标准差:标准差:2.62.6结论:把握度:结论:把握度:0.185, 0.185, 检验效能不充分,检验效能不充分,结论的假阴性可能性大。结论的假阴性可能性大。例例15-11 15-11 用抗凝剂治疗抢救10例心肌梗死病人,结果7人存活, 未用抗凝剂治疗抢救10例心肌梗死病人,结果3人存活,经检验P0.05,因而结论为两组总有效率无差异。问检验效能如何? 2.两样率比较的功效CHISSCHISS实现:实现:点击点击 设计设计检验效能检验效能 两样本率的比较两样本率的比较两样本率比较检验效能两样本率比较检验效能: : 检验水准检验水准= 0.05(
23、双侧检验双侧检验) ) 第一组例数:第一组例数:10, 10, 分子例数:分子例数:7 7 第二组例数:第二组例数:10, 10, 分子例数:分子例数:3 3结论:把握度:结论:把握度:0.426, 0.426, 检验效能不充分,结检验效能不充分,结论的假阴性可能性大。论的假阴性可能性大。例例15-12 15-12 今测得8例糖尿病患者治疗前为10.172.77,治疗后为8.662.21,差值为1.513.09。检验结果t=0.794,P0.05,无统计学意义,认为该药无降压效果,问该结论是否可靠?3.配对计量数据比较的功效CHISSCHISS实现:实现:点击点击 设计设计检验效能检验效能 配对计量资料比较配对计量资料比较配对计量资料比较检验效能配对计量资料比较检验效能: : 检验水准检验水准= 0.05(双侧检验双侧检验) ) 对子数:对子数:8, 8, 差数均数:差数均数:1.51, 1.51, 标准差:标准差:3.093.09结论
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度物业小区安全生产责任书模板制作方法3篇
- 二零二五年度商品房购买意向金合同细则及支付规范6篇
- 2025年度虚拟偶像制作项目客户服务合同大全3篇
- 2025年度教育培训合作协议:培训机构与讲师之间的合作关系3篇
- 2024年铁路住房购买协议模板一
- 圣诞节周记范文汇编五篇
- 2025版鸡肉产品跨境电商进出口代理合同2篇
- 2024年餐馆食材存储方法保密协议3篇
- 学校个人助学金申请书
- 2025版新型压路机销售与环保评估合同2篇
- 房地产估计第八章成本法练习题参考
- 2023年广东罗浮山旅游集团有限公司招聘笔试题库及答案解析
- 《社会主义核心价值观》优秀课件
- DB11-T1835-2021 给水排水管道工程施工技术规程高清最新版
- 《妊娠期糖尿病患者个案护理体会(论文)3500字》
- 解剖篇2-1内脏系统消化呼吸生理学
- 《小学生错别字原因及对策研究(论文)》
- 便携式气体检测报警仪管理制度
- 酒店安全的管理制度
- (大洁王)化学品安全技术说明书
- 2022年科学道德与学术规范知识竞赛决赛题库(含答案)
评论
0/150
提交评论