版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学统计学
第一章绪论
1医学统计学
第一章绪论
1www.xybms第一节统计学与医学统计方法
2第一节2一.统计与统计学的定义
一.统计与统计学的定义
3一.统计与统计学的定义
一.统计与统计学的定义
什么是卫生统计学科技的迅速发展,信息的大量产生。数据作为信息的主要载体广泛存在。面对纷乱复杂的数据世界我们该如何去认识,这就要借助统计学这个工具,在混沌中发现规律。统计学就是研究数据及其存在规律的科学。4什么是卫生统计学41.统计
是一种对客观现象数量方面进行的调查研究活动;是收集、整理、分析、推断、判断等认识活动的总称。数据汇总仅仅是统计工作的一小部分内容。51.统计
是一种对客观现象数量方面进行的调查研究活动;5ww2.统计学作为一门学科的定义是:关于数据收集、表达和分析的普遍原理和方法。
62.统计学作为一门学科的定义是:关于数据收集、表达和分析的普3.医学统计学
是用统计学原理和方法研究生物医学问题的一门学科。医学统计方法在医学研究中的运用主要有三个方面:73.医学统计学7www.xybms工作生活中常见的统计学问题如何判断药物的疗效?(假设检验)明天是否下雨?体育彩票能否中奖?(概率论)子女为什么象父母,其强度有多大?(相关与回归)美国的民意测验是如何进行的?(设计,抽样)中国的市场调查的可信性有多大?(现场调查)
统计学是对令人困惑费解的数字问题做出设想的艺术。8工作生活中常见的统计学问题如何判断药物的疗效?(假设检验)8①以正确的方式收集数据,如实验设计、调查设计等。②描述数据的统计特征,如数据化简、统计指标的选择与计算、统计结果的表达等。③统计分析及得出正确结论,如根据概率分布,对实验和观察结果存在的差异和关联作出统计推断。
9①以正确的方式收集数据,如实验设计、调查设计等。9www.x二.统计学的发展简史
10二.统计学的发展简史
10统计计算历史:笔、纸、算盘、对数表、乘方表、计算尺、计算器等统计发展历史:德国数学家GUASS(1777-1855)数字计算题,表现出极高的统计计算天赋。最先提出“相关与回归”的英国人类学家Galton,在人类学和优生学研究中萌发的统计思想,其中最重要的一个:wheneveryoucando,count。小样本均数Student-t检验的发现者、英国生物统计学家Gosset(1876-1937)为了解决t检验的理论和应用问题,通过使用卡片进行抽样试验和计算统计量得出t分布曲线,成为Monte-Carlo计算方法的先行者。11统计计算历史:笔、纸、算盘、对数表、乘方表、计算尺、计算器等现代实验设计方法和统计分析技术的奠基者、英国生物统计学家fisher(1890-1962)在20世纪20年代撰写的实验设计和统计方法专著时,因不可能计算出所有小概率对应的t分布和F分布的临界值,只好给出了a=0.05,0.01时对应的t分布和F分布的临界值表。令他未曾想到的是这种因统计计算方法的限制而人为i设定的两个数字,至今仍然被许多人当作小概率的唯一数量标准。因此,Fisher的同事、卡方检验、“Yates校正”公式的提出者Yates(1902-1994)强烈主张统计学家使用电子计算机,并说:Tobeagoodtheoeticalstatisticianonemustalsocompute,andmustthereforehavethebestcomputingaids.12现代实验设计方法和统计分析技术的奠基者、英国生物统计学家fi20世纪20年代,英国统计学家R.A.Fisher爵士(1890-1962)创立了实验设计方法和统计分析技术,奠定现代生物统计的基础。1948年,英国发表了评价链霉素治疗肺结核疗效的随机对照的临床试验报告,第一次采用生物统计方法进行临床干预试验。1948年,郭祖超教授(1912~1999)编著的《医学与生物统计方法》,是我国第一部医学统计方法的教科书。20世纪20年代,英国统计学家R.A.Fisher爵士将计算机用于统计计算,主要是通过统计软件实现;SASandSPSS14141.实例
遗传学家F.Galton爵士(1822-1911)对上千家庭父亲身高和儿子身高的观察发现遗传的“回归”现象1960年英国医生Doll,Hill等发现吸烟与肺癌有关1.实例遗传学家F.Galton爵士(1822-12.医学论文中的统计学问题60年代到80年代,国外医学杂志调查结果:有统计错误的论文20%~72%。1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数据分析方法误用达55.7%。2.医学论文中的统计学问题60年代到80年代,国外医学杂志3.伪造统计数据违反科学道德1976年NewScience杂志关于科研舞弊行为的调查(1)74%的调查表反映有不正当修改数据的情况(2)17%拼凑实验结果(3)7%凭空捏造数据(4)2%故意曲解结果3.伪造统计数据违反科学道德1976年NewSciencFancystatisticalmethodscannotrescuegarbagedataFancystatisticalmethodscanhelpyougaininsightintoyourdata,overandabovewhatseemsobviousonitsfaceYoushouldalwaysworryaboutwhetherthesampledresultsarerepresentativeofthepopulation,andwhetheryoursampleallowsyoutomakeinferencesaboutthepopulation.AWarning!Fancystatisticalmethodscann1.早期
公元前3050年古埃及人为修建金字塔筹集建筑费,对全国的人口和财产进行了普查。历史
191.早期历史19
2.近代
19世纪,应用数学家为解决赌徒们在博彩中出现的输赢概率问题逐渐形成和发展了概率论,从而为统计学的发展奠定了坚实的基础。20
20
3.现代
计算机和统计软件如SAS、SPSS的出现使统计学得到了突飞猛进的发展。213.现代21统计方法是建立在现代科学方法之上,由统计学理论指导的数据收集、表达和分析的方法,现代科学方法可以概括为以下几点:22统计方法是建立在现代科学方法之上,由统计问题的识别与表达(发现问题、提出问题)。搜集有关资料。通过归纳得出假说:因果联系及重要的模式。从假说作出演绎:进行实验或收集更多的资料。推理:结果与演绎相符,假说得到加强,但不是被证明(例某地区食盐与高血压的关系)。23问题的识别与表达(发现问题、提出问题)。23www.xybm三.统计学的特点
医学+数学,侧重医学,淡化数学。用数量反映质量,如平均期望寿命,解放前为35岁,现在70岁,可反映国家医疗卫生服务总体水平的提高。大量观察+实验数据分析→可以揭示医学规律。
24三.统计学的特点
医学+数学,侧重医学,淡化数学。24www
第二节
统计工作的基本步骤25
251.专业设计:选题、建立假说、确定研究对象和技术方法等→个性
2.统计设计:围绕专业设计确定统计设类型、样本大小、分组方法、统计分析指标及统计分析方法。
一、设计
261.专业设计:选题、建立假说、确定研究对象和技术方法等→二、收集资料
(一)资料来源第一手资料
①
经常性:统计报表(死亡登记、疫情报告等),工作记录(病历、化验);②一时性:专题调查、实验或临床试验。第二手资料:已公布的资料,如数据银行、全国、全省卫生统计资料。
27二、收集资料
(一)资料来源27(二)资料要求
1.完整:观察单位及观察项目完整。
观察单位:最基本的获取数据的单元。可以是一个体,亦可以是一个单位、家庭、地区,一批样品,一个采样点。
28(二)资料要求
1.完整:观察单位及观察项目完整。
2.准确:即真实、可靠。真实是统计学的灵魂。
3.及时:即时限性。如人口普查规定调查开始日期和截止日期。292.准确:即真实、可靠。真实是统计学的灵魂。
3.及时三.整理资料
整理资料即原始数据的条理化、系统化的过程。所采取的手段→合理化分组,目的→实现专业目标。质分组:按事物的属性或性质分组→分类变量;量分组:按数据的大小→数值变量。30三.整理资料
整理资料即原始数据的条理化、系四.分析资料
1.统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行测定和描述。2.统计推断:用样本信息推断总体特征:①参数估计,②假设检验。31四.分析资料
1.统计描述:用统计指标、统计图表对资料的数第三节统计资料的类型
有三种类型的资料:计量资料,计数资料,等级资料
基本概念:变量及变量值,研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量,变量的测得值叫变量值(也叫观察值),称为资料。按变量值的性质可将资料分为定量资料和定性资料。32第三节统计资料的类型有三种类型的资料:计量资料,1.计量资料定义:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。例如:体重与身高特点:有度量衡单位多为连续性资料(通过测量得到)331.计量资料定义:通过度量衡的方法,测量每一个观察单位的某定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。特点:没有度量衡单位多为间断性资料
(通过枚举或记数得来)
2.计数资料34定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各定义:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。特点:每一个观察单位没有确切值各组之间有性质上的差别或程度上的不同。3.等级资料353.等级资料35(三)资料的转化(变量类型的转化)
数值变量分类变量
36(三)资料的转化(变量类型的转化)
数值变量例如:测得5人的WBC(个/m3)数如下:
300060005000800012000数值变量过低正常正常正常异常分类变量若按正常3人,异常2人分组→二分类变量若按过低1人,正常3人,过高1人分组→等级资料37例如:测得5人的WBC(个/m3)数如下:37
*提示:
①多途径;②尽量用定量指标,否则损失信息量;③定性指标可转化为定量指标,但较粗糙。38*提示:①多途径;38第四节统计学中的几个基本概念1、变异2、总体与样本3、抽样方法4、误差5、频率与概率
39第四节统计学中的几个基本概念1、变异39www.xybm1.变异
同质事物个体间的差异。来源于一些未加控制或无法控制的甚至不明原因的因素。是统计学存在的基础,从本质上说,统计学就是研究变异的科学。
401.变异40对变异的认识:
(1)自然变异的范围是有限的,可以度量;参差不齐的测量值,通过大量重复观测可以显现出统计分布规律,如表1-1数据的变异特征至少有以下两点:41对变异的认识:
(1)自然变异的范围是有限的,可以①变异的范围在3.2~6.2;②有明显的统计分布规律,4.7~5.0的人数最多。根据表1-1的数据,统计上还可以进一步推论出正常成年男子红细胞计数的正常值参考范围。42①变异的范围在3.2~6.2;42表1-1120名正常成年男子红细胞计数值
84.314.094.414.334.584.245.454.324.844.994.794.905.094.645.145.464.635.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.824.444.134.434.025.865.125.363.864.685.485.314.534.834.113.263.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69最大值=6.18,最小值=3.29,极差=2.89。算术均数=4.72,标准差=0.5743表1-1120名正常成年男子红细胞计数值5.125.
(2)用统计的方法可以确定出所有研究对象的变异范围,如正常成年男性的细胞数的范围。身高范围等等。(3)没有变异就没有统计,变异使统计有了用武之地。44(2)用统计的方法可以确定出所有研究对象的变异范围4545总体:根据研究目的确定的研究对象的全体。当研究有具体而明确的指标时,总体是指该项变量植的全体。样本:总体中有代表性的一部分。观察单位(个体):最基本的研究单位分为有限总体和无限总体。由于调查总体的不可能性、巨大性和没必要。对其中的一部分对象进行调查----样本(总体与样本的关系。举例。)样本选择的原则--??样本量(samplesize)2.总体与样本(populationandsample)46总体:根据研究目的确定的研究对象的全体。当研究有具体而明确的populationandsample总体:根据研究目的确定的同质研究对象的全体(集合)。分有限总体与无限总体样本:从总体中随机抽取的部分观察单位
populationandsample总体:根据研究目的随机抽样randomsampling为了保证样本的可靠性和代表性,需要采用随机的抽样方法(在总体中每个个体具有相同的机会被抽到)。随机抽样《医学统计学》课件3、抽样方法选择样本的方法:概率抽样和非概率抽样等概率抽样非等概率抽样简单随机抽样系统抽样分层抽样整群抽样503、抽样方法选择样本的方法:概率抽样和非概率抽样等概率抽4.误差误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下二种:系统误差和随机误差(随机测量误差,抽样误差)。(1)系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。特点:具有累加性(2).随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。特点:随测量次数参加而减小。514.误差误差:统计上所说的误差泛指测量值与真值之在消除了系统误差的前提下,由于非人为的偶然因素,对于同一样本多次测定结果不完全一样,结果有时偏大有时偏小,没有倾向性,这种误差叫随机测量误差。特点:没有倾向性,多次测量计算平均值可以减小甚至消除随机测量误差。A、随机测量误差52在消除了系统误差的前提下,由于非人为的偶然因素,对
这类误差可以通过实验设计和技术措施来消除或使之减少。
观察性研究由于组间不可比性产生的系统误差称为偏倚(bias),如吸烟组的平均年龄大于吸烟组,两组死亡率的差异包含年龄偏倚。53这类误差可以通过实验设计和技术措施来消除或使之减少。由于抽样原因造成的样本指标与总体指标之间的差别。特点:有抽样抽样误差就不可避免。统计上可以计算并在一定范围内控制抽样误差。B、抽样误差54B、抽样误差54
(1)改进抽样方法,增加样本的代表性。样本量n相等的情况下:整群抽样>单纯随机抽样>系统抽样>分层抽样(2)增加样本量n(3)选择变异程度较小的研究指标减少抽样误差的方法:55减少抽样误5.概率(probability)与频率
抛一枚硬币,是否国徽面一定向上?明天的股市升还是降?某患者痊愈的可能性?这些问题的答案都不可能绝对。概念:描述随机事件发生的可能性大小的数值,常用P来表示。大小:P的大小在0和1之间,越接近于1,说明发生的可能性越大,越接近于0,说明发生的可能性越小。统计学中的许多结论是带有概率性质的,通常一个事件的发生小于5%,就叫小概率事件。频率:在实际工作中,当观察单位的例数足够多时,可以用频率来代替概率。频率是概率的估计值。565.概率(probability)与频率
抛一枚硬币,是
1.频率(frequency),假设在相同条件下,独立地重复做n次试验,A在n次试验中出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率。当试验重复很多次时,有
P(A)≈m/n(1-1)571.频率(frequency),假设在相同条件
2.概率又称为机率(probability),是度量某一随机事件A发生可能性大小的一个数值,记作P(A),0<P(A)<1。
P(A)越大,A发生的可能性越大,反之亦然。当时或时,A是必然发生或必然不发生的非随机事件。582.概率又称为机率(probability),是度量某一
频率是就样本而言的,而概率从总体的意义上说的,m/n是概率P(A)的估计值。试验次数越多,估计越可靠。5959
3.小概率事件,通常认为是不可能发生的事件。603.小概率事件,通常认为是不可能发生的事件。60如何学习统计学
(特点:灵活、抽象)理解基本的统计原理培养统计思维能力:抽象的,逻辑推理多练习:课堂练习,课下做习题
联系实际:阅读文献工作和生活实际61如何学习统计学
(特点:灵活、抽象)理解基本的统计原理61w1.某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高也大于乙班?为什么?2.用A,B两种药物分别治疗一批患者。如果A药的治愈率高于B药,证明A药的疗效优于B药。这种说法对吗?为什么?3.既然观察对比不可避免地存在偏倚,为什么不能用干预试验取代观察对比?思考题1.某年级甲班、乙班各有男生50人。从两个班各抽取10人测医学统计学
第一章绪论
63医学统计学
第一章绪论
1www.xybms第一节统计学与医学统计方法
64第一节2一.统计与统计学的定义
一.统计与统计学的定义
65一.统计与统计学的定义
一.统计与统计学的定义
什么是卫生统计学科技的迅速发展,信息的大量产生。数据作为信息的主要载体广泛存在。面对纷乱复杂的数据世界我们该如何去认识,这就要借助统计学这个工具,在混沌中发现规律。统计学就是研究数据及其存在规律的科学。66什么是卫生统计学41.统计
是一种对客观现象数量方面进行的调查研究活动;是收集、整理、分析、推断、判断等认识活动的总称。数据汇总仅仅是统计工作的一小部分内容。671.统计
是一种对客观现象数量方面进行的调查研究活动;5ww2.统计学作为一门学科的定义是:关于数据收集、表达和分析的普遍原理和方法。
682.统计学作为一门学科的定义是:关于数据收集、表达和分析的普3.医学统计学
是用统计学原理和方法研究生物医学问题的一门学科。医学统计方法在医学研究中的运用主要有三个方面:693.医学统计学7www.xybms工作生活中常见的统计学问题如何判断药物的疗效?(假设检验)明天是否下雨?体育彩票能否中奖?(概率论)子女为什么象父母,其强度有多大?(相关与回归)美国的民意测验是如何进行的?(设计,抽样)中国的市场调查的可信性有多大?(现场调查)
统计学是对令人困惑费解的数字问题做出设想的艺术。70工作生活中常见的统计学问题如何判断药物的疗效?(假设检验)8①以正确的方式收集数据,如实验设计、调查设计等。②描述数据的统计特征,如数据化简、统计指标的选择与计算、统计结果的表达等。③统计分析及得出正确结论,如根据概率分布,对实验和观察结果存在的差异和关联作出统计推断。
71①以正确的方式收集数据,如实验设计、调查设计等。9www.x二.统计学的发展简史
72二.统计学的发展简史
10统计计算历史:笔、纸、算盘、对数表、乘方表、计算尺、计算器等统计发展历史:德国数学家GUASS(1777-1855)数字计算题,表现出极高的统计计算天赋。最先提出“相关与回归”的英国人类学家Galton,在人类学和优生学研究中萌发的统计思想,其中最重要的一个:wheneveryoucando,count。小样本均数Student-t检验的发现者、英国生物统计学家Gosset(1876-1937)为了解决t检验的理论和应用问题,通过使用卡片进行抽样试验和计算统计量得出t分布曲线,成为Monte-Carlo计算方法的先行者。73统计计算历史:笔、纸、算盘、对数表、乘方表、计算尺、计算器等现代实验设计方法和统计分析技术的奠基者、英国生物统计学家fisher(1890-1962)在20世纪20年代撰写的实验设计和统计方法专著时,因不可能计算出所有小概率对应的t分布和F分布的临界值,只好给出了a=0.05,0.01时对应的t分布和F分布的临界值表。令他未曾想到的是这种因统计计算方法的限制而人为i设定的两个数字,至今仍然被许多人当作小概率的唯一数量标准。因此,Fisher的同事、卡方检验、“Yates校正”公式的提出者Yates(1902-1994)强烈主张统计学家使用电子计算机,并说:Tobeagoodtheoeticalstatisticianonemustalsocompute,andmustthereforehavethebestcomputingaids.74现代实验设计方法和统计分析技术的奠基者、英国生物统计学家fi20世纪20年代,英国统计学家R.A.Fisher爵士(1890-1962)创立了实验设计方法和统计分析技术,奠定现代生物统计的基础。1948年,英国发表了评价链霉素治疗肺结核疗效的随机对照的临床试验报告,第一次采用生物统计方法进行临床干预试验。1948年,郭祖超教授(1912~1999)编著的《医学与生物统计方法》,是我国第一部医学统计方法的教科书。20世纪20年代,英国统计学家R.A.Fisher爵士将计算机用于统计计算,主要是通过统计软件实现;SASandSPSS76141.实例
遗传学家F.Galton爵士(1822-1911)对上千家庭父亲身高和儿子身高的观察发现遗传的“回归”现象1960年英国医生Doll,Hill等发现吸烟与肺癌有关1.实例遗传学家F.Galton爵士(1822-12.医学论文中的统计学问题60年代到80年代,国外医学杂志调查结果:有统计错误的论文20%~72%。1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数据分析方法误用达55.7%。2.医学论文中的统计学问题60年代到80年代,国外医学杂志3.伪造统计数据违反科学道德1976年NewScience杂志关于科研舞弊行为的调查(1)74%的调查表反映有不正当修改数据的情况(2)17%拼凑实验结果(3)7%凭空捏造数据(4)2%故意曲解结果3.伪造统计数据违反科学道德1976年NewSciencFancystatisticalmethodscannotrescuegarbagedataFancystatisticalmethodscanhelpyougaininsightintoyourdata,overandabovewhatseemsobviousonitsfaceYoushouldalwaysworryaboutwhetherthesampledresultsarerepresentativeofthepopulation,andwhetheryoursampleallowsyoutomakeinferencesaboutthepopulation.AWarning!Fancystatisticalmethodscann1.早期
公元前3050年古埃及人为修建金字塔筹集建筑费,对全国的人口和财产进行了普查。历史
811.早期历史19
2.近代
19世纪,应用数学家为解决赌徒们在博彩中出现的输赢概率问题逐渐形成和发展了概率论,从而为统计学的发展奠定了坚实的基础。82
20
3.现代
计算机和统计软件如SAS、SPSS的出现使统计学得到了突飞猛进的发展。833.现代21统计方法是建立在现代科学方法之上,由统计学理论指导的数据收集、表达和分析的方法,现代科学方法可以概括为以下几点:84统计方法是建立在现代科学方法之上,由统计问题的识别与表达(发现问题、提出问题)。搜集有关资料。通过归纳得出假说:因果联系及重要的模式。从假说作出演绎:进行实验或收集更多的资料。推理:结果与演绎相符,假说得到加强,但不是被证明(例某地区食盐与高血压的关系)。85问题的识别与表达(发现问题、提出问题)。23www.xybm三.统计学的特点
医学+数学,侧重医学,淡化数学。用数量反映质量,如平均期望寿命,解放前为35岁,现在70岁,可反映国家医疗卫生服务总体水平的提高。大量观察+实验数据分析→可以揭示医学规律。
86三.统计学的特点
医学+数学,侧重医学,淡化数学。24www
第二节
统计工作的基本步骤87
251.专业设计:选题、建立假说、确定研究对象和技术方法等→个性
2.统计设计:围绕专业设计确定统计设类型、样本大小、分组方法、统计分析指标及统计分析方法。
一、设计
881.专业设计:选题、建立假说、确定研究对象和技术方法等→二、收集资料
(一)资料来源第一手资料
①
经常性:统计报表(死亡登记、疫情报告等),工作记录(病历、化验);②一时性:专题调查、实验或临床试验。第二手资料:已公布的资料,如数据银行、全国、全省卫生统计资料。
89二、收集资料
(一)资料来源27(二)资料要求
1.完整:观察单位及观察项目完整。
观察单位:最基本的获取数据的单元。可以是一个体,亦可以是一个单位、家庭、地区,一批样品,一个采样点。
90(二)资料要求
1.完整:观察单位及观察项目完整。
2.准确:即真实、可靠。真实是统计学的灵魂。
3.及时:即时限性。如人口普查规定调查开始日期和截止日期。912.准确:即真实、可靠。真实是统计学的灵魂。
3.及时三.整理资料
整理资料即原始数据的条理化、系统化的过程。所采取的手段→合理化分组,目的→实现专业目标。质分组:按事物的属性或性质分组→分类变量;量分组:按数据的大小→数值变量。92三.整理资料
整理资料即原始数据的条理化、系四.分析资料
1.统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行测定和描述。2.统计推断:用样本信息推断总体特征:①参数估计,②假设检验。93四.分析资料
1.统计描述:用统计指标、统计图表对资料的数第三节统计资料的类型
有三种类型的资料:计量资料,计数资料,等级资料
基本概念:变量及变量值,研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量,变量的测得值叫变量值(也叫观察值),称为资料。按变量值的性质可将资料分为定量资料和定性资料。94第三节统计资料的类型有三种类型的资料:计量资料,1.计量资料定义:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。例如:体重与身高特点:有度量衡单位多为连续性资料(通过测量得到)951.计量资料定义:通过度量衡的方法,测量每一个观察单位的某定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。特点:没有度量衡单位多为间断性资料
(通过枚举或记数得来)
2.计数资料96定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各定义:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。特点:每一个观察单位没有确切值各组之间有性质上的差别或程度上的不同。3.等级资料973.等级资料35(三)资料的转化(变量类型的转化)
数值变量分类变量
98(三)资料的转化(变量类型的转化)
数值变量例如:测得5人的WBC(个/m3)数如下:
300060005000800012000数值变量过低正常正常正常异常分类变量若按正常3人,异常2人分组→二分类变量若按过低1人,正常3人,过高1人分组→等级资料99例如:测得5人的WBC(个/m3)数如下:37
*提示:
①多途径;②尽量用定量指标,否则损失信息量;③定性指标可转化为定量指标,但较粗糙。100*提示:①多途径;38第四节统计学中的几个基本概念1、变异2、总体与样本3、抽样方法4、误差5、频率与概率
101第四节统计学中的几个基本概念1、变异39www.xybm1.变异
同质事物个体间的差异。来源于一些未加控制或无法控制的甚至不明原因的因素。是统计学存在的基础,从本质上说,统计学就是研究变异的科学。
1021.变异40对变异的认识:
(1)自然变异的范围是有限的,可以度量;参差不齐的测量值,通过大量重复观测可以显现出统计分布规律,如表1-1数据的变异特征至少有以下两点:103对变异的认识:
(1)自然变异的范围是有限的,可以①变异的范围在3.2~6.2;②有明显的统计分布规律,4.7~5.0的人数最多。根据表1-1的数据,统计上还可以进一步推论出正常成年男子红细胞计数的正常值参考范围。104①变异的范围在3.2~6.2;42表1-1120名正常成年男子红细胞计数值
84.314.094.414.334.584.245.454.324.844.994.794.905.094.645.145.464.635.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.824.444.134.434.025.865.125.363.864.685.485.314.534.834.113.263.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69最大值=6.18,最小值=3.29,极差=2.89。算术均数=4.72,标准差=0.57105表1-1120名正常成年男子红细胞计数值5.125.
(2)用统计的方法可以确定出所有研究对象的变异范围,如正常成年男性的细胞数的范围。身高范围等等。(3)没有变异就没有统计,变异使统计有了用武之地。106(2)用统计的方法可以确定出所有研究对象的变异范围10745总体:根据研究目的确定的研究对象的全体。当研究有具体而明确的指标时,总体是指该项变量植的全体。样本:总体中有代表性的一部分。观察单位(个体):最基本的研究单位分为有限总体和无限总体。由于调查总体的不可能性、巨大性和没必要。对其中的一部分对象进行调查----样本(总体与样本的关系。举例。)样本选择的原则--??样本量(samplesize)2.总体与样本(populationandsample)108总体:根据研究目的确定的研究对象的全体。当研究有具体而明确的populationandsample总体:根据研究目的确定的同质研究对象的全体(集合)。分有限总体与无限总体样本:从总体中随机抽取的部分观察单位
populationandsample总体:根据研究目的随机抽样randomsampling为了保证样本的可靠性和代表性,需要采用随机的抽样方法(在总体中每个个体具有相同的机会被抽到)。随机抽样《医学统计学》课件3、抽样方法选择样本的方法:概率抽样和非概率抽样等概率抽样非等概率抽样简单随机抽样系统抽样分层抽样整群抽样1123、抽样方法选择样本的方法:概率抽样和非概率抽样等概率抽4.误差误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下二种:系统误差和随机误差(随机测量误差,抽样误差)。(1)系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。特点:具有累加性(2).随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 狼获奖课件教学课件
- 统计分析软件模拟试题三及答案
- 飞向太空的航程说课稿
- 队列口令说课稿
- 适合小班课件教学课件
- 怎样评价课件教学课件
- 南京工业大学浦江学院《公益营销》2021-2022学年第一学期期末试卷
- 南京工业大学浦江学院《筹资原理和技巧》2022-2023学年第一学期期末试卷
- 秸秆打捆协议书(2篇)
- 南京工业大学《应用统计学》2023-2024学年第一学期期末试卷
- GRR计算公式表格
- 梅毒诊断标准
- 2023年catti三级笔译综合能力考试试题及答案解析
- 幸运的内德(一年级绘本阅读)课件
- 急性缺血性脑卒中急诊急救中国专家共识
- Python语言基础与应用学习通超星课后章节答案期末考试题库2023年
- 六年级上册英语说课稿- Module 6 Unit 2 I've got a stamp from China. -外研社(三起)
- 住宅室内装饰装修管理办法
- 高考化学三轮冲刺易错题易错点25 盐类水解(解析版)
- 产品在途运输过程中产品质量安全等的监控及保障措施
- ChatGPT的工作原理介绍
评论
0/150
提交评论