医学统计学第一章绪论课件_第1页
医学统计学第一章绪论课件_第2页
医学统计学第一章绪论课件_第3页
医学统计学第一章绪论课件_第4页
医学统计学第一章绪论课件_第5页
已阅读5页,还剩109页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学

第一章绪论

1医学统计学

第一章绪论

1第一节统计学与医学统计学

2第一节2一.统计与统计学的定义

一.统计、统计学与医学统计学的定义

3一.统计与统计学的定义

一.统计、统计学与医学统计1.统计

是一种对客观现象数量方面进行的调查研究活动;是收集、整理、分析、推断、判断等认识活动的总称。数据汇总仅仅是统计工作的一小部分内容。

41.统计

是一种对客观现象数量方面进行的调查研究活动;42.统计学作为一门学科的定义是:关于数据收集、表达和分析的普遍原理和方法。

52.统计学作为一门学科的定义是:关于数据收集、表达和分析的普3.医学统计学

是用统计学原理和方法研究生物医学问题的一门学科。医学统计方法在医学研究中的运用主要有三个方面:63.医学统计学6①以正确的方式收集数据,如实验设计、调查设计等。②描述数据的统计特征,如数据化简、统计指标的选择与计算、统计结果的表达等。③统计分析及得出正确结论,如根据概率分布,对实验和观察结果存在的差异和关联作出统计推断。

7①以正确的方式收集数据,如实验设计、调查设计等。7工作生活中常见的统计学问题如何判断药物的疗效?(假设检验)明天是否下雨?体育彩票能否中奖?(概率论)子女为什么象父母,其强度有多大?(相关与回归)美国的民意测验是如何进行的?(设计,抽样)中国的市场调查的可信性有多大?(现场调查)

统计学是对令人困惑费解的数字问题做出设想的艺术。8工作生活中常见的统计学问题如何判断药物的疗效?(假设检验)8二.统计学的发展简史

9二.统计学的发展简史

91.早期

公元前3050年古埃及人为修建金字塔筹集建筑费,对全国的人口和财产进行了普查。

101.早期10

2.近代

19世纪,应用数学家为解决赌徒们在博彩中出现的输赢概率问题逐渐形成和发展了概率论,从而为统计学的发展奠定了坚实的基础。11

11实例(观察对比)(P5)1853-1854年伦敦霍乱死亡率与饮水水

用户数死亡人数死亡率(1/万户)重污染(Southwark和Vauxhall公司)

40046

1263315.4轻污染(Lambeth公司)

26107

9837.5伦敦其它地区256423

1422

55.5合

计322576

278386.312实例(观察对比)(P5)1853-1854年伦敦霍乱死实例(实验性研究)(P6~8)1747年,英国Lind医生对坏血病的干预研究。1835年,法国医生Louis对“放血”疗法治疗肺炎的效果评价。

1948年,英国发表了评价链霉素治疗肺结核疗效的随机对照的临床试验报告,第一次采用生物统计方法进行临床干预试验。1960年英国医生Doll,Hill等发现吸烟与肺癌有关。相对危险度RR=1.66/0.07=23.713实例(实验性研究)(P6~8)1747年,英国Lind医生1948年,郭祖超教授(1912~1999)编著的《医学与生物统计方法》,是我国第一部医学统计方法的教科书。1948年,郭祖超教授(1912~1999)编著的《医学与生

3.现代

计算机和统计软件如SAS、SPSS的出现使统计学得到了突飞猛进的发展。153.现代15统计方法是建立在现代科学方法之上,由统计学理论指导的数据收集、表达和分析的方法,现代科学方法可以概括为以下几点:16统计方法是建立在现代科学方法之上,由统计问题的识别与表达(发现问题、提出问题)。搜集有关资料。通过归纳得出假说:因果联系及重要的模式。从假说作出演绎:进行实验或收集更多的资料。推理:结果与演绎相符,假说得到加强,但不是被证明(例某地区食盐与高血压的关系)。17问题的识别与表达(发现问题、提出问题)。172.医学论文中的统计学问题60年代到80年代,国外医学杂志调查结果:有统计错误的论文20%~72%。1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数据分析方法误用达55.7%。2.医学论文中的统计学问题60年代到80年代,国外医学杂志

60年代到80年代,国外医学杂志调查表明:20%~72%的论文有统计错误。1984年对《中华医学杂志》、《中华内科杂志》、《中华外科杂志》、《中华妇产科杂志》、《中华儿科杂志》595篇论文的调查结果为:相对数误用占11.2%,抽样方法误用占15.9%,统计图表误用占11.7%1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数据分析方法误用达55.7%。2001年《中华预防医学杂志》:中华医学会系列杂志误用约54%(1995)。1996年,有机构对申报科技成果的4586篇科研论文分析,统计方法使用率为76%。医学论文中统计运用错误,除了影响论文的科学性,还可能导致严重的伦理学问题。

1960年代到80年代,国外医学杂志调查表明3.伪造统计数据违反科学道德1976年NewScience杂志关于科研舞弊行为的调查(1)74%的调查表反映有不正当修改数据的情况(2)17%拼凑实验结果(3)7%凭空捏造数据(4)2%故意曲解结果3.伪造统计数据违反科学道德1976年NewSciencFancystatisticalmethodscannotrescuegarbagedataFancystatisticalmethodscanhelpyougaininsightintoyourdata,overandabovewhatseemsobviousonitsfaceYoushouldalwaysworryaboutwhetherthesampledresultsarerepresentativeofthepopulation,andwhetheryoursampleallowsyoutomakeinferencesaboutthepopulation.AWarning!Fancystatisticalmethodscann三.统计学的特点

医学+数学,侧重医学,淡化数学。用数量反映质量,如平均期望寿命,解放前为35岁,现在70岁,可反映国家医疗卫生服务总体水平的提高。大量观察+实验数据分析→可以揭示医学规律。

22三.统计学的特点

医学+数学,侧重医学,淡化数学。22

第二节

统计工作的基本步骤23

231.专业设计:选题、建立假说、确定研究对象和技术方法等→个性

2.统计设计:围绕专业设计确定统计设类型、样本大小、分组方法、统计分析指标及统计分析方法。

一、设计

241.专业设计:选题、建立假说、确定研究对象和技术方法等→二、收集资料

(一)资料来源第一手资料

经常性:统计报表(死亡登记、疫情报告等),工作记录(病历、化验);②一时性:专题调查、实验或临床试验。第二手资料:已公布的资料,如数据银行、全国、全省卫生统计资料。

25二、收集资料

(一)资料来源25(二)资料要求

1.完整:观察单位及观察项目完整。

观察单位:最基本的获取数据的单元。可以是一个体,亦可以是一个单位、家庭、地区,一批样品,一个采样点。

26(二)资料要求

1.完整:观察单位及观察项目完整。

2.准确:即真实、可靠。真实是统计学的灵魂。

3.及时:即时限性。如人口普查规定调查开始日期和截止日期。272.准确:即真实、可靠。真实是统计学的灵魂。

3.及时三.整理资料

整理资料即原始数据的条理化、系统化的过程。所采取的手段→合理化分组,目的→实现专业目标。质分组:按事物的属性或性质分组→分类变量;量分组:按数据的大小→数值变量。28三.整理资料

整理资料即原始数据的条理化、系四.分析资料

1.统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行测定和描述。2.统计推断:用样本信息推断总体特征:①参数估计,②假设检验。29四.分析资料

1.统计描述:用统计指标、统计图表对资料的数第三节统计资料的类型(P25)

有三种类型的资料:计量资料,计数资料,等级资料

基本概念:变量及变量值,研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量,变量的测得值叫变量值(也叫观察值),称为资料。按变量值的性质可将资料分为定量资料和定性资料。30第三节统计资料的类型(P25)有三种类型的资料:1.计量资料定义:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。特点:有度量衡单位多为连续性资料(通过测量得到)如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(1012/L)311.计量资料定义:通过度量衡的方法,测量每一个观察单位的某定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。特点:没有度量衡单位多为间断性资料(通过枚举或记数得来)如肤色(黑、白)、血型(ABO)、职业(工农兵)、性别(男女)

2.计数资料32定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各

定义:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。特点:每一个观察单位没有确切值各组之间有性质上的差别或程度上的不同。

①癌症分期:早、中、晚。②药物疗效:治愈、好转、无效、死亡。

③尿蛋白:,,,++,+++及以上3.等级资料333.等级资料33(三)资料的转化(变量类型的转化)

数值变量分类变量

34(三)资料的转化(变量类型的转化)

数值变量例如:测得5人的WBC(个/m3)数如下:

300060005000800012000数值变量过低正常正常正常异常分类变量若按正常3人,异常2人分组→二分类变量若按过低1人,正常3人,过高1人分组→等级资料35例如:测得5人的WBC(个/m3)数如下:35

*提示:

①多途径;②尽量用定量指标,否则损失信息量;③定性指标可转化为定量指标,但较粗糙。36*提示:①多途径;36第四节统计学中的几个基本概念1、变异2、总体与样本3、参数与统计量

4、误差5、频率

37第四节统计学中的几个基本概念1、变异371.变异(P3~4)

同质事物个体间的差异。来源于一些未加控制或无法控制的甚至不明原因的因素。是统计学存在的基础,从本质上说,统计学就是研究变异的科学。

381.变异(P3~4)38对变异的认识:

(1)自然变异的范围是有限的,可以度量;参差不齐的测量值,通过大量重复观测可以显现出统计分布规律,如表1-1(P4)数据的变异特征至少有以下两点:39对变异的认识:

(1)自然变异的范围是有限的,可以①变异的范围在3.29~6.18;②有明显的统计分布规律,4.7~5.0的人数最多。根据表1-1的数据,统计上还可以进一步推论出正常成年男子红细胞计数的正常值参考范围。40①变异的范围在3.29~6.18;40表1-1120名正常成年男子红细胞计数值

84.314.094.414.334.584.245.454.324.844.994.794.905.094.645.145.464.635.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.824.444.134.434.025.865.125.363.864.685.485.314.534.834.113.263.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69最大值=6.18,最小值=3.29,极差=2.89。算术均数=4.72,标准差=0.5741表1-1120名正常成年男子红细胞计数值5.125.4242

(2)用统计的方法可以确定出所有研究对象的变异范围,如正常成年男性的细胞数的范围。身高范围等等。(3)没有变异就没有统计,变异使统计有了用武之地。43(2)用统计的方法可以确定出所有研究对象的变异范围总体:根据研究目的确定的同质研究对象的全体。当研究有具体而明确的指标时,总体是指该项变量植的全体。样本:从总体中随机抽取的有代表性的一部分。观察单位(个体):最基本的研究单位分为有限总体和无限总体。由于调查总体的不可能性、巨大性和没必要。对其中的一部分对象进行调查----样本(总体与样本的关系。举例。)样本选择的原则--??样本量(samplesize)2.总体与样本

(populationandsample)(P31)44总体:根据研究目的确定的同质研究对象的全体。当研究有具体而明populationandsample总体:根据研究目的确定的同质研究对象的全体(集合)。分有限总体与无限总体样本:从总体中随机抽取的部分观察单位

populationandsample总体:根据研究目的随机抽样randomsampling为了保证样本的可靠性和代表性,需要采用随机的抽样方法(在总体中每个个体具有相同的机会被抽到)。随机抽样对样本数据进行观察或计算统计指标,目的是推论总体。47473.参数与统计量(P31)parameterandstatistic参数:总体的统计指标,如总体均数,采用希腊字母记为μ。固定的常数

总体样本抽取部分观察单位

μ?

推断inference统计量:样本的统计指标,如样本均数,采用拉丁字母分别记为。统计量是参数附近波动的随机变量。483.参数与统计量(P31)par4.误差误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下二种:系统误差和随机误差(随机测量误差,抽样误差)。(1)系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。特点:具有累加性(2).随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。特点:随测量次数增加而减小。494.误差误差:统计上所说的误差泛指测量值与真值之在消除了系统误差的前提下,由于非人为的偶然因素,对于同一样本多次测定结果不完全一样,结果有时偏大有时偏小,没有倾向性,这种误差叫随机测量误差。特点:没有倾向性,多次测量计算平均值可以减小甚至消除随机测量误差。A、随机测量误差50在消除了系统误差的前提下,由于非人为的偶然因素,对

这类误差可以通过实验设计和技术措施来消除或使之减少。

观察性研究由于组间不可比性产生的系统误差称为偏倚(bias),如吸烟组的平均年龄大于吸烟组,两组死亡率的差异包含年龄偏倚。51这类误差可以通过实验设计和技术措施来消除或使之减少。由于抽样原因造成的样本指标与总体指标之间的差别。特点:有抽样抽样误差就不可避免。统计上可以计算并在一定范围内控制抽样误差。B、抽样误差(P32)52B、抽样误差(P32)52

(1)改进抽样方法,增加样本的代表性。样本量n相等的情况下:整群抽样>单纯随机抽样>系统抽样>分层抽样(2)增加样本量n(3)选择变异程度较小的研究指标减少抽样误差的方法:53减少抽样误5.概率probability

确定性现象:在一定条件下,一定会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫必然事件;肯定不发生某种结果的叫不可能事件。

随机现象:在同样条件下可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为随机事件。随机事件的特征:①随机性;②规律性:每次发生的可能性的大小是确定的。概率:描述随机事件发生的可能性大小的数值,用大写的P表示;取值[0,1]。545.概率probability确定性现象:在一定条件必然事件P=1不可能事件P=0随机事件0<P<1

P≤0.05(5%)或P≤0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。小概率事件55必然事件P=1如何学习统计学

(特点:灵活、抽象)理解基本的统计原理培养统计思维能力:抽象的,逻辑推理多练习:课堂练习,课下做习题

联系实际:阅读文献工作和生活实际56如何学习统计学

(特点:灵活、抽象)理解基本的统计原理561.某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高也大于乙班?为什么?2.用A,B两种药物分别治疗一批患者。如果A药的治愈率高于B药,证明A药的疗效优于B药。这种说法对吗?为什么?3.既然观察对比不可避免地存在偏倚,为什么不能用干预试验取代观察对比?思考题1.某年级甲班、乙班各有男生50人。从两个班各抽取10人测医学统计学

第一章绪论

58医学统计学

第一章绪论

1第一节统计学与医学统计学

59第一节2一.统计与统计学的定义

一.统计、统计学与医学统计学的定义

60一.统计与统计学的定义

一.统计、统计学与医学统计1.统计

是一种对客观现象数量方面进行的调查研究活动;是收集、整理、分析、推断、判断等认识活动的总称。数据汇总仅仅是统计工作的一小部分内容。

611.统计

是一种对客观现象数量方面进行的调查研究活动;42.统计学作为一门学科的定义是:关于数据收集、表达和分析的普遍原理和方法。

622.统计学作为一门学科的定义是:关于数据收集、表达和分析的普3.医学统计学

是用统计学原理和方法研究生物医学问题的一门学科。医学统计方法在医学研究中的运用主要有三个方面:633.医学统计学6①以正确的方式收集数据,如实验设计、调查设计等。②描述数据的统计特征,如数据化简、统计指标的选择与计算、统计结果的表达等。③统计分析及得出正确结论,如根据概率分布,对实验和观察结果存在的差异和关联作出统计推断。

64①以正确的方式收集数据,如实验设计、调查设计等。7工作生活中常见的统计学问题如何判断药物的疗效?(假设检验)明天是否下雨?体育彩票能否中奖?(概率论)子女为什么象父母,其强度有多大?(相关与回归)美国的民意测验是如何进行的?(设计,抽样)中国的市场调查的可信性有多大?(现场调查)

统计学是对令人困惑费解的数字问题做出设想的艺术。65工作生活中常见的统计学问题如何判断药物的疗效?(假设检验)8二.统计学的发展简史

66二.统计学的发展简史

91.早期

公元前3050年古埃及人为修建金字塔筹集建筑费,对全国的人口和财产进行了普查。

671.早期10

2.近代

19世纪,应用数学家为解决赌徒们在博彩中出现的输赢概率问题逐渐形成和发展了概率论,从而为统计学的发展奠定了坚实的基础。68

11实例(观察对比)(P5)1853-1854年伦敦霍乱死亡率与饮水水

用户数死亡人数死亡率(1/万户)重污染(Southwark和Vauxhall公司)

40046

1263315.4轻污染(Lambeth公司)

26107

9837.5伦敦其它地区256423

1422

55.5合

计322576

278386.369实例(观察对比)(P5)1853-1854年伦敦霍乱死实例(实验性研究)(P6~8)1747年,英国Lind医生对坏血病的干预研究。1835年,法国医生Louis对“放血”疗法治疗肺炎的效果评价。

1948年,英国发表了评价链霉素治疗肺结核疗效的随机对照的临床试验报告,第一次采用生物统计方法进行临床干预试验。1960年英国医生Doll,Hill等发现吸烟与肺癌有关。相对危险度RR=1.66/0.07=23.770实例(实验性研究)(P6~8)1747年,英国Lind医生1948年,郭祖超教授(1912~1999)编著的《医学与生物统计方法》,是我国第一部医学统计方法的教科书。1948年,郭祖超教授(1912~1999)编著的《医学与生

3.现代

计算机和统计软件如SAS、SPSS的出现使统计学得到了突飞猛进的发展。723.现代15统计方法是建立在现代科学方法之上,由统计学理论指导的数据收集、表达和分析的方法,现代科学方法可以概括为以下几点:73统计方法是建立在现代科学方法之上,由统计问题的识别与表达(发现问题、提出问题)。搜集有关资料。通过归纳得出假说:因果联系及重要的模式。从假说作出演绎:进行实验或收集更多的资料。推理:结果与演绎相符,假说得到加强,但不是被证明(例某地区食盐与高血压的关系)。74问题的识别与表达(发现问题、提出问题)。172.医学论文中的统计学问题60年代到80年代,国外医学杂志调查结果:有统计错误的论文20%~72%。1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数据分析方法误用达55.7%。2.医学论文中的统计学问题60年代到80年代,国外医学杂志

60年代到80年代,国外医学杂志调查表明:20%~72%的论文有统计错误。1984年对《中华医学杂志》、《中华内科杂志》、《中华外科杂志》、《中华妇产科杂志》、《中华儿科杂志》595篇论文的调查结果为:相对数误用占11.2%,抽样方法误用占15.9%,统计图表误用占11.7%1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数据分析方法误用达55.7%。2001年《中华预防医学杂志》:中华医学会系列杂志误用约54%(1995)。1996年,有机构对申报科技成果的4586篇科研论文分析,统计方法使用率为76%。医学论文中统计运用错误,除了影响论文的科学性,还可能导致严重的伦理学问题。

7660年代到80年代,国外医学杂志调查表明3.伪造统计数据违反科学道德1976年NewScience杂志关于科研舞弊行为的调查(1)74%的调查表反映有不正当修改数据的情况(2)17%拼凑实验结果(3)7%凭空捏造数据(4)2%故意曲解结果3.伪造统计数据违反科学道德1976年NewSciencFancystatisticalmethodscannotrescuegarbagedataFancystatisticalmethodscanhelpyougaininsightintoyourdata,overandabovewhatseemsobviousonitsfaceYoushouldalwaysworryaboutwhetherthesampledresultsarerepresentativeofthepopulation,andwhetheryoursampleallowsyoutomakeinferencesaboutthepopulation.AWarning!Fancystatisticalmethodscann三.统计学的特点

医学+数学,侧重医学,淡化数学。用数量反映质量,如平均期望寿命,解放前为35岁,现在70岁,可反映国家医疗卫生服务总体水平的提高。大量观察+实验数据分析→可以揭示医学规律。

79三.统计学的特点

医学+数学,侧重医学,淡化数学。22

第二节

统计工作的基本步骤80

231.专业设计:选题、建立假说、确定研究对象和技术方法等→个性

2.统计设计:围绕专业设计确定统计设类型、样本大小、分组方法、统计分析指标及统计分析方法。

一、设计

811.专业设计:选题、建立假说、确定研究对象和技术方法等→二、收集资料

(一)资料来源第一手资料

经常性:统计报表(死亡登记、疫情报告等),工作记录(病历、化验);②一时性:专题调查、实验或临床试验。第二手资料:已公布的资料,如数据银行、全国、全省卫生统计资料。

82二、收集资料

(一)资料来源25(二)资料要求

1.完整:观察单位及观察项目完整。

观察单位:最基本的获取数据的单元。可以是一个体,亦可以是一个单位、家庭、地区,一批样品,一个采样点。

83(二)资料要求

1.完整:观察单位及观察项目完整。

2.准确:即真实、可靠。真实是统计学的灵魂。

3.及时:即时限性。如人口普查规定调查开始日期和截止日期。842.准确:即真实、可靠。真实是统计学的灵魂。

3.及时三.整理资料

整理资料即原始数据的条理化、系统化的过程。所采取的手段→合理化分组,目的→实现专业目标。质分组:按事物的属性或性质分组→分类变量;量分组:按数据的大小→数值变量。85三.整理资料

整理资料即原始数据的条理化、系四.分析资料

1.统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行测定和描述。2.统计推断:用样本信息推断总体特征:①参数估计,②假设检验。86四.分析资料

1.统计描述:用统计指标、统计图表对资料的数第三节统计资料的类型(P25)

有三种类型的资料:计量资料,计数资料,等级资料

基本概念:变量及变量值,研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量,变量的测得值叫变量值(也叫观察值),称为资料。按变量值的性质可将资料分为定量资料和定性资料。87第三节统计资料的类型(P25)有三种类型的资料:1.计量资料定义:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。特点:有度量衡单位多为连续性资料(通过测量得到)如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(1012/L)881.计量资料定义:通过度量衡的方法,测量每一个观察单位的某定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。特点:没有度量衡单位多为间断性资料(通过枚举或记数得来)如肤色(黑、白)、血型(ABO)、职业(工农兵)、性别(男女)

2.计数资料89定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各

定义:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。特点:每一个观察单位没有确切值各组之间有性质上的差别或程度上的不同。

①癌症分期:早、中、晚。②药物疗效:治愈、好转、无效、死亡。

③尿蛋白:,,,++,+++及以上3.等级资料903.等级资料33(三)资料的转化(变量类型的转化)

数值变量分类变量

91(三)资料的转化(变量类型的转化)

数值变量例如:测得5人的WBC(个/m3)数如下:

300060005000800012000数值变量过低正常正常正常异常分类变量若按正常3人,异常2人分组→二分类变量若按过低1人,正常3人,过高1人分组→等级资料92例如:测得5人的WBC(个/m3)数如下:35

*提示:

①多途径;②尽量用定量指标,否则损失信息量;③定性指标可转化为定量指标,但较粗糙。93*提示:①多途径;36第四节统计学中的几个基本概念1、变异2、总体与样本3、参数与统计量

4、误差5、频率

94第四节统计学中的几个基本概念1、变异371.变异(P3~4)

同质事物个体间的差异。来源于一些未加控制或无法控制的甚至不明原因的因素。是统计学存在的基础,从本质上说,统计学就是研究变异的科学。

951.变异(P3~4)38对变异的认识:

(1)自然变异的范围是有限的,可以度量;参差不齐的测量值,通过大量重复观测可以显现出统计分布规律,如表1-1(P4)数据的变异特征至少有以下两点:96对变异的认识:

(1)自然变异的范围是有限的,可以①变异的范围在3.29~6.18;②有明显的统计分布规律,4.7~5.0的人数最多。根据表1-1的数据,统计上还可以进一步推论出正常成年男子红细胞计数的正常值参考范围。97①变异的范围在3.29~6.18;40表1-1120名正常成年男子红细胞计数值

84.314.094.414.334.584.245.454.324.844.994.794.905.094.645.145.464.635.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.824.444.134.434.025.865.125.363.864.685.485.314.534.834.113.263.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69最大值=6.18,最小值=3.29,极差=2.89。算术均数=4.72,标准差=0.5798表1-1120名正常成年男子红细胞计数值5.125.9942

(2)用统计的方法可以确定出所有研究对象的变异范围,如正常成年男性的细胞数的范围。身高范围等等。(3)没有变异就没有统计,变异使统计有了用武之地。100(2)用统计的方法可以确定出所有研究对象的变异范围总体:根据研究目的确定的同质研究对象的全体。当研究有具体而明确的指标时,总体是指该项变量植的全体。样本:从总体中随机抽取的有代表性的一部分。观察单位(个体):最基本的研究单位分为有限总体和无限总体。由于调查总体的不可能性、巨大性和没必要。对其中的一部分对象进行调查----样本(总体与样本的关系。举例。)样本选择的原则--??样本量(samplesize)2.总体与样本

(populationandsample)(P31)101总体:根据研究目的确定的同质研究对象的全体。当研究有具体而明populationandsample总体:根据研究目的确定的同质研究对象的全体(集合)。分有限总体与无限总体样本:从总体中随机抽取的部分观察单位

populationandsample总体:根据研究目的随机抽样randomsampling为了保证样本的可靠性和代表性,需要采用随机的抽样方法(在总体中每个个体具有相同的机会被抽到)。随机抽样对样本数据进行观察或计算统计指标,目的是推论总体。104473.参数与统计量(P31)parameterandstatistic参数:总体的统计指标,如总体均数,采用希腊字母记为μ。固定的常数

总体样本抽取部分观察单位

μ?

推断inference统计量:样本的统计指标,如样本均数,采用拉丁字母分别记为。统计量是参数附近波动的随机变量。1053.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论