从零开始学医学统计第二章第1-2024鲜版_第1页
从零开始学医学统计第二章第1-2024鲜版_第2页
从零开始学医学统计第二章第1-2024鲜版_第3页
从零开始学医学统计第二章第1-2024鲜版_第4页
从零开始学医学统计第二章第1-2024鲜版_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

从零开始学医学统计第二章第12024/3/271CATALOGUE目录医学统计学基本概念与意义数据类型与变量分类描述性统计分析方法概率论基础知识回顾抽样分布原理及应用举例参数估计与假设检验方法论述2024/3/27201医学统计学基本概念与意义2024/3/273医学统计学定义医学统计学是应用数理统计学的原理和方法,在医学领域中研究数据的收集、整理、分析和解释的一门科学。发展历程医学统计学的发展经历了描述性统计、推断性统计和现代统计学三个阶段。随着计算机技术的发展,医学统计学在数据处理和分析方面的能力得到了极大的提升。医学统计学定义及发展历程2024/3/274医学统计学的研究对象主要是生物医学数据,包括临床试验、流行病学调查、基因组学等方面的数据。医学统计学的目的是通过对数据的收集、整理、分析和解释,揭示生物医学现象背后的统计规律,为医学研究和临床实践提供科学依据。研究对象与目的研究目的研究对象2024/3/275

在医学领域中的重要性揭示医学现象规律通过统计分析,可以揭示医学现象背后的统计规律,为医学研究和临床实践提供科学依据。辅助医学决策医学统计学可以为医生提供基于数据的决策支持,帮助医生制定更科学、合理的治疗方案。促进医学研究发展医学统计学在医学研究中发挥着重要作用,可以帮助研究人员设计合理的试验方案、分析试验数据并得出科学结论。2024/3/276误区一认为统计学只是简单的数据计算和分析,不需要深入理解其原理和方法。解析实际上,医学统计学是一门严谨的学科,需要深入理解其原理和方法,才能正确应用并得出可靠的结论。误区二认为只要数据量大,就可以得出准确的结论。解析数据量的大小并不是决定结论准确性的唯一因素,还需要考虑数据的质量、试验设计等因素。因此,在进行统计分析时,需要综合考虑多个因素,才能得出可靠的结论。01020304常见误区及解析2024/3/27702数据类型与变量分类2024/3/278具有数值特征,可以进行数学运算的数据。例如:身高、体重、血压等。定量数据描述事物的属性或特征,不具有数值特征的数据。例如:性别、婚姻状况、职业等。定性数据定量数据与定性数据概念区分2024/3/279连续型变量离散型变量分类变量有序分类变量变量类型及其特点分析可以在一个范围内取任何值,如身高、体重等。描述事物的不同类别或属性,如性别、血型等。只能取某些特定的值,如红细胞计数、白细胞计数等。不仅描述事物的不同类别,还表示类别之间的顺序关系,如病情严重程度(轻、中、重)。2024/3/2710123通过设定阈值或分组将连续型变量转换为离散型变量,如将血压分为正常、高血压1级、高血压2级等。连续型变量转换为离散型变量在某些情况下,可以将离散型变量视为连续型变量进行处理,如将红细胞计数视为连续变量进行分析。离散型变量转换为连续型变量通过赋予类别一定的顺序关系,将分类变量转换为有序分类变量,如将职业按照社会地位或收入水平进行排序。分类变量转换为有序分类变量实例演示:不同类型变量转换方法2024/3/2711010204注意事项与常见问题解答注意变量的测量单位和数据类型,避免在数据分析中出现错误。在进行变量转换时,需要考虑转换的合理性和实际意义。对于有序分类变量,需要注意类别之间的顺序关系是否合理和客观。在处理大量数据时,需要注意数据的清洗和整理,以确保数据的准确性和可靠性。032024/3/271203描述性统计分析方法2024/3/2713所有数值的总和除以数值的个数,用于表示一组数据的平均水平。均值中位数众数将一组数据按大小顺序排列,位于中间位置的数值即为中位数,用于统计学中的中心位置测量。一组数据中出现次数最多的数值,用于表示数据的集中情况。030201集中趋势描述指标介绍2024/3/2714各数值与其均值之差的平方的平均数,用于衡量数据的波动大小。方差方差的算术平方根,表示数据的离散程度。标准差上四分位数与下四分位数之差,用于反映中间50%数据的离散程度。四分位数间距离散程度描述指标计算方法2024/3/2715偏态通过偏态系数来判断数据分布的偏斜方向及程度,偏态系数大于0表示右偏,小于0表示左偏。峰态通过峰态系数来判断数据分布的尖峭程度,峰态系数大于3表示尖顶峰,小于3表示平顶峰。偏态和峰态判断方法论述2024/3/2716数据录入与整理在SPSS中建立数据文件,录入并整理需要分析的数据。描述性统计分析步骤依次点击“分析”-“描述统计”-“描述”,选择需要分析的变量,点击确定即可得到描述性统计结果。结果解读根据SPSS输出的结果,可以解读出数据的均值、标准差、四分位数等统计量,以及偏态和峰态等信息。实例操作:SPSS软件进行描述性统计分析2024/3/271704概率论基础知识回顾2024/3/2718事件定义事件间的关系概率定义概率的性质事件和概率概念辨析01020304在一定条件下,某种现象可能发生也可能不发生,称之为随机事件,简称事件。包含、相等、互斥、对立等。表示某一事件发生的可能性大小的数值,称为该事件的概率。非负性、规范性、可加性。2024/3/2719独立性检验方法通过计算事件A和事件B同时发生的概率P(AB)是否等于事件A和事件B各自发生的概率的乘积P(A)P(B)来判断。条件概率定义在事件A发生的条件下,事件B发生的概率,称为条件概率,记作P(B|A)。乘法公式P(AB)=P(A)P(B|A)。独立性定义如果事件A的发生与否对事件B发生的概率没有影响,则称事件A与事件B相互独立。条件概率和独立性检验方法2024/3/2720随机变量定义设随机试验的样本空间为S,如果对于S中的每一个样本点e,都有一个实数X(e)与之对应,则称X为随机变量。如果随机变量X的所有可能取值是有限个或可列个,则称X为离散型随机变量。描述离散型随机变量取值的概率规律称为分布律。如果随机变量X的所有可能取值充满某个区间,则称X为连续型随机变量。描述连续型随机变量取值的概率规律称为概率密度函数。设X是一个随机变量,x是任意实数,称函数F(x)=P{X≤x}为X的分布函数。离散型随机变量及其分布律连续型随机变量及其概率密度分布函数定义随机变量及其分布函数介绍2024/3/2721期望值定义设离散型随机变量X的分布律为P{X=x_k}=p_k,k=1,2,...,且级数∑x_kp_k绝对收敛,则称该级数的和为随机变量X的数学期望,记作E(X)。对于连续型随机变量X,其数学期望定义为E(X)=∫xf(x)dx,其中f(x)为X的概率密度函数。方差定义设X是一个随机变量,若E{[X-E(X)]^2}存在,则称E{[X-E(X)]^2}为X的方差,记作D(X)或Var(X)。方差表示了随机变量取值的离散程度。计算公式推导方差的计算公式可以推导为D(X)=E(X^2)-[E(X)]^2。对于离散型随机变量,方差计算公式为D(X)=∑[x_k-E(X)]^2p_k;对于连续型随机变量,方差计算公式为D(X)=∫[x-E(X)]^2f(x)dx。期望值和方差计算公式推导2024/3/272205抽样分布原理及应用举例2024/3/2723抽样分布是指从总体中随机抽取一定数量的样本,由这些样本的统计量所构成的分布。抽样分布定义常见的抽样分布包括正态分布、t分布、F分布和卡方分布等。抽样分布种类抽样分布概念及种类概述2024/3/2724正态分布概念正态分布是一种连续型概率分布,具有钟形曲线特点,由均值和标准差决定其形状。正态分布在医学统计中应用在医学研究中,许多生物学指标和实验数据都服从或近似服从正态分布。例如,身高、体重、血压等生理指标,以及某些实验室检查结果等。对于这些数据,可以采用正态分布的统计方法进行描述和分析。正态分布在医学统计中应用场景2024/3/2725t分布01t分布是一种连续型概率分布,用于根据小样本来估计呈正态分布且方差未知的总体的均值。其特点是随着自由度的增加,t分布逐渐趋近于正态分布。F分布02F分布是一种连续型概率分布,用于比较两个独立正态总体的方差是否相等。F分布的形状取决于两个自由度参数,且其曲线不对称。卡方分布03卡方分布是一种连续型概率分布,主要用于检验拟合优度以及检验多个总体均值是否相等。卡方分布的形状取决于自由度参数,且其曲线也不对称。t分布、F分布和卡方分布特点比较2024/3/2726正态分布计算过程:对于服从正态分布的数据,可以通过计算均值和标准差来描述其分布情况。同时,可以利用正态分布的性质进行区间估计和假设检验等统计分析。t分布计算过程:对于小样本数据且总体方差未知的情况下,可以采用t分布进行统计分析。首先计算样本均值和样本标准差,然后根据t分布的性质计算t值和对应的p值,从而进行假设检验和区间估计等分析。F分布计算过程:在比较两个独立正态总体的方差是否相等时,可以采用F分布进行统计分析。首先分别计算两个总体的样本方差和自由度,然后根据F分布的性质计算F值和对应的p值,从而判断两个总体的方差是否存在显著差异。卡方分布计算过程:在进行拟合优度检验或检验多个总体均值是否相等时,可以采用卡方分布进行统计分析。首先根据数据的性质构建卡方统计量,然后根据卡方分布的性质计算卡方值和对应的p值,从而判断数据的拟合情况或多个总体均值是否存在显著差异。实例演示:不同类型抽样分布计算过程2024/3/272706参数估计与假设检验方法论述2024/3/2728点估计和区间估计原理介绍点估计原理利用样本统计量来估计总体参数的方法。常见的点估计方法有矩估计法和最大似然估计法。区间估计原理基于样本数据构建一个置信区间,以该区间作为总体参数的估计范围。置信区间具有一定的置信水平,表示总体参数真值落在该区间的概率。2024/3/2729基本思想3.确定拒绝域4.计算检验统计量的值5.做出决策2.选择检验统计量1.提出假设在统计学中,假设检验是一种用于判断总体参数是否等于某个特定值或属于某个特定范围的方法。其基本思想是通过构造一个关于总体参数的假设,然后利用样本信息来判断该假设是否成立。包括原假设和备择假设。原假设通常是总体参数等于某个特定值或属于某个特定范围,备择假设则是总体参数不等于该特定值或不属于该特定范围。根据问题的具体背景和样本数据的特点,选择一个合适的检验统计量。根据显著性水平和检验统计量的分布,确定拒绝原假设的区域。利用样本数据计算检验统计量的值。将计算得到的检验统计量的值与拒绝域进行比较,如果落入拒绝域,则拒绝原假设,否则接受原假设。假设检验基本思想及步骤梳理2024/3/2730一类错误和二类错误概念辨析二类错误当备择假设为真时,错误地接受原假设的概率。也称为取伪错误或β错误。一类错误当原假设为真时,错误地拒绝原假设的概率。也称为弃真错误或α错误。辨析一类错误和二类错误是相互矛盾的,减少一类错误的概率通常会增加二类错误的概率,反之亦然。在实际应用中,需要根据问题的具体背景和实际需求来权衡两类错误的概率。2024/3/2731参数估计实例操作1.打开SPSS软件并导入数据。2.选择“分析”菜单下的“描述统计”子菜单中的“探索”选项。实例操作2024/3/27323.在弹出的对话框中选择需要分析的变量,并勾选“估计”选项中的“均值”和“标准差”等参数。4.点击“确定”按钮,SPSS将输出参数估计结果。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论