北京大学课件统计学课件_第1页
北京大学课件统计学课件_第2页
北京大学课件统计学课件_第3页
北京大学课件统计学课件_第4页
北京大学课件统计学课件_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

北京大学课件统计学课件汇报人:AA2024-01-24统计学基本概念与原理描述性统计方法概率论基础知识推断性统计方法非参数检验方法统计图表展示技巧实际案例分析与操作演示目录01统计学基本概念与原理0102统计学定义及作用统计学的作用在于通过对数据的分析和解释,帮助人们更好地理解和应对现实生活中的各种问题。统计学是一门研究如何收集、整理、分析、解释和呈现数据的科学。数据类型定量数据和定性数据。定量数据是可以量化的,如身高、体重等;定性数据则是描述性的,如性别、职业等。数据来源主要来源于调查、实验和观察。调查是通过问卷、访谈等方式收集数据;实验是通过人为控制条件来观察结果;观察则是直接记录自然现象或行为。数据类型与来源研究对象的全体个体组成的集合。总体从总体中随机抽取的一部分个体组成的集合,用于代表总体进行统计分析。样本总体与样本概念变量在统计学中,变量是指可以取不同值的特征或属性。根据取值方式的不同,变量可分为离散变量和连续变量。数据测量数据测量是指根据一定的规则和标准,对研究对象的特征或属性进行度量和记录的过程。常见的数据测量尺度包括定类尺度、定序尺度、定距尺度和定比尺度。变量与数据测量02描述性统计方法用于展示数据分布情况,包括各组数据的频数、频率、累计频数和累计频率。频数分布表直方图应用场景用矩形面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示组距。适用于连续型变量,可直观展示数据的分布规律,如正态分布、偏态分布等。030201频数分布表与直方图算术平均数中位数众数应用场景集中趋势度量所有数据的和除以数据的个数,反映数据集中趋势的一项指标。一组数据中出现次数最多的数。将数据按大小顺序排列后正中间的数,若数据量为偶数,则中位数为中间两个数的平均数。适用于不同数据类型,可消除极端值影响,反映数据集中趋势。极差方差标准差应用场景离散程度度量01020304一组数据中最大值与最小值的差。各数据与平均数之差的平方的平均数。方差的算术平方根,反映组内个体间的离散程度。适用于不同数据类型,可衡量数据的波动情况,辅助判断数据的稳定性。数据分布不对称,偏态系数可用于描述偏态程度,正偏态表示数据向右偏,负偏态表示数据向左偏。偏态分布数据分布的尖峭或扁平程度,峰态系数可用于描述峰态,正峰态表示数据分布尖峭,负峰态表示数据分布扁平。峰态分布适用于连续型变量,可辅助判断数据是否符合正态分布等特定分布形态,为后续统计分析提供基础。应用场景数据分布形态描述03概率论基础知识事件与概率定义在一定条件下,并不总是发生或总是不发生的某种结果或现象。描述某一事件发生的可能性大小的数值,取值范围在0到1之间。所有可能的基本事件数是有限的,且每个基本事件发生的可能性相同。试验的样本空间是一个区域,基本事件是区域中的点。事件概率古典概型几何概型

条件概率与独立性条件概率在某一事件已经发生的条件下,另一事件发生的概率。独立性两个事件相互独立,一个事件的发生不影响另一个事件的发生概率。乘法公式两事件同时发生的概率等于一事件发生的概率与在另一事件发生的条件下该事件发生的条件概率的乘积。定义在样本空间上的实值函数,将随机试验的结果数量化。随机变量取值可数的随机变量,如二项分布、泊松分布等。离散型随机变量取值充满某个区间的随机变量,如正态分布、均匀分布等。连续型随机变量描述随机变量取值的概率分布情况的函数。分布函数随机变量及其分布描述随机变量取值的平均水平,是随机变量所有可能取值的加权平均数。期望方差协方差相关系数描述随机变量取值与其期望的偏离程度,反映随机变量的波动情况。描述两个随机变量变化趋势的统计量,正值表示两变量同向变化,负值表示反向变化。标准化后的协方差,反映两个随机变量线性相关的程度。期望、方差和协方差04推断性统计方法用样本统计量来估计总体参数的方法,如样本均值、样本比例等。根据样本数据计算出一个区间,该区间以一定的置信水平包含了总体参数的真值。参数估计方法区间估计点估计假设检验原理及步骤假设检验的基本原理:先对总体参数提出一个假设,然后利用样本信息来判断该假设是否成立。假设检验的步骤提出假设:包括原假设和备择假设。计算检验统计量的值。作出决策:根据检验统计量的值是否落在拒绝域内,决定是否拒绝原假设。选择检验统计量并确定拒绝域。010405060302方差分析的基本原理:通过比较不同组间的方差与组内方差的大小来判断因素对指标是否有显著影响。方差分析的步骤提出假设。计算各组均值和总均值,以及各组方差和总方差。计算F值。作出决策:根据F值的大小和给定的显著性水平,判断是否拒绝原假设。方差分析(ANOVA)回归分析的基本原理:通过建立一个数学模型来描述因变量与一个或多个自变量之间的关系,并利用样本数据来估计模型参数。回归分析的步骤确定因变量和自变量。建立回归模型。利用样本数据估计模型参数。对模型进行检验和评估,包括拟合优度检验、回归系数的显著性检验等。回归分析简介05非参数检验方法通过比较实际观测值与理论期望值之间的差异,判断两个或多个分类变量之间是否存在显著关联。卡方检验的基本原理适用于多个分类变量之间的关联性检验,如医学领域的疾病与基因型关联分析、市场调研中的消费者行为与产品属性关联分析等。卡方检验的应用场景优点在于简单易行,适用于大样本数据;缺点在于对数据的分布形态有一定要求,且当分类变量较多时,可能存在较大的误差。卡方检验的优缺点卡方检验123通过对样本数据的秩次进行求和,比较两组或多组数据分布位置是否存在显著差异。秩和检验的基本原理适用于两独立样本或配对样本的比较,如医学领域的两种治疗方法的效果比较、心理学领域的两组被试的智力水平比较等。秩和检验的应用场景优点在于对数据分布形态无严格要求,适用范围广;缺点在于对极端值敏感,且当样本量较大时,检验效率可能降低。秩和检验的优缺点秩和检验根据样本数据的中位数或均值将数据分为正负两组,通过比较正负号的个数来判断样本数据分布是否存在显著差异。符号检验的基本原理适用于配对样本的比较,如医学领域的药物治疗前后效果比较、教育学领域的两种教学方法的效果比较等。符号检验的应用场景优点在于简单易行,对数据分布形态无严格要求;缺点在于忽略了数据的具体数值大小,只考虑了符号方向,因此可能损失部分信息。符号检验的优缺点符号检验06统计图表展示技巧常见统计图表类型及特点柱状图(BarChart)用于比较不同类别数据的大小,直观展示各类别之间的差异。折线图(LineChart)用于展示数据随时间或其他连续变量的变化趋势。饼图(PieChart)用于展示数据的占比关系,直观反映各部分在整体中的相对大小。散点图(ScatterPlot)用于展示两个变量之间的关系,判断是否存在相关性。在Excel中整理好需要制作图表的数据,包括数据清洗、格式转换等。数据准备选择合适的图表类型,通过Excel的图表工具插入图表。图表插入对插入的图表进行编辑,包括修改标题、坐标轴标签、数据系列等。图表编辑通过Excel的格式化工具对图表进行美化,包括调整颜色、字体、边框等。图表格式化Excel在统计图表制作中应用保持简洁明了避免在图表中添加过多不必要的元素,保持图表的简洁明了,突出重点。添加必要的说明和标注在图表中添加必要的标题、坐标轴标签、数据标签等,帮助读者更好地理解图表内容。使用对比和强调通过颜色、形状、大小等对比手段强调重要数据点,引导读者关注重点。选择合适的图表类型根据数据特点和展示需求选择合适的图表类型,避免使用不恰当的图表导致误解。提高图表可读性和美观性建议07实际案例分析与操作演示数据收集与整理描述性统计分析时间序列分析预测模型构建案例一:某公司销售额数据分析报告计算销售额的均值、中位数、众数、方差等统计量,以初步了解数据的分布规律。通过时间序列图、移动平均等方法,分析销售额随时间的变化趋势,以及季节性、周期性等特征。利用回归分析、指数平滑等方法,构建销售额预测模型,并对未来一段时间的销售额进行预测。从公司内部数据库获取历史销售额数据,并进行清洗、整理,以便后续分析。试验设计与数据收集根据研究目的和假设,设计合理的临床试验方案,并收集相关数据。基线资料分析对参与试验的患者的基线资料进行描述性统计分析,以了解患者的基本情况。疗效评价通过对比分析试验组和对照组的主要疗效指标,评价试验药物的疗效。安全性评价分析试验药物的不良反应发生情况,评估其安全性。案例二:医学领域临床试验结果评价

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论