高等多元统计分析第一章-绪论_第1页
高等多元统计分析第一章-绪论_第2页
高等多元统计分析第一章-绪论_第3页
高等多元统计分析第一章-绪论_第4页
高等多元统计分析第一章-绪论_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物信息科学与技术学院 哈尔滨医科大学主讲教师:统计遗传学教研室高等多元统计分析参考教材:多元统计分析于秀林 任雪松 中国统计出版社第一章 绪论1什么是多元统计分析 2346多元统计分析在生物信息学中的作用多元统计分析中数据的组织方式一元统计学分析基础知识回顾一、什么是多元统计分析1、什么是多元统计分析 多元统计分析是研究多个随机变量之间相互依赖关系以及内在规律性的一门科学例如:一、什么是多元统计分析一、什么是多元统计分析1、数据简化和结构简化 在不损失信息的情况下,如何简单的描述被研究对象,如主成分分析、因子分析等2、分类与分组 将具有某些相同属性的特征或样本分组。如基因芯片聚类分析等3、变

2、量间的依赖性研究 研究变量之间的相互关系,如共表达等二、多元统计分析在生物信息学中的作用 多元统计分析在生物信息学的研究中使用非常广泛,是生物信息学研究的必备工具。4、预测 根据已知一些变量的观测值,对另一些变量的值进行预测。如根据已知marker预测疾病状态。5、假设检验与验证 对些设想进行统计推断。二、多元统计分析在生物信息学中的作用数据分析在各个领域、各个行业都起着重要的作用(例如红楼梦作者验证)。问题: 当你进行一项社会数据调查或者实验数据记录时,你通常会怎么去做呢?用什么工具或软件,以什么格式存放数据呢? 例如: (1)测量全班同学的身高 (2)测量全班同学的身高、体重和年龄三、多元

3、统计分析中数据的组织方式(1)(2)三、多元统计分析中数据的组织方式三、多元统计分析中数据的组织方式三、多元统计分析中数据的组织方式实例:下图为一套基因表达谱数据,来自于GEO三、多元统计分析中数据的组织方式样本(个体)基因(特征)样本(个体)特征三、多元统计分析中数据的组织方式样本(个体)特征其中,n个样本,每个样本有p个特征即:P维向量三、多元统计分析中数据的组织方式注:当p=1的时候,为X一元随机变量,多元随机变量为一元随机变量的扩展。四、一元统计分析基础知识回顾数据是统计分析的生命。1、数据类型:离散型 和 连续型2、数据分布类型:离散型 和 连续型3、研究对象:随机变量 X (注:多

4、元统计中研究对象为随机向量)4、分布:频率 和 概率密度 5 累计分布:四、一元统计分析基础知识回顾离散型:连续型:sum切线斜率变化曲线下面积(从左侧累计)常见概率密度函数:四、一元统计分析基础知识回顾四、一元统计分析基础知识回顾6、参数估计 为什么要进行参数估计: (1)从理想到现实 (2)用少数的几个参数控制一整批数据参数估计分为:点估计和区间估计四、一元统计分析基础知识回顾7、参数估计好坏的评判标准(1)一致估计(样本量无限大时候的性质)(2)无偏估计:注:无偏估计就是系统误差为零的估计。四、一元统计分析基础知识回顾8、几个重要的参数估计一些重要的软件SAS,Matlab,R均使用无偏估计四、一元统计分析基础知识回顾实战:9、假设检验 基础:小概率事件是非随机发生的。其基本思想和步骤均可归纳为: 第一,提出待检验的假设H0和H1;第二,给出检验的统计量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论