统计学导论期末复习总结_第1页
统计学导论期末复习总结_第2页
统计学导论期末复习总结_第3页
统计学导论期末复习总结_第4页
统计学导论期末复习总结_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、复习总结,统计推断,统计模型,描述性统计 图表,观测数据 (样本,了解背景知识 明确分析目的 确定获得数据方法,未知现象,获取观测资料,分析观测资料,探索未知现象流程图,随机现象中的随机性与规律性,概率理论发展的几个重要阶段,概率的公理化体系的建立 随机变量的引入 随机变量的分布函数的引入,基本概念,样本空间和样本点 随机事件 样本空间上的 代数 波雷尔集 概率空间,事件的运算,事件的并、交、差、余 对偶原理 分配律,概率的性质,不可能事件的概率为0 有限可加性 可减性 单调性 加法公式,概率性质的应用,利用概率性质计算一些随机事件的概率,随机变量,R,随机变量,离散型随机变量,连续型随机变量

2、,奇异型随机变量,密度矩阵,分布函数,密度函数,分布函数,随机变量的数字特征,1、随机变量的数学期望; 2、随机变量的方差、标准差,数学期望具有线性性,1) E ( c )= c (2) E (aX+b)=aE (X)+b (3) E (aX+bY )=aE (X)+bE (Y,D(c)=? D(aX+b)=,随机变量的方差,标准差(或标准偏差,计算公式,常用分布及其数字特征,两点分布:XB(1,p,二项分布:XB(n,p,Poisson分布:XP(,超几何分布:参数M,K,n,超几何分布的均值: nK/M,均匀分布:XU(a,b,正态分布:XN(,2,背景、概率密度函数、分布函数、均值、方差

3、,切比雪夫不等式,定理2.5.2 若随机变量X的数学期望为有限数,则 成立的概率为1,这里Xk为X的第k次重复观测结果,大数定律,定理2.5.4 设随机变量X的数学期望和方差都为实数,并且方差大于0。若 为随机变量X的n次独立重复观测,则 其中 为标准正态分布随机变量的分布函 数,,中心极限定理,第三章,分类变量:描述个体的分类特征的变量; 数值变量:描述个体的数量特征的变量,把分类变量的不同取值用数来表示,就可以把分类变量看出是随机变量,对分类变量来讲,数学期望和方差等概念是没有意义的,个体、个体的指标、总体; 样本点、样本空间,个体的一项指标X: 映射X: R X: (, F, P) (R

4、, B, FX,变量:X 总体分布: FX,总体参数:总体分布未知的特征指标。 统计量:不含任何参数的样本的函数。 普查:收集总体中每个个体的指标数据的过程。 抽样调查:收集总体中部分个体的指标数据的过程。 样本:由总体的部分个体组成。 样本容量:样本中所包含的个体数。 有限总体:有限个个体组成的总体。 无限总体:无限个个体组成的总体,四种抽样方法,1、简单随机抽样 2、系统随机抽样 3、分层随机抽样 4、整群随机抽样,实施的步骤、每种方法的优点与缺点,在什么情况下使用,选择抽样方法的原则: 1、样本的代表性好,即样本在总体中分布均匀; 2、容易实施,随机样本:通过随机抽样得到的观测样本. 方

5、便样本:容易得到的观测样本,随机抽样:使得每个个体都以确定的(大于0)的概率被选到样本中的抽样方法,抽样调查的必要性: 1、无限总体时不能使用普查的方法; 2、获取个体指标的过程具有破坏性; 3、成本、时效性等方面的要求,误差,抽样误差,非抽样误差,调查误差(测量误差) 不完整的抽样框引起的误差 不回答误差 数据转录误差,试验组:采用了新方法的一组; 对照组:没有采用新方法的一组,选择试验组和对照组的原则:随机选择,即从总体中随机地选择参加实验的样本,再从样本中随机地选择试验组,为什么要随机选择,1、两个组所处的外部环境相同; 2、在实验前两组之间没有差异,目的:如果实验的结果是两组有显著的差

6、异,可以解释为新方法的影响,对人做实验时产生的问题: 1、组织问题; 2、心理学问题; 3、道德伦理问题; 4、敏感性问题,一、统计表(频数表、频率表、列联表) 二、统计图(频率直方图、频数直方图、分组频数条形图、条形图、饼图、点图、茎叶图、盒形图) 三、统计量(均值、中位数、众数、极差、四分位间距、方差、标准差、平均绝对离差、变异系数、分位数,次序统计量,分组数目的确定,组边界的确定,由样本计算统计量 由分组数据近似计算统计量,异常数据 什么样的数据是异常数据? 产生异常数据的原因有哪些,主要掌握两个方面,不同的统计图转递给你的信息是不同的,理解每一种图给你的主要信息是什么。 根据你的数据选

7、用不同的统计图向其他人转递你的数据里包含的信息,文科的女生比男生多,理科中男女生比例差不多,文科中女生的比例高于理科中女生的比例,文科,理科,样本数据的标准化 什么时候要对样本数据标准化? 标准得分的解释,总体分布函数的估计:经验分布函数,参数估计方法:矩估计和极大似然估计,估计的标准:均方误差最小,无偏估计的含义,norminv(p,常用分布的函数,mean(x), mean(x,2), sum(x), sum(x,2), median(x),median(x,2), range(x), range(x,2), mad(x), mad(x,2), var(x),var(x,2), std(x), std(x,2,统计函数,plot(x,y), boxplot(x), bar(x,g)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论