统计概念汇总_第1页
统计概念汇总_第2页
统计概念汇总_第3页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计概念汇总总体、个体: 在统计学中,将我们研究的问题所涉及的对象的全体称为总体,而把总体中的每个 成员称为个体。样本、样本容量: 样本是总体中所抽取的一部分个体,而样本容量是指样本中个体的数目。 简单随机抽样: 设一个总体的个数为 N .如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.这样抽取的样本,叫做简单随机样本 .系统抽样: 当总体中的个体数目较多时, 可将总体分成均衡的几个部分, 然后按事先定出的规则, 从每一部分抽取一个个体,得到所需要的样本 .这种抽样称为系统抽样 .分层抽样: 当已知总体是由差异明显的几部分组成时,常将

2、总体分成几部分,然后按照各部分所 占得比进行抽样,这种抽样叫分层抽样。三种抽样的基本步骤:1. 简单随机抽样:抽签法和随机数表法抽签法基本步骤:将总体中的个体编号;制签;在箱子中搅匀签条;抽取随机数表法基本步骤:将总体中的个体编号;利用随机数表按规则取数;汇总2. 系统抽样的步骤: 将总体中的个体随机编号; 将编号分段; 在第1 段中用简单随机抽样确定起始的个体编号;按照预先研究的规则抽样注意:有时候先剔除一部分个体 (不整除)3. 分层抽样的步骤分层;按照比例确定每层抽取的人数;各层抽样;(方法可以是简单随机 抽样也可以是系统抽样)汇合成样本总体分布的估计:由于总体分布通常不易知道,往往用样

3、本的频率分布估计总体分布,样本的容量越大,估计越精确。编制频率分布表的方法步骤 :求极差;决定组距与组数;决定分点,将数据分组;登记频数,计算频率,列出频率分布表 频率分布条形图当总体中个体取不同数值很少时步骤(列频率分布表,画条形图)频率分布直方图 总体的个体取不同值较多甚至无限时 步骤:计算最大小值;决定组距和组数 ,决定分点,列频率分布表,画直方图频率分布折线图:把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图横轴上的左右端点没有实际意义;当样本容量越大,所分组数越多,折线图将越接近于总体密度曲线.总体密度曲线:在频率分布直方图中,样本容量越大,所分组数越多,在各

4、组的频率就越接近总体在相应各组中取值得概率设想样本容量无限增大,分组的组距无限缩小,那么频率与分布直方图就会无限接近于一条光滑曲线,这条曲线就是总体密度曲线(x u)2正态分布:如果总体密度曲线是或近似的是函数f(x),x ()的图像,其中实数u,实参数,分别表示总体的平均数与标准差,这个总体是有无限容量的抽象总体,其分2布叫正态分布,记作 N(u,)标准正态分布:正态分布函数中,当u 0,1时,正态总体成为标准正态总体 .此时相应函数的表示式是f (x),此时记为N(0,1).正态曲线的性质:(1)曲线在x轴上方,与x轴不相交.(2)曲线关于直线x u对称.(3)曲线越小,曲线越“瘦高”的形

5、状由 确定. 越大,曲线越“矮胖”,表示总体的分布越分散;表示总体的分布越集中假设检验:进行假设检验可归结为如下三步:(1 )提出统计假设;(2 )确定一次试验中的取值 a是否落入范围 (u 3 ,u 3 ) .( 3 )作出判断.如果a (u 3 ,u 3 ),接受假设;如果 a (u 3 ,u 3 ),由于这是小概率事件,就拒绝统计假设(u ,u)取值概率68.3%(u 2 ,u 2 )取值概率95.4%(u 3 ,u 3 )取值概率99.7%茎叶图:用中间的数字表示数据的十位数,两边的数字表示数据的个位数,茎按从小到大的顺序 从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列

6、出,这样的图叫做茎叶图 优点:一是从统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶 图便于记录与表示 缺点:其分析只是粗略的,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便5032875421012381 24719936152中位数:将数据按从小到大或从大到小,处在中间的数据;但当数据为偶数个时,处于中间两个 的数据的平均数为中位数;众数:在数据中出现次数最多的数。但众数不一定是唯一的。样本方差、样本标准差:设样本元素为Xi,X2, Xn,样本的平均数为X ,定义s2 (Xi X)2 (X2 X)2n(Xn X)2(Xi X)2 (X2 X)2(Xn

7、X)2其中s2表示样本方差,s表示样本标准差相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系与函数关系不同,相关关系是一种非确定性关系 散点图:具有相关关系的两个变量的数据所对应的图形,不是一条确定的直线,而是一些散乱得点,这个图形叫散点图回归直线方程:设X和y是具有相关关系的两个变量且相应于n组观测值的的n个点大致分布在一条直线附近,这条直线就是回归直线.回归直线的方程叫做回归直线方程.该方程为Xi ynxyy? bx a,a、b叫回归系数.其中b? , a y bx .2-2Xi nxi 1最小二乘法:为了刻画实际观察值 yi与回归直线上相应点纵坐标的

8、偏离程度,我们用离差的平方n2和,即Q (yi a bXi)作为总离差,并使之达到最小 这样,回归直线就是所有直线中Q取i 1最小值的那一条由于平方又叫二乘法,所以这种使“离差平方和为最小”的方法,又叫最小二乘样本相关系数:对于变量y与x的一组观测值来说,我们把n(Xi x)(yi y)i 1nn(x x)2(yi y)2i 1i 1nXi yi nxyi 1叫做变量y与x之间的样本相关 nn(X2 nx)2(yi2ny2)i 1i 1系数(简称相关系数),用它来衡量它们之间的线性相关程度.r具有以下性质:| r | 1,且|r |越接近1,线性相关程度越强;| r |越接近0 ,线性相关程度越弱若| r | 1则称x、y完全线性相关 相关性检验的步骤:(1)作统计假设:x与y不具有相关性相关关系.(2)根据小概率0.05与n 2 附表中查出r的一个临界值ro.05.( 3)根据样本相关系数计算公式算出r的值.(4)作统计推断如果|r | ro.05,表明有95%的把握认为x与y之间具有线性相关关系.独立性检验:2n("

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论