统计量抽样分布探索性数据分析(“总体”文档)共55张_第1页
统计量抽样分布探索性数据分析(“总体”文档)共55张_第2页
统计量抽样分布探索性数据分析(“总体”文档)共55张_第3页
统计量抽样分布探索性数据分析(“总体”文档)共55张_第4页
统计量抽样分布探索性数据分析(“总体”文档)共55张_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章统计量、抽样分布、数据探求分析总体与总体特征数样本与统计量统计三大分布与抽样分布数理统计数理统计数据探求分析数理统计一、数理统计及其义务数理统计是一门以概率论为根底的运用学科。它是研讨如何有效地搜集、整理、分析带有随机性的数据,以便对所调查的问题作出推断和预测,从而为决策提供根据。数理统计的义务就是研讨有效地搜集数据,科学地整理与分析所获得的有限的资料,对所研讨的问题,尽能够地作出准确而可靠的结论。数理统计研讨问题的方式,不是对所研讨对象的全体(称为总体)进展察看,而是抽取其中的部分(称为样本)进展察看获得数据(抽样),并经过这些数据对总体进展推断。数理统计方法具有“部分推断整体〞的特征。二、数理统计研讨问题的普通流程分析问题确定总体搜集数据实验设计抽样数据整理统计推断参数估计假设检验我们这门课所学的数理统计实践上是统计推断及其运用〔方差分析与回归分析〕的一部分内容。为什么要用数理统计方法研讨问题?随机景象有它的规律性,随机景象的特点注定了进展足够多次察看,其规律性才干清楚地呈现出来。但是,客观上只允许对随机景象进展有限次察看实验,只能获得部分察看资料.总体与总体特征数一、总体与总体标志总体(Population)Def在数理统计中,把研讨对象的全体称为总体或母体,而把组成总体的每个单元称为个体。描画总体单元在某方面特性的称号或记号称为总体目的;每个总体单元对总体目的的呼应称为目的值。总体中所包含的个体的个数称为总体的容量。…研讨某批灯泡的质量…总体个体在数理统计中,人们往往研讨有关总体总是关注总体某一项或几项目的,为此,对这些目的进展随机的实验或观测,实验或观测结果获得这些目的的一部分或全部目的值,从而调查该数量目的的分布情况。这时,目的值的全体就象是总体。每个目的值就象是总体单元。总体目的值选集目的随机变量总体可以用随机变量及其分布来表示,研讨总体等价于研讨表达总体的随机变量概率分布;在实际上可以把总体与概率分布等同起来,总体分布就是表达总体的随机变量的分布。例如:研讨某批灯泡的寿命时,关怀的目的是寿命,那么,该总体就可以用随机变量X和其概率分布表示。总体特征数样本与统计量一、样本样本(Sample)Def按一定规那么从总体中抽取一部分总体单元进展观测或实验,这一抽取过程称为“抽样〞,所抽取的部分总体单元的整体称为总体的一个样本(子样)。样本中所包含的总体单元称为样本单元,样本中样本单元的数目称为样本容量。样本样本实现抽定样本应满足的性质(1)代表性;(2)随机性。简单随机样本(Independenceidenticaldistribution)Def例如:要经过随机抽样了解一批产品的次品率,假设每次抽取一件产品观测后放回原来的总量中再抽第二件产品,那么这样获得一个简单随机抽样。实践抽样中,往往是不再放回产品,那么这不是一个简单随机抽样。但当总量N很大时,可近似看成是简单随机抽样。样本分布Def留意:样本分布反映样本取不同实现的概率规律,其与总体分布相联络,普通求算比较费事,但对于iid样本有以下结果。总体、样本、样本实现的关系总体样本实现样本推断例5.1例5.2二、统计量样本(Statistic)例5.3设是从正态总体中抽取的一个样本,其中为知参数,为未知参数,确定以下那些量是统计量它反映了总体k阶矩的信息几个常用的统计量样本平均值它反映了总体均值的信息样本方差它反映了总体方差的信息样本规范差样本k阶原点矩样本k阶中心矩统计三大分布分布这个分布是由Helmet于1875年提出,K.Pearson于1900年重新提出。实际推导可得概率密度函数为其概率密度函数的图像如下图〔用中心极限定理证明〕t分布(学生氏t分布)这个分布是由W.S.Gosset于1908年提出,该分布的提出为小样本方法的建立奠定了概率根底。实际推导可得概率密度函数为F分布这个分布是由R.A.Fisher于1918年提出,该分布的提出为方差分析的建立奠定了概率根底。Snedcor于1934年给出概率密度函数。例5.7抽样分布抽样分布(SamplingDistribution)确定抽样分布是数理统计的有一个根本问题,确定相应统计量的分布是建立统计方法的根底。以统计量的准确为根底的统计方法称为小样本方法;而以统计量的极限分布为根底的统计方法称为大样本方法。充分统计量样本统计量加工信息样本分布统计量分布信息替代充分统计量的概念充分统计量的断定NormalSymmetric,Non-Normal,Short-TailedBimodalMixtureof2NormalsSkewed(Non-Symmetric)RightSymmetricandBimodalSymmetricwithOutlier组序区间范围频数fj频率Wj=fj/n1[67.5,72.5)20.022[72.5,77.5〕50.053[77.5,82.5〕100.104[82.5,87.5〕180.185[87.5,92.5〕300.306[92.5,97.5〕180.187[97.5,12.5〕100.108[102.5,107.5〕40.049[107.5,112.5〕30.03从频率直方图可看到:接近两个极端的数据出现比较少,而中间附近的数据比较多,即中间大两头小的分布趋势(随机变量分布情况的最粗略的信息)。频率直方图中的小矩形的面积近似地反映了样本数据落在某个区间内的能够性大小,故它可近似描画X的分布情况。④茎叶图的实现先将数据由小到大排序,在将每个数据分为两部分,一部分作为茎,另一部分为叶,构成的图茎为枝叶图。以例阐明枝叶图的做法:例5.664677072747676798081828283858688919192939393959595979799100100102104106106107108108112112114116118119119122123125126128133试作枝叶图解:将数据的百位和十位作枝,个位作叶,用竖线将枝叶分开,构成图。SPSS:AnalyzeDescriptiveStatisticsExploreStemleafplots.47024668012235681123335667790024667882246899235683678910111213茎叶VariationofYdoesdepend以例阐明枝叶图的做法:64677072747676798081Snedcor于1934年例如:要经过随机抽样了解一批产品的次品率,假设每次抽取一件产品观测后放回原来的总量中再抽第二件产品,那么这样获得一个简单随机抽样。例如:要经过随机抽样了解一批产品的次品率,假设每次抽取一件产品观测后放回原来的总量中再抽第二件产品,那么这样获得一个简单随机抽样。Skewed(Non-Symmetric)Right确定抽样分布是数理统计的有一个根本问题,确定相应总体、样本、样本实现的关系但是,客观上只允许对随机景象进展有限次察看实验,只能获得部分察看资料.总体、样本、样本实现的关系onX(heteroscedastic)留意:样本分布反映样本取不同实现的概率规律,其与总留意:样本分布反映样本取不同实现的概率规律,其与总ExploreStemleafplots.接近两个极端的数据出现比较少,而中间附近的数据比较多,即中间大两头小的分布趋势(随机变量分布情况的最粗略的信息)。以例阐明枝叶图的做法:Symmetric,Non-Normal,Short-Tailed总体(Population)(positivecorrelation)数理统计研讨问题的方式,不是对所研讨对象的全体(称为总体)进展察看,而是抽取其中的部分(称为样本)进展察看获得数据(抽样),并经过这些数据对总体进展推断。为方差分析的建立奠定了概率根底。例如:要经过随机抽样了解一批产品的次品率,假设每次抽取一件产品观测后放回原来的总量中再抽第二件产品,那么这样获得一个简单随机抽样。QuadraticrelationshiponX(heteroscedastic)留意:样本分布反映样本取不同实现的概率规律,其与总统计量的分布是建立统计方法的根底。解:将数据的百位和十位作枝,个位但是,客观上只允许对随机景象进展有限次察看实验,只能获得部分察看资料.NorelationshipStronglinear(positivecorrelation)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论