统计学基础知识与简单应用课件_第1页
统计学基础知识与简单应用课件_第2页
统计学基础知识与简单应用课件_第3页
统计学基础知识与简单应用课件_第4页
统计学基础知识与简单应用课件_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4章统计学基础及简单应用1第4章统计学基础及简单应用11统计学基本概念1频率分布及其图形假设某商店在10天内每天销售的啤酒数为36、34、35、36、35、35、33、35、36、37。为分析啤酒每天销量的分布,可依据每天啤酒销售量的值,将啤酒的销量分成几组。如32.5~34.5、34.5~36.5和36.5~37.5三组,再分别统计各组的频数。第一组包括销售量33、34,频数为2,频率为2/10。21统计学基本概念1频率分布及其图形21统计学基本概念2组距每组的上下限之差称为组距。每组的上下限的平均值称为组中心。3直方图和频数多边形把组距作为横坐标,频数作为纵坐标,在每一组上竖起一个长方形,这样的图形称为直方图。把每个长方形的顶部的中心依次用折线连起来,折线所围的多边形称为频数多边形。31统计学基本概念2组距31统计学基本概念4累积频数和累积频率根据统计出的频数分布,把相应的组频数相加,称为累积频数。把对应的频率相加,称为累积频率。5累积频率分布图和累积频率多边形图以组距为横坐标,累积频率为纵坐标,在每组上竖起一个长方形,其底长等于组距,高等于累积频率,称为累积频率分布图;用折线连接各个长方形的中点,得到累积频率多边形图。41统计学基本概念4累积频数和累积频率41统计学基本概念2中心位置特征值:平均数、中位数和众数均值:数据的算术平均值,中位数:用于表示数据的中间位置。将数据按照大小排列,然后取位于中间的一个,即为中位数。当数据个数为奇数时,中位数为位置居中的一个;当数据个数为偶数时,中位数为中间位置两个数的平均值。51统计学基本概念2中心位置特征值:平均数、中位数和众数51统计学基本概念众数:表示数据的中间位置特征,一般为一组数据中频数最大的那个数。几何平均数:n个变量值连乘积的n次方根,主要用于现象的总比率是若干比率的连乘积或现象的总发展速度是各个时期发展速度的连乘积的时候。某流水作业的装配分三道工序,第一道工序的产品合格率为98%,第二道工序的产品合格率为93%,第三道工序的产品合格率为89%。求各工序的平均产品合格率?61统计学基本概念众数:表示数据的中间位置特征,一般为一组数1统计学基本概念调和平均数:各个标志值倒数的算术平均数的倒数,又称为倒数平均数。有甲、乙、丙三种产品,其价格分别是30元、40元、50元,现各购进1万元的商品,问商品的平均价格是多少。71统计学基本概念调和平均数:各个标志值倒数的算术平均数的倒1统计学基本概念3变异程度1极差:最大值与最小值之差2中间位差:极差在一定程度上描述了数据的变异程度,但它忽略了中间的所有数据,并受到最大值和最小值的过大影响。为了排除极值的过大影响,可以排除两端的一些数据,只取中间的一部分数据的极差。这部分数据的极差称为中间位差。中间位差以其所包含数据的百分率命名。例如70%中间位差就是指除去前面和后面各15%的数据后,所余中间数据的极差。81统计学基本概念3变异程度81统计学基本概念3平均离差:表示各个数据离开它们的中心位置的平均距离。91统计学基本概念3平均离差:表示各个数据离开它们的中心位1统计学基本概念4方差和标准差是两个比较理想的描述数据变异程度的特征值,设一个样本的数据容量为n,则样本方差为:标准差101统计学基本概念4方差和标准差标准差101统计学基本概念5总体平均值和总体标准差111统计学基本概念5总体平均值和总体标准差111统计学基本概念6分位数若把一批已经按大小顺序排列起来的数据划分成一特定数目的组数,每组内含有相同数目的数据,则此时分割的数据称为分位数。例如,百分位数就是把数据分成100组,每组内含有相同数目的数据。第90个百分位数,就是指在这一数据之下有90%的数据,在它之上有10%的数据。十分位数和四分位数就是把数据分成10组和4组,在每组中含有相同数目的数据。第三个四分位数是这样的一个数据:有3/4的数据在它前面,有1/4的数据在它后面。121统计学基本概念6分位数121统计学基本概念7偏度如果一个分布在中位数左右两侧是形状对称,则该分布是对称的。一般情况下,对称分布的平均数、中位数和众数都相等,但有些分布不是对称的。分布的对称性可用偏度来度量。偏度定义:其中,S为标准差,x为平均值。根据a3的值,可分为:右偏a3>0;无偏:a3=0;左偏:a3<0131统计学基本概念7偏度其中,S为标准差,x为平均值。根据1统计学基本概念8峰度用于描述分布形状的平坦状况,其定义为:

通常情况下,若分布形状陡峭,则峰度较大;若分布平坦,则峰度较小。141统计学基本概念8峰度141统计学基本概念9变异系数标准差S描述的是分布的绝对变异,其中和计算的单位有关。采用标准差来比较两组不同单位的数据的变异程度是不合适的。这时应采用无单位的变异系数来比较,其定义为:151统计学基本概念9变异系数152SPSS统计描述例2-1学生成绩中,分性别、班级计算平均数、标准差等。Analyze->DescriptiveStatistics->Descriptive需多组数据分类汇总后再进行计算Analyze->Reports->CaseSummaries项162SPSS统计描述例2-1学生成绩中,分性别、班级计算平均2SPSS统计描述统计结果172SPSS统计描述统计结果172SPSS统计描述在抽样调查中,存在着抽样误差,标准误是衡量抽样误差大小的统计量,其值小,说明样本平均数与总体平均数较接近;反之,两者的差异大。标准差和标准误是不同的两个概念,前者说明数据与其平均数的偏离程度,后者说明样本平均数与总体平均数的接近程度。标准误Std.ErrorofMean标准差StandardDeviation182SPSS统计描述在抽样调查中,存在着抽样误差,标准误是衡2SPSS统计描述Kurtosis:峰度及其标准误。若变量服从正态分布,则其值为0,大于0时比正态分布峰高,小于0时比正态分布峰低。Skewness:偏度及其标准误,若变量服从正态分布,则其值为0。大于0时为正偏或右偏,小于0时为负偏或左偏。192SPSS统计描述Kurtosis:峰度及其标准误。若变量2SPSS统计描述次数分布(频数分布)次数分布,是指总体或样本按随机变量(数据)大小次序在出现频率上的排列。一般采用次数分布表、次数分布直方图或次数分布曲线来表示。例3-1,现有50名学生的成绩,原始成绩如表13.1所表示,统计次数分布情况。Analyze->Descriptive->Frequencies项进行频率统计202SPSS统计描述次数分布(频数分布)202SPSS统计描述次数分布结果见例3-1.spoCharts……定义Barcharts:条形图PieCharts:饼状图Histograms:直方图,Withnormalcurve,图中带有正态曲线以例2-1为例,计算次数分布情况。212SPSS统计描述次数分布212SPSS统计描述次数分布20:有20%的数据小于65分。60:有60%的数据小于83分。80:有80%的数据小于88分。222SPSS统计描述次数分布20:有20%的数据小于65分。2SPSS统计描述正态分布232SPSS统计描述正态分布232SPSS统计描述由图中可看出,变量基本服从正态分布。正态分布是理论研究与应用中十分重要的一种分布,许多变量都服从正态分布,如考试成绩、某些心理、生理指标等。SPSS软件给出了判断某个变量是否服从正态分布的方法,可以利用这一点做某些判断。242SPSS统计描述由图中可看出,变量基本服从正态分布。242SPSS统计描述Frequencies过程可以产生详细的频数表,还可以按要求给出某百分位点的数值以及常用的条图、饼图等。如果想用Frequencies过程得到我们所熟悉的频数表,则先用recode过程产生一个新变量来代表所需的各组段。252SPSS统计描述Frequencies过程252SPSS统计描述Frequencies过程某地101例健康男子血清总胆固醇测定结果如下,请绘制频数表、直方图,计算均数、标准差、变异系数、中位数M、P2.5,P97.5的数值。数据文件为dguchun.sav262SPSS统计描述Frequencies过程262SPSS统计描述Frequencies过程某地101例健康男子血清总胆固醇测定结果如下,请绘制频数表、直方图,计算均数、标准差、变异系数、中位数M、P2.5,P97.5的数值。数据文件为dguchun.sav272SPSS统计描述Frequencies过程272SPSS统计描述Descriptives过程对变量进行描述性统计分析,计算并列出一系列相应的统计指标。282SPSS统计描述Descriptives过程282SPSS统计描述例某市1995年110名7岁男童的身高资料已按频数表格式输入,变量groupmid代表所在组段的组中值,freq代表组段频数,请求出该资料的均数、标准差、中位数和四分位数间距。High.sav首先利用weightcases加权,然后用Frequencies过程求出。292SPSS统计描述例292SPSS统计描述正态分布正态分布曲线的形状和位置由平均分和标准差S所决定。平均分对应于单峰位置,越大,曲线越往右移动。标准差S越大,曲线的单峰位置越低,宽度越大,显得越“胖”;S越小,曲线的高度越高,宽度越小,显得越“瘦”。302SPSS统计描述正态分布302SPSS统计描述正态分布在正态分布曲线图上,正态曲线以下,以S为距离单位所包括的面积是按一定比例分配的,若将正态曲线底边从-3S到3S分成四等分,每等分距离为1.5S,则每距离间隔之间所包括的面积比例如下所示:312SPSS统计描述正态分布312SPSS统计描述正态分布组别区间范围区间面积比例A1.5S—3S6.6%BM—1.5S43.3%C-1.5S—M43.3%D-3S—-1.5S6.6%322SPSS统计描述正态分布组别区间范围区间面积比例A1.52SPSS统计描述正态分布6.6%6.6%43.3%43.3%差中良好332SPSS统计描述正态分布6.6%6.6%43.3%43.2SPSS统计描述正态分布利用正态分布曲线的性质,可以得到划分不同学习水平等级的界限和学生人数比例的理论数值。将理论数值与实际数值进行比较,可以对学生的实际情况进行判断。342SPSS统计描述正态分布342SPSS统计描述-S平面特征数据分析模型1象限,平均水平高,但分离度大,存在低分生2象限,平均水平低,且分离度大,存在高分生3象限,平均水平低,且集中,属差劣状态。4象限,平均水平高,且集中,属优良状态。352SPSS统计描述-S平面特征数据分析模型352SPSS统计描述例题P342,例13-31定义变量,输入数据2数据排序Data->SortCases3计算平均分与标准差Analyze->DescriptiveStatistic->Descriptives362SPSS统计描述例题P342,例13-3362SPSS统计描述例题P342,例13-34分组统计平均分和标准差Analyze->Reports->CaseSummaries372SPSS统计描述例题P342,例13-3372SPSS统计描述例题P342,例13-35次数分布表的形成利用例3-1的50个学生的成绩形成次数分布表转换数据,生成新变量:Transform->RecodeIntoDifferentVariable统计分析次数分布:Analyze->DescriptiveStatistic->Frequencies382SPSS统计描述例题P342,例13-3382SPSS统计描述例题P342,例13-3392SPSS统计描述例题P342,例13-3393SPSS中的ReportsOLAPCubes过程:用于按指定的范围对一个或多个变量做出描述,可以得到一些常用的描述统计量。其特点是可以分层变化不同水平的组合进行变量的描述。CaseSummaries过程:对记录进行汇总,与OLAPCubes过程相比,不仅可以计算描述统计量,还可以分组进行汇总,并能够给出详细的记录列表。ReportSummariesinRows/Columns过程:按行和列输出结果,可进行精确定义。403SPSS中的ReportsOLAPCubes过程:用于3SPSS中的Reports1OLAPCubes过程在线分析处理OnlineAnalyticalPro

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论