多元描述统计_第1页
多元描述统计_第2页
多元描述统计_第3页
多元描述统计_第4页
多元描述统计_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元描述统计1第一页,共五十八页,编辑于2023年,星期五多元数据的表格形式设p个变量来记录事物的特征,对于每个个体或单位,记录下这些变量的测量值。我们用记号表示第i个样本上第j个变量的测量值,即

xij=第j个变量的第i项测量值第二页,共五十八页,编辑于2023年,星期五多元数据的矩阵形式X=(xij)n×p第三页,共五十八页,编辑于2023年,星期五例题分析消费者物价指数(CPI)是反映与居民生活有关的产品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标。商品零售价格指数是反映一定时期内商品零售价格变动趋势和程度的相对数。两者都能为研究市场流通、进行国民经济核算提供依据。第四页,共五十八页,编辑于2023年,星期五样本数据的矩阵形式为:第五页,共五十八页,编辑于2023年,星期五多元描述统计量样本均值样本协方差样本相关系数第六页,共五十八页,编辑于2023年,星期五样本均值矩阵形式其中第七页,共五十八页,编辑于2023年,星期五样本协方差矩阵形式其中事实上,sjk是变量j和k的协方差当j=k时,sjj是变量j的方差,也常记为sjk=skj

,即S是对称矩阵。第八页,共五十八页,编辑于2023年,星期五样本相关系数矩阵形式其中R也为对称矩阵第九页,共五十八页,编辑于2023年,星期五数据的标准化处理公式其中此时,第十页,共五十八页,编辑于2023年,星期五SPSS应用-样本均值和方差Analyze→DescriptiveStatistics→Frequencies统计量第十一页,共五十八页,编辑于2023年,星期五单击“Statistics”按钮,弹出“Frequencies:Statistics”对话框分位数离散程度集中趋势第十二页,共五十八页,编辑于2023年,星期五输出结果

X1X2NValid44

Missing00Mean104.4500103.5000Variance3.536673.44667结果解释两个变量的均值分别为104.45和103.5两个变量的方差分别为3.53667和3.44667Statistics第十三页,共五十八页,编辑于2023年,星期五SPSS应用-样本协方差Analyze→Scale→ReliabilityAnalysis第十四页,共五十八页,编辑于2023年,星期五单击“Statistics”按钮,弹出“ReliabilityAnalysis:Statistics”对话框第十五页,共五十八页,编辑于2023年,星期五输出结果RELIABILITYANALYSIS-SCALE(ALPHA)

CovarianceMatrixX1X2X13.5367X2

3.3933

3.4467NofCases=4.0ReliabilityCoefficients2itemsAlpha=.9857Standardizeditemalpha=.9858第十六页,共五十八页,编辑于2023年,星期五SPSS应用-样本相关系数Analyze→Correlate→Bivariate第十七页,共五十八页,编辑于2023年,星期五输出结果

X1X2X1PearsonCorrelation1.972(*)

Sig.(2-tailed)..028

N44X2PearsonCorrelation.972(*)1

Sig.(2-tailed).028.

N44结果解释两个变量之间的相关系数为0.972,P值为0.028(小于显著性水平0.05),所以相关性显著。

第十八页,共五十八页,编辑于2023年,星期五SPSS应用-数据的标准化变换Analyze→DescriptiveStatistics→Descriptives第十九页,共五十八页,编辑于2023年,星期五输出结果(1)

NMinimumMaximumMeanStd.DeviationX14102.50106.30104.45001.88060X24101.40105.30103.50001.85652ValidN(listwise)4

第二十页,共五十八页,编辑于2023年,星期五输出结果(2)结果解释表中的“zx1”和“zx2”为标准化后的值,可以进行后续的统计分析第二十一页,共五十八页,编辑于2023年,星期五常用的统计图散点图条形图线图…第二十二页,共五十八页,编辑于2023年,星期五注意问题利用图表表示数据时,首先要确定数据所属类型是定性数据还是定量数据定性数据常用的图形表示:条形图饼图环形图定性数据常用的图形表示:直方图茎叶图箱线图散点图气泡图雷达图第二十三页,共五十八页,编辑于2023年,星期五定性数据的图示—条形图用宽度相同的条形的高度或长短来表示各类别数据的图形有单式条形图、复式条形图等形式主要用于反映分类数据的频数分布绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图第二十四页,共五十八页,编辑于2023年,星期五用Excel生成频数分布表

(例题分析)【例】一家市场调查公司为研究不同类型饮料的市场占有率,对随机抽取的一家超市进行调查。调查员在某天对50名顾客购买饮料的类型进行了记录,如果一个顾客购买某一类型的饮料,就将这一类型的饮料记录一次。右边就是记录的原始数据绿色健康饮品第二十五页,共五十八页,编辑于2023年,星期五定性数据的图示—条形图

(例题分析)第二十六页,共五十八页,编辑于2023年,星期五使用Excel数据透视表数计数

(pivottable)第1步:选择【数据】菜单中的【数据透视表和数据透视图】第2步:确定数据源区域第3步:在【向导—3步骤之3】中选择数据透视表的输出位置。然后选择【布局】第4步:在【向导—布局】对话框中,依次将“分类变量“(这里是饮料品牌)连续拖放两次:一次拖至左边的“行”区域,一次拖至“数据”区域第5步:然后单击【确定】,自动返回【向导—3步骤之3】对话框。然后单击【完成】,即可输出数据透视表用数据透视表产生分类数据的频数分布第二十七页,共五十八页,编辑于2023年,星期五使用Excel中“直方图”

生成频数(率)分布表【数据分析】工具的安装【工具】——【加载宏】——【分析工具库】【直方图】命令的使用【数据分析】——【直方图】第二十八页,共五十八页,编辑于2023年,星期五定性数据的图示—饼图也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题绘制圆形图时,样本或总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,按各部分数据百分比乘以3600确定第二十九页,共五十八页,编辑于2023年,星期五定性数据的图示—饼图

(例题分析)第三十页,共五十八页,编辑于2023年,星期五定性数据的图示—环形图环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环用于结构比较研究第三十一页,共五十八页,编辑于2023年,星期五定性数据的图示—环形图

(例题分析)【例】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?”1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意。第三十二页,共五十八页,编辑于2023年,星期五定性数据的图示—环形图

(例题分析)8%36%31%15%7%33%26%21%13%10%

非常不满意

不满意

一般

满意

非常满意

甲乙两城市家庭对住房状况的评价第三十三页,共五十八页,编辑于2023年,星期五生成频数分布表

(分组)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,组数一般为5K15确定组距:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值-最小值)÷组数3.

统计出各组的频数~~~~~第三十四页,共五十八页,编辑于2023年,星期五生成频数分布表

(例题分析)【例】某电脑公司2008年前4个月每天的销售额数据。用Excel生成频数分布表

用Excel制作频数分布表

第三十五页,共五十八页,编辑于2023年,星期五使用Excel中“直方图”

生产频数分布表用于展示分组数据分布的一种图形用矩形的宽度和高度来表示频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图第三十六页,共五十八页,编辑于2023年,星期五用SPSS绘制直方图第1步:选择【Graphs】下拉菜单,并选择【histogram】选项进入主对话框第2步:在主对话框中将变量选入【Variables】,点击【OK】

用SPSS绘制直方图

第三十七页,共五十八页,编辑于2023年,星期五分组数据—直方图

(SPSS绘制的直方图)第三十八页,共五十八页,编辑于2023年,星期五分组数据—直方图

(直方图与条形图的区别)条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义直方图的各矩形通常是连续排列,条形图则是分开排列条形图主要用于展示分类数据,直方图则主要用于展示数值型数据第三十九页,共五十八页,编辑于2023年,星期五原始数据—茎叶图用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶树叶上只保留最后一位数字茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息直方图适用于大批量数据,茎叶图适用于小批量数据第四十页,共五十八页,编辑于2023年,星期五用SPSS绘制茎叶图和箱线图

(包括直方图)第1步:选择【Analyze】下拉菜单,并选择【Descriptivestatistics-Explore】选项进入主对话框第2步:在主对话框中将变量选入【DependentList】,点击【Plots】,在对话框中选择【Stem-and-leaf】(根据需要可选【Histogram】以给出直方图)。点击【Continue】回到主对话框。点击【OK】

用SPSS绘制茎叶图第四十一页,共五十八页,编辑于2023年,星期五原始数据—茎叶图

(例题分析)某电脑公司销售额分布的茎叶图第四十二页,共五十八页,编辑于2023年,星期五原始数据—箱线图用于显示未分组的原始数据的分布由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成绘制方法首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU)连接两个四分位数画出箱子,再将两个极值点与箱子相连接该箱线图也称为Median/Quart./Range箱线图

第四十三页,共五十八页,编辑于2023年,星期五原始数据—简单箱线图

(箱线图的构成)中位数4681012QUQLX最大值X最小值Median/Quart./Range箱线图第四十四页,共五十八页,编辑于2023年,星期五原始数据—简单箱线图

(例题分析)最小值141最大值237中位数182下四分位数170.25上四分位数197140150160170180190200210220230240某电脑公司销售额数据的Median/Quart./Rang箱线图第四十五页,共五十八页,编辑于2023年,星期五原始数据—多批数据箱线图

(例题分析)【例】

从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表。试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征11名学生各科的考试成绩数据课程名称学生编号1234567891011英语经济数学西方经济学市场营销学财务管理基础会计学统计学计算机应用基础76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177第四十六页,共五十八页,编辑于2023年,星期五用SPSS绘制多批数据箱线图第1步:选择【Graphs】下拉菜单,并选择【Boxplot】第2步:在出现的对话框中选择【Simple】,在【DatainChatAre】中选择【Summariesofseparatevariables】,点击【Define】返回主对话框第3步:在主对话框将所有变量(这里是8门课程)选入【Boxes

Represent】。点击【OK】

用SPSS绘制箱线图第四十七页,共五十八页,编辑于2023年,星期五原始数据—多批数据箱线图8门课程考试成绩的Median/Quart./Range箱线图第四十八页,共五十八页,编辑于2023年,星期五11名学生考试成绩的Median/Quart./Range箱线图原始数据—多批数据箱线图第四十九页,共五十八页,编辑于2023年,星期五两个变量间的关系—二维散点图

(2DScatterplots)展示两个变量之间的关系用横轴代表变量x,纵轴代表变量y,每组数据(xi

,yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的二维数据图温度/0C降雨量/mm产量/kg/hm262522508403450105845001368575014110580016987500211208250第五十页,共五十八页,编辑于2023年,星期五两个变量间的关系—二维散点图

(2DScatterplots)第五十一页,共五十八页,编辑于2023年,星期五用SPSS绘制散点图矩阵

(MatrixScatter)第1步:选择【Graphs】下拉菜单,并选择【Scatter/Dot】第2步:在出现的对话框中选择【MatrixScatter】(要绘制三维散点图,点击【3DScatter】,并定义各坐标轴),点击【Define】,中将所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论