第8章数据的统计分析与软件应用176.ppt_第1页
第8章数据的统计分析与软件应用176.ppt_第2页
第8章数据的统计分析与软件应用176.ppt_第3页
第8章数据的统计分析与软件应用176.ppt_第4页
第8章数据的统计分析与软件应用176.ppt_第5页
已阅读5页,还剩165页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2020/7/30,1,第8章,数据的统计分析与软件应用,2020/7/30,2,主要内容,第一节 统计分析的基本理论 第二节 定性分析方法 第三节描述性统计分析 第四节 解析性统计分析,2020/7/30,3,第一节 统计分析的基本理论,一、统计整理 二、统计分组法 三、次数分布 四、统计图,2020/7/30,4,一、统计整理的定义,统计整理是根据统计研究的任务,对统计调查所搜集到的大量原始资料进行加工汇总,使其系统化、条理化、科学化,以得出反映事物总体综合特征的资料的工作过程。,2020/7/30,5,(二)统计整理的内容,1、录入数据,建立数据表 2、数据排序 与分组 3、编制次数分布

2、表与累计次数分布表 4、绘制统计图,2020/7/30,6,对数据进行排序1,打开 “2统计图表.xls” 工作簿,选定“成绩排序”工作表。 利用鼠标选定单元格区域。,2020/7/30,7,在菜单中选择“数据”中的“排序”选项,则弹出排序对话框。,2020/7/30,8,在排序对话框窗口中,选择“主要关键字”列表中的“英语”作为排序关键字,并选择按“递增”排序。由于所选取数据中已经包含标题,所以在“当前数据清单”中选择 “有标题行”,然后单击 “确定”按钮,即可得到 排序的结果。,2020/7/30,9,对数据进行排序2,打开 “2统计图表.xls” 工作簿,选定“成绩排序”工作表。 使用R

3、ANK函数进行排序: RANK(指定数字,范围,0) 注意:0或者忽略表示降序,非零值表示升序。 范围要用绝对地址。,2020/7/30,10,演示,2020/7/30,11,2020/7/30,12,2020/7/30,13,4. 编制次数分布表与累计次数分布表 次数分布表可以表明各组间的单位数在总体中所出现的次数或所占比重,从而描述总体的内部结构,揭示总体中的关键因素与本质特征。 累计次数分布则能够表明各标志值以上或以下所出现的次数或比重。,2020/7/30,14,表213某班统计学考试成绩次数分配,返回,2020/7/30,15,统计图 各种各样的统计图可以形象、直观地表明数据的分布形

4、态与发展变化的趋势。,2020/7/30,16,三、 Excel中的统计整理工具,1. 数据排序 Excel可以根据用户的要求对数据表的行或列数据进行排序。排序时,Excel 将利用指定的排序顺序重新排列行、列或各单元格,从而使现象的规则性更加简洁地表现出来。,2020/7/30,17,2. 频数分布函数 频数分布函数是Excel 的一个工作表函数,是编制次数分布的主要工具,通过频数分布函数,可以对数据进行分组与归类,从而使数据的分布形态更加清楚地表现出来。 3. 数据透视表 数据透视表是一种交互式工作表,用于对已有数据表和数据库中的数据进行汇总和分析的一种工具。,2020/7/30,18,频

5、数分布函数 (FREQUENCY),可以对一列垂直数组返回某个区域中数据的频数分布。 频数分布函数 (FREQUENCY)的语法形式为: FREQUENCY(data_array,bins_array) 其中:Data_array为用来编制频数分布的数据,Bins_array为频数或次数的接收区间。,2020/7/30,19,4. 统计图 Excel可以绘制许多图表,其中大部分是统计 图,可用于数据的整理与分析,能够直观形 象地描述现象的数量规律性。,2020/7/30,20,二、资料整理的方法统计分组法 (一)分组涵义 (二)分组的作用 (三)分组标志的选择,2020/7/30,21,统计分

6、组的作用:,划分社会经济现象的类型 反映社会经济现象的内部结构和比例关系 揭示社会经济现象之间的相互依存关系,2020/7/30,22,(三)分组标志的选择,1、标志含义:标志指反映事物属性或特征的名称。 2、正确分组必须遵守以下原则: 1)根据调查研究的目的和任务选择分组标志 2)选择能够反映被研究对象本质的标志 3)应从多角度选择分组标志,并不是唯一性的,2020/7/30,23,按品质标志分组 如按性别分组,见表3-5,2020/7/30,24,按数量标志分组 单项式分组 见表3-6,2020/7/30,25,组距式分组 见表3-7,2020/7/30,26,三、次数分布,次数分布的概念

7、与种类 在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,称为次数分配(布)或分配数列。 分布在各组的个体单位数叫次数或频数,各组次数占总次数的比重叫频率。,2020/7/30,27,按品质标志分组品质数列 一般是单项式分组 见表3-5 按数量标志分组变量数列 可以是单项式 见表3-6 也可以是组距式 等距数列 见表3-7、3-8 异距数列 见表3-9,2020/7/30,28,2020/7/30,29,2020/7/30,30,四、统计图,一)、绘制统计图的基本步骤 二)、条形图与柱形图 三)、饼形图,2020/7/30,31,(一)、Ex

8、cel绘制统计图的基本步骤,Excel 提供“图表向导”工具,帮助创建适合于数据 信息和分析目的的各种图表,下面先简单描述一 下图表操作的基本步骤。 使用“图表向导”工具制作图表之前,选定数据 所在的单元格,如果希望数据的行列标题显示 在图表中,则选定区域还应包括含有标题的单 元格。,2020/7/30,32,单击“插入”菜单中的“图表”选项,按照“图表向导” 中4个步骤的指令进行操作。 第1步“图表类型”:每种类型的图表都有两种以上的子类型,选中所需要的图形以及它的子图形,单击“下一步”按钮。 第2步“图表数据源”:选定包含数据和行列标志的工作表单元格,即便工作表包含多个行列标志,也能在图表

9、中显示它们。生成图表时,应将各行列标志包含到选定区域中。若预览图表看去很合适,则表示所选数据区正确。单击“下一步” 按钮。,2020/7/30,33,第3步“图表选项”:为选定的图表设置某些标准选项。修改这些设置时,随时查看预览图表可以帮助我们确定设置是否合适。单击“下一步” 按钮。 第4步,“图表位置”:可以将图表放置在工作表上,或者单独置于一张新的图表工作表上,在这一步中,我们为图表工作表命名,或者选择现有工作表的名称,单击“完成”按钮。,2020/7/30,34,(二)、 条形图与柱形图,条形图和柱形图可交换使用。 Excel的条形图是水平条形,Excel柱形图为竖直条形。 两种图表都可

10、以用来表示与一组或几组分类相关的数值,它可用于不同现象的比较,也可以采用时间顺序描述现象的发展趋势。 在条形图或柱形图中,各长条或柱的宽度与各长条间的距离彼此均等,条的长度与所代表的变量值成比例。,2020/7/30,35,基本步骤,Excel 提供“图表向导”工具,帮助创建适合于数据信息和分析目的的各种图表。 打开 “2统计图表.xls” 工作簿,选定“成绩分组表”工作表。 绘制柱形图。,2020/7/30,36,上一页,下一页,2020/7/30,37,上一页,下一页,2020/7/30,38,上一页,下一页,2020/7/30,39,上一页,下一页,2020/7/30,40,上一页,下一

11、页,2020/7/30,41,上一页,2020/7/30,42,(三)、饼形图,例 中国人如何看WTO。 由中国社会调查事务所组织的最近一次问卷调查显示: 有58.4%的被调查者对中国加入WTO非常有信心;有19.3%的被调查者没有态度;有9.2%的被调查者表示担心;有13.1%的被调查者反对中国加入WTO 试用饼形图描述一下中国人对加入WTO的看法。,2020/7/30,43,打开“统计整理.xls”工作簿,选择“WTO” 工作表。 打开Excel“插入”菜单,并单击“插入”菜单中的 “图表”选项,Excel会启动图表向导。 在步骤1的“图表类型”中选择“饼图”,并在“子类 型图表”中选择“

12、三维饼图”,单击“下一步”按钮, 进入向导2。,2020/7/30,44,如图所示,在步骤2中的数据区域中输入A3:B6单元格, 单击“下一步”按钮,进入向导3。,2020/7/30,45,在步骤3中单击“标题”页面,输入标题“中国人看WTO”;单击“图例”页面,取消显示图例;单击“数据标志”页面,在“数据标志”列表中选择“同时显示百分比及数据标志”。如图所示。,2020/7/30,46,如果通过图表预览,认为满意,即可单击“完成”按钮。 经过修饰后,得饼形图如图所示。,2020/7/30,47,第二节 定性分析,分析与解释 定性分析 定性分析方法,2020/7/30,48,分析与解释,在市场

13、营销研究过程的所有活动中,对研究者的技能要求最高的是资料的分析与解释。一般来讲,事实本身是没有用处的,一个人在一天中可能会搜集到对他本人并无用处的许多事实。资料只有经过比较和分析才有用。,2020/7/30,49,分析是以某种有意义的形式或次序把收集的资料重新展现出来。分析实际上是回答下面的问题:“每组资料里有些什么信息?”分析是分别检查每组资料,以找出其内涵的关键信息,并以有意义的形式表示出来。 解释是在资料分析的基础上找出信息之间或手中信息与其它已知信息的联系。解释的主要目的是从所收集的资料中获得结论。它是把分析过的资料变成跟研究目的有关的有用信息,以使收集的资料能为研究目的服务。,202

14、0/7/30,50,资料的分析与解释是相互联系,相互依赖的。无论是资料的分析还是资料的解释,任何一个方面的工作开展得不好,都会影响到研究结果的有效性以及对资料的充分利用。,2020/7/30,51,例,假设某大型日用化工厂,每个季度要在全国的50个主要的大百货商场作一次库存检查。表7-8是该厂A牌老产品和B牌新产品在过去4个季度里销售量的变化。 公司的营业部经理从上面资料发现,A牌销售量的下降与B牌销售量的上升有着惊人的吻合,因此作出结论,A牌产品的顾客转向了B牌,并建议这个时刻将A牌牙膏退出市场。,2020/7/30,52,2020/7/30,53,实际上发生的是,有两个竞争对手大力推销他们

15、的与A牌类似的产品以防止他们的顾客转到B牌上来。这样,尽管A牌老产品的市场由于新产品推出而下降了一些,但其销售量的下降主要是由于其它公司的促销活动引起的。,2020/7/30,54,表7-8的资料表明,A牌的销售量在下降而B牌的销售量在上升,这种分析是正确的,但解释是错误的,因为上面两组资料被不适当地联系到一起。如果调查市场上该产品的总销量以及仔细研究竞争对手的活动,发现市场上该产品的需求量在大幅度上升,而竞争对手的促销活动也在不断加强。那么A牌销售下降的真实原因也许是它的促销措施不得力,而不是由于B牌产品的进入。,2020/7/30,55,分析与解释,分析是把每组数据以某种形式重新组合起来以

16、便从中发现有用的信息, 解释是在分析的基础上进行的,即把已经分析过的资料与其它的一些现存资料放在一起,通过比较,得到与研究目的有关的信息。如从各种分散资料中归纳出结论,然后根据结论提出各种备选的市场营销的方案。,2020/7/30,56,定性分析 定量分析,2020/7/30,57,(一)定性分析,常用的定性分析方法,定性分析的概念和原则,定性分析是对不能量化的现象进行系统化的理性认识的分析,理论依据是哲学观点、逻辑判断及推理,其结论是对事物的本质、趋势和规律的性质方便的认识。,1、归纳分析法 2、演绎分析法 3、比较分析法 4、结构分析法,2020/7/30,58,(二)定量分析,定量分析:

17、 是从事物数量方面的特征入手,运用一定的数据处理技术进行数量分析,从而挖掘出数量中所含的事物本身的特性及其规律性的分析方法。 定量分析包括: (1)描述性统计分析 (2)解析性统计分析 (3)不确定分析方法模糊分析,返回,2020/7/30,59,(三)定性分析方法,(1)归纳分析法 归纳推理的方法是,首先产生一系个别的前提,然后把这些前提与其它前提结合在一起,以形成结论。这些个别的前提可以从观察、实验、调查中获得。 在归纳方法中,任何结论都是基于从调查、实验或观察中得出的证据。市场营销研究中通过对大量个体(或样本)的研究得出一般性结论的方法使用的就是归纳法。,2020/7/30,60,(2)

18、演绎分析法 在运用演绎分析法时要注意如下问题: 1)分类研究的标准要科学; 2)分类研究的角度应该是多角度、多层次的; 3)对分类研究后的资料还要运用多种逻辑方法揭示其本质,形成理性认识; 4)综合要以分类研究为基础; 5)综合要根据研究对象本身的客观性质,从内在的相互关系中把握其本质和整体特征,而不是将各个部分、方面和因素进行简单相加或形式上的堆砌。,2020/7/30,61,(3)比较分析法 比较分析法是把两个或两类事物的调查资料相对比,从而确定它们之间相同点和不同点的逻辑方法。运用比较分析法时,要注意如下问题: 可以在同类对象间进行,也可以在异类对象间进行;要分析可比性;应该是多层次的;

19、,2020/7/30,62,(4)结构分析法 在市场调查的定性分析中,我们通过调查资料,分析某现象的结构及其各组成部分的功能,进而认识这一现象本质的方法,称为结构分析法。,2020/7/30,63,第三节描述性统计分析,描述性统计分析指对被调查总体所有单位的有关数据作搜集、整理和计算综合指标等加工处理,用来描述总体特征的统计分析方法。 市场调查分析中最常用的描述性统计分析,主要包括对调查数据的分组分析、集中趋势分析、离散程度分析和相对程度分析、列表分析等。,2020/7/30,64,描述性分析内容,频数、频率分析 数据集中趋势分析 数据离散趋势分析 交叉表分析,2020/7/30,65,描述性

20、分析(一),中心趋势 平均值: 中位数: 众数: 可以回答下述问题,如购物中心调查 被调查者的平均年龄是多大? 在购物中心的平均花费是多少? 哪个时间段来惠顾的人最多? 他们进入购物中心的主要目的是什么?,2020/7/30,66,描述性分析(二),离散程度 标准差: 百分比(成数) 可以回答下述问题,如购物中心调查 被调查者的年龄差别大吗?平均而言,有多大? 他们在购物中心的花费差别有多大? 他们进入购物中心的时间段集中吗? 他们进入购物中心的目的一致吗?,2020/7/30,67,描述性分析(三),同一个变量,多个样本之间的比较 比如,广州的顾客与西安的顾客有差别吗?西安的顾客在2003年

21、与2000年相同吗? 在被调查者的年龄上? 在花费上? 在时间段上? 在目的上?,2020/7/30,68,(一)频数、频率分析(1),例1:假设有样本数据,2020/7/30,69,频数、频率分析(2),2020/7/30,70,频数、频率分析(3),2020/7/30,71,例如:品质标志的描述分析,某校学生对体育锻炼态度调查结果,2020/7/30,72,品质标志的描述 饼图,某校学生对体育锻炼态度调查结果,2020/7/30,73,例:对矿泉水市场的调查,北京市居民矿泉水最喜欢品牌,2020/7/30,74,(二)数据的集中趋势分析,对调查数据公布的数量规律性中集中特征进行分析,是对被

22、调查总体的特征进行准确描述的重要前提。数据集中趋分析的对象,包括数据的均值(各类平均数)、中位数和众数。,2020/7/30,75,均值是数据偶然性和随机性的一个特征值,反映了一些数据必然性的特点。 利用均值,可以将处在不同地区、不同单位的某现象进行空间对比分析,以反映一般水平的变化趋势或规律;可以分析现象间的依存关系等等,从而拓宽分析的范围,2020/7/30,76,众数是总体中出现次数最多单位的标志值,也是测定数据集中趋势的一种方法,克服了平均数指标会受数据中极端值影响的缺陷。 从分析的角度看,众数反映了数据中最大多数的数据的代表值,可以使我们在实际工作中抓住事物的主要矛盾,有针对性地解决

23、问题。,2020/7/30,77,中位数的确定可以以未分组资料为基础,也可由分组资料得到。它同样不受到资料中少数极端值大小的影响。在某些情况下,用中位数反映现象的一般水平比算术平均数更具有代表性,尤其对于两极分化严重的数据,更是如此。,2020/7/30,78,算术平均数,未分组数据的平均数计算 分组数据的平均数计算 上例的计算结果,2020/7/30,79,中位数的计算(1),未分组数据的中位数计算 对所有数据进行排序,当数据量为奇数时,取中间数为中位数,当数据量为偶数时,取最中间两位数的平均数为中位数。上例中数据量为100,是偶数,所以应取排序后第50位数和第51位数的平均值作为中位数。第

24、50位数是3,第51位数也是3,所以中位数为3。,2020/7/30,80,中位数的计算(2),分组数据的中位数计算 下式中L为中位数所在组的下限值,fm为中位数所在组的组频数, Sm-1为至中位数组时累计总频数,h为组距。,2020/7/30,81,中位数的计算(3),例2:假设有分组数据如下(销售额单位为万元),2020/7/30,82,中位数的计算(4),依据公式 例2的中位数为,2020/7/30,83,众数的计算,未分组数据的众数为出现次数最多的数。 分组数据的众数依据下式计算获得。 表达式中1表示众数所在组与前一组的频数差,2表示众数所在组与后一组的频数差。依据公式,例2分组数据的

25、众数为104.29万元。,2020/7/30,84,(三)数据离散趋势分析,对一组数据规律性的研究,集中趋势是数据重要数量特征的一个方面,离散程度则是数据数量特征的另一方面。 集中趋势反映的是数据的一般水平,我们用均值等一个数值来代表全部数据。 若要较全面地掌握这组数据的数量规律,还需要计算反映数据差异程度的数值,如极差、平均差、方差和标准差离散系数等。,2020/7/30,85,标志变动度 全距(Range) 四分位间距(IQR) 方差(Variance) 标准差(Standard Deviation),2020/7/30,86,(1)标志变动度,标志变动度是描述总体各单位标志值差别大小程度

26、的指标,又称离散程度或离中程度。 例某车间两个生产小组各人日产量如下: 甲组:20,40,60,70,80,100,120 乙组:67,68,69,70,71,72,73 从下图可以看出甲组离散程度大,乙组离散程度小。,2020/7/30,87,70,70,2020/7/30,88,(2)、全距,全距是总体各单位标志的最大值和最小值之差。用R表示。 R=Xmax-Xmin 全距数值越大,反映变量值越分散,全距数值越小,反映变量值越集中。 例1中最小值为1,最大值为6,因而全距为6-1=5。,2020/7/30,89,(3)四分位差,四分位差是一种按照位置来测定数据离散趋势的计量方法,它只取决于

27、位于样本排序后中间50%位置内数据的差异程度。即第一个四分位与第三个四分位数据之间的差异。,2020/7/30,90,(4)平均差,平均差是各单位标志值对平均数离差绝对值的平均数。 计算公式 在平均数相等时,平均差愈大,标志变异程度愈大,平均数的代表性愈小;平均差愈小,标志变异程度愈小,平均数代表性愈大。,2020/7/30,91,(5)方差和标准差,总体方差 样本方差 标准差 总体标准差,样本标准差s。,2020/7/30,92,月租金的全距和四分位间距,2020/7/30,93,月租金的标准差,方差 标准差,2020/7/30,94,(四)、交叉表,交叉表是一种以表格的形式同时描述两个或多

28、个变量以及结果的统计方法。 频数分布只能依次描述一个变量。 交叉表可以同时描述两个或两个以上变量。,2020/7/30,95,频数分布,如果要研究那些愿意在不同商场购物的 消费者与其年龄间的关系?,2020/7/30,96,交叉表分析,2020/7/30,97,建立交叉分组表的通常做法是设计一个表,在这张表中,各列列出各种不同因素,如人口统计和生活方式特征,它们可以作为各行所列因素如心理、行为或意愿的预测指标。在表中,百分比通常以列总计为基数进行计算。采用这种方法可以简单比较各种关系,如心理、行为或意愿数据与性别或年龄之间的关系。,2020/7/30,98,交叉分组表为总结和分析调查结果提供了

29、一种有效而易懂的方法。设计交叉分组表时必须牢记调研目标和事先的基本假设。某项调查的结果可能产生无数个交叉分组表。这表明,分析人员必须加以判断,从所有可能的交叉分组表中选择适合于调研目标的表格形式。大量的电子制表软件(Excel)和几乎所有的统计软件包(SAS、SPSS、SYSTAT、STATISTICA)都能够生成交叉分组表。,2020/7/30,99,Excel的应用,2020/7/30,100,2020/7/30,101,2020/7/30,102,(五)用EXCEL计算描述统计量,用EXCEL计算平均数、标准差等描述性统计量有两种方法,一是用函数,二是用“数据分析”工具。 第一次使用“数

30、据分析”时,需在EXCEL工具菜单中选“加载宏”,选“分析工具库”。这样在“工具”菜单中就会出现“数据分析”。,2020/7/30,103,打开“4数据描述.xls”工作簿,选择“网上冲浪”工作表。 打开“工具”菜单,选择“数据分析”选项,打开数据分析对话框如图所示。,2020/7/30,104,双击“描述统计”项或先单击此项再选择“确定”按钮,描述统计对话框打开如图所示。 在“输入区域”中输入A1:A21。,2020/7/30,105,由于所选数据范围包括一个标志名称,单击“标志位于第一行”选项边上的复选框。 单击“输出区域”项,旁边出现了一个输入框,单击此框出现插入符,单击C1,在输入框中

31、出现输出地址“$B$1”,这是输出结果的左上角起始位置。 单击“汇总统计”,如不选此项,则Excel省略部分输出结果。,2020/7/30,106,单击“确定”按钮,将产生输出结果,如下图所示。,2020/7/30,107,在上表中: 平均算术平均数 标准误差估计标准误差,在抽样调查一章会讲到 中值中位数 模式众数 标准偏差样本标准差s,分母除以n-1 样本方差s平方 峰值反映钟形分布峰高的一个指标 偏斜度反映偏斜程度的一个指标 区域全距,等于最大值减最小值 计数单位数,2020/7/30,108,习题一,要求:计算平均数、众数、中位数,2020/7/30,109,习题二.某商店售货员的工资资

32、料如下:,要求:计算全距、平均差、标准差,2020/7/30,110,第四节解析性统计分析,假设检验 方差分析 相关分析 回归分析,2020/7/30,111,一、相关分析,(一)、相关分析的概念 (二) 、简单线性相关分析,2020/7/30,112,(一)、相关分析的概念,现实世界中现象之间存在着两种关系,市场调研活动也是一样。 1、函数关系 两个变量的关系是确定的,可以用一个数学表达式表示出来。 例:圆的面积与半径的关系 S=R2 L=R,2020/7/30,113,2、相关关系 两个变量的关系确实存在,但关系数值是不固定的相互依存关系。 例:市场份额与广告支出的关系、顾客对品牌的态度与

33、价格敏感度的关系。,2020/7/30,114,函数关系是变量之间的一种完全确立性的关系。即某一变量发生变化,另一变量就有一个确定值与之相对应;相关关系一般是不完全确定的关系,即对自变量的一个值,与之对应的因变量值不是唯一的。,2020/7/30,115,3、相关分析的类型,(1)根据自变量的多少划分 单相关:只有一个自变量。 复相关:有两个及两个以上的变量。,2020/7/30,116,(2)根据相关的形式不同划分 线性相关(直线相关):当一个变量变动时,另一个变量也相应发生大致均等的变动。 非线性相关(曲线相关):当一个变量变动时,另一个变量也相应发生变动,但这种变动是不均等的。,2020

34、/7/30,117,(3)根据相关关系的方向划分 正相关:两个变量之间的变化方向一致,都是增长趋势或下降趋势。 负相关:两个变量变化趋势相反,一个下降而另一个上升,或一个上升而另一个下降。,2020/7/30,118,(二)、简单线性相关分析,1、散点图和相关表 2、相关系数的测定与应用 3、相关系数的密切程度,2020/7/30,119,1、散点图和相关表,例 近年来国家教育部决定将各高校的后勤社会化。某从事饮食业的企业家认为这是一个很好的投资机会,他得到十组高校人数与周边饭店的季销售额的数据资料,并想根据高校的数据决策其投资规模。,2020/7/30,120,操作过程:,打开“8简单线性回

35、归.xls”工作簿,选择“饭店” 工作表,如下图所示,该表为相关表。,2020/7/30,121,从“插入”菜单中选择“图表”选项,打开“图表向导”对话框如下图所示。在“图表类型”列表中选择XY散点图,单击“下一步”按钮。,2020/7/30,122,在数据区域中输入B2:C11,选择“系列产生在列”,如下图所示,单击“下一步”按钮。,上一页,下一页,返回本节首页,2020/7/30,123,打开“图例”页面,取消图例,省略标题,如下图所示。,2020/7/30,124,单击“完成”按钮,便得到XY散点图如下图所示。,2020/7/30,125,2、相关系数的测定与应用,2020/7/30,1

36、26,相关系数的计算有两种方法: 用计算器计算 例,2020/7/30,127,用计算机计算 选取“工具”-“数据分析” 选“相关系数” 选“确定” 输入“输入区域” 输入“输出区域” 在“分组方式”中选“逐列” 选“标志位于第一行” 确定 出现结果如下:,2020/7/30,128,3、相关系数的密切程度,相关系数的范围在-1到1之间,即 -1r1,当r=1为完全正相关, r=-1,为完全负相关,r=0为不相关。 r的范围在0.3-0.5是低度相关; r的范围在0.5-0.8是显著相关; r的范围在0.8以上是高度相关.,2020/7/30,129,二、回归分析,(一)、回归分析的概念 (二

37、)、直线回归 (三)、曲线回归,2020/7/30,130,(一)、 回归分析的概念,回归分析就是对具有相关关系的变量之间的数量关系进行测定,确定一个相应的数学表达式,其中一个是因变量,其余均为自变量。,2020/7/30,131,(二)、直线回归,简单直线回归分析的特点 在两个变量之间,必须确定哪个是自变量,哪个是因变量 回归方程的主要作用是用自变量来推算因变量。 例如:奢侈品的消费是否直接用消费者收入来解释,2020/7/30,132,简单直线回归方程的确定 设y为实际值,yc为估计值,现在要用一条直线 拟合实际值,而且要满足,为最小。,2020/7/30,133,由最小平方原理,可得:,

38、练习1 相关与回归分析,2020/7/30,135,练习1 相关与回归分析,在确定了20个店后,该公司在长达一个月的时间 内,每天都到每个地点做车流量的纪录,而且通 过自己的内部记录获得了这20家店前12个月的全 部销售数据。见表7-1所示。 图7-1显示了数据的散点分布。显而易见,年销 售量随日均车流量的增多而升高。现在的问题 是,如何用明确的定量的方式把这种特性表示出 来。,2020/7/30,136,练习1 相关与回归分析,2020/7/30,137,练习1 相关与回归分析,2020/7/30,138,练习1 相关与回归分析,2020/7/30,139,练习1 相关与回归分析,2020/

39、7/30,140,练习1 相关与回归分析,练习1 相关与回归分析,2020/7/30,142,练习1 相关与回归分析,2020/7/30,143,练习1 相关与回归分析,2020/7/30,144,练习1 相关与回归分析,2020/7/30,145,练习1 相关与回归分析,2020/7/30,146,例2,2020/7/30,147,用计算器算得:,故直线方程为yc=51.31+12.9x,2020/7/30,148,例:某厂商品销售量和商品价格如下表所示,q=a+bp 那么,2020/7/30,149,预测商品价格为20元时的销售量,qc=50.51-2.09p q20=50.51-2.09

40、20=8.71(百件),2020/7/30,150,先作图表,然后添加趋势线。 用鼠标激活散点图,把鼠标放在任一数据点上,单击鼠标右键,打开菜单,在菜单栏里选择“添加趋势线”选项。,图1,2020/7/30,151,图2,2020/7/30,152,打开“类型”页面,选择“线性”选项,Excel将显示一条拟合数据点的直线。 打开“选项”页面如下图所示,在对话框下部选择“显示公式”和“显示R平方根”选项,单击“确定”按钮,便得到回归图如下图所示。,2020/7/30,153,多元线性回归 回归方程为,要估计参数a、b1 、 b2手工计算较繁,可以用EXCEL 数据分析功能完成。,2020/7/3

41、0,154,例 某地区玻璃销售量与汽车产量、建筑业产值资料如左,试建立回归模型。,2020/7/30,155,操作过程 打开“8 回归.xls”工作簿,选择“玻璃”工作表。 在“工具”菜单中选择“数据分析”选项,打开“数据分析”对话框如下图所示。,2020/7/30,156,在“分析工具”列表中选择“回归”选项,单击“确定”按钮,打开“回归”对话框如下图所示。,2020/7/30,157,在Y值输入区域中输入B1:B19。 在X值输入区域中输入C1:D19。 选择“标志”,置信度选择95%。 在“输出选项”中选择“输出区域”,在其右边的位置输入“E1”,单击 “确定”按钮。输出结果如下图所示。,2020/7/30,158,2020/7/30,159,Excel的回归分析工

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论