经济数学(第三版) 教案 5.描述性统计分析_第1页
经济数学(第三版) 教案 5.描述性统计分析_第2页
经济数学(第三版) 教案 5.描述性统计分析_第3页
经济数学(第三版) 教案 5.描述性统计分析_第4页
经济数学(第三版) 教案 5.描述性统计分析_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

长沙民政职业技术学院教案长沙民政职业技术学院教案经济数学课题描述性统计分析授课课时2课型新授课教案编号教学目标(知识、技能、素质):1、知识目标:掌握基本统计量及线性相关的度量。2、技能目标:分析解决问题的能力和严谨的逻辑思维能力3、素质目标:培养学生理性的思维方式和数学应用意识教学重点:掌握基本统计量,散点图和相关系数教学难点:随机变量的分布形状,用EXCEL求常用统计量主要教学方法:启发引导式、讲授法教学环节与内容一、问题引入统计在日常生活和各类职业中有着广泛的应用,例如,在社会学领域,需要调查青年对婚姻家庭、经济收入、相貌等因素的态度以便进行正确引导;在康复医疗领域,需要对患有抑郁症的病人,按照测量得到的指标,进行恰当地归类以便进行有针对性的治疗;在经济活动中,需要考虑商品的市场反应与价格、消费者收入和广告等因素之间的相互关系,以及建立数学模型进行预测等问题。二、新课讲授(1)重要统计概念在一个描述性统计问题中,往往涉及到三个主要概念:总体、样本以及描述性统计。定义1:总体是指研究对象的某一个指标(或多个)全体,组成总体的每一个单元称为个体,总体中所包含个体的总数称为总体容量。定义2:在总体中随机地抽取n个个体,记其指标值为X1,X2,…,Xn,则X1,X2,…,Xn称为总体的一个样本,n称为样本容量,样本中的个体称为样品。(2)常用统计量定义5统计量是统计理论中用来对数据进行分析、检验的变量。=1\*romani)中心趋势中心趋势又称为定位度量或者平均数,是一组数据典型的或者有代表意义的值。由于这些典型值趋向于落在根据数值大小排列的数据的中心,因此被称为中心趋势度量。可以定义中心趋势的统计量包括:算数平均数、几何平均数、中位数和众数等。算数平均数(简称为样本均值):设一个样本的观测值为,样本算数平均数记为,则有.其中,符号“”表示将记作的意思,读成“记作”。几何平均数:度量平均值的另一种方法,特别是在计算平均增长率、平均收益率时被经常使用。中位数:把所有观测值依序排列(递增或递减),位于最中间的观测值就是中位数。当观测值个数为偶数时,则中位数是位于中间的两个观测值的平均数。众数:样本观测值中发生次数最多的观测值。使用众数作为中心趋势统计量,会有两个问题:第一,在一个小样本内,它可能不是一个很好的观测值;第二,它可能不唯一。例9.1求引例9.1牙膏销售问题中的本公司销售价格的平均价格,价格的众数和中位数?解平均价格;因为本公司销售价格3.7元出现的次数最多,所以众数;将本公司销售价格从低到高排序,第15位、第16位都是3.75,因此中位数.对于一组数据,仅仅知道平均数、众数、中位数等这些描述数据中心趋势的统计量还不够,还需知道数据的分散程度.描述数据的分散程度的常用统计量有极差、样本方差和样本标准差等.=2\*romanii)离散趋势除了知道中心趋势外,对数据进行统计描述还需要知道数据围绕中心点是如何分散的,称之为离散趋势。常用的统计量有:极差、样本方差、样本标准差和方差系数等。极差:样本最大观测值和最小观测值之间的差。样本方差:一个样本的观测值为,样本算数平均数记为,样本方差记为,则有.需要注意的是,样本方差的计算公式中,是使用偏差平方和除以,而不是除以,这是因为我们在用样本估计总体时,除以所建立起的统计量是对总体方差更好的估计。样本标准差:样本方差的算术平方根,即。样本方差在比较两组或者更多组数据的离散程度时,是一个很好的统计量。通常,样本方差越大,代表数据本身的离散程度越大。而样本标准差则可以帮助我们了解数据大致集中在哪个区域。方差(或标准差)能较好的反映出数据的离散程度,是描述一组数据变异程度或离散程度大小的重要指标.例9.2求引例9.1牙膏销售问题中的本公司销售价格的极差、方差和标准差.解因为本公司销售价格的最大值为3.9,最小值为3.55,所以极差为R=3.9-3.55=0.35,,.方差系数:样本观测值的标准差除以样本均值的结果,即.例9.3表3-7给出了东风汽车和上海机场两种股票在12个交易日的价格,试比较两种股票价格在这12个交易日内的活跃程度。表3-7两只股票12个交易日的价格表日期东风汽车上海机场日期东风汽车上海机场200503103.1716.06200503182.9716.52200503113.1616.55200503212.9416.65200503143.1017.27200503222.71171016.82200503232.7416.90200503163.0916.60200503242.7616.86200503173.0216.65200503252.7516.79解分别计算两组样本均值,样本标准差和方差系数,得东风汽车:均值为2.96,标准差为0.176,方差系数为0.059;上海机场:均值为16.74,标准差为0.316,方差系数为0.019。如果从标准差来看,上海机场的股票活跃程度要大于东风汽车,但从方差系数来看,上海机场的方差系数仅为0.019,远小于东风汽车的0.059。两者存在矛盾是因为上海机场的股价要高于东风汽车,因此含有量纲的标准差就会偏高,而采用方差系数考虑了股价的均值,因此能更好地反映股价的活跃程度,因此可以从方差系数做出判断,东风汽车股价的活跃度高于上海机场。=3\*romaniii)分布形状随机变量的分布形状主要包括偏度和峰度。偏度:反映以平均值为中心的分布的不对称程度的量,其计算公式为.其中,为样本均值,为样本标准差,为样本容量。若sk<0,则分布具有负偏态,此时数据位于均值左边的比位于右边的少,直观表现为左边的尾部相对于右边的尾部要长,因为有少数变量值很小,使曲线左侧尾部拖得很长.若sk>0,则分布具有正偏态,此时数据位于均值右边的比位于左边的少,直观表现为右边的尾部相对于左边的尾部要长,因为有少数变量值很大,使曲线右侧尾部拖得很长.而sk接近0则可认为分布是对称的。如图3-11所示。图3-11三种偏态示意图如果偏度表示的是数据分布的对称程度,则峰度用来表述分布的尖锐度或者平坦度,用与正态分布的比较值来度量。峰度:反映与正态分布相比某一分布的尖锐度或平坦度,其计算公式为.其中,为样本均值,为样本标准差,为样本容量。若bk<0,则表示峰度比正态分布平坦;若bk>0,则表示峰度比正态分布陡峭;若bk=0,则表示峰度跟正态分布相同。如图3-12所示。图3-11三种峰度示意图例9.4表3-8给出某股票在18个交易日的价格,试求该股票价格的偏度和峰度。表3-8某股票18个交易日的价格表日期价格日期价格日期价格200503106.4200503186.29200503285.97200503116.38200503216.16200503295.93200503146.44200503226.12200503305.94200503156.36200503236.08200503315.54200503166.24200503245.99200504015.36200503176.35200503255.93200504045.4解数据的偏度和峰度的计算公式较为复杂,我们可以借助EXCEL辅助计算。其中,偏度的EXCEL指令是“=SKEW(数据对象)”,峰度的EXCEL指令是“=KURT(数据对象)”。借助EXCEL求解,可得该股票价格的偏度,峰度为。说明股票价格成负偏态;峰度值接近于0,其陡峭程度与正态分布接近。事实上,由于上述统计量的应用十分广泛,EXCEL在分析工具中专门编写了“描述统计”指令来实现快速和智能化的计算,其调用步骤为:单击【数据】中的【数据分析】命令,在弹出的数据分析对话框中,选中【描述统计】。注意:如果在【数据】中没有见到【数据分析】选项,则要依次通过【文件】【选项】【加载项】【转到】,在出现的【加载宏】对话框中选定【分析工具库】。(3)相关分析与回归分析现实生活中,事物之间存在相互关系.比如,职业种类和收入之间的关系、商品销售收入与广告支出经费之间的关系、粮食产量与施肥量之间的关系、人体类内的脂肪含量与年龄之间的关系、工业产值与用电量等等.认识事物之间的关系可以对经济现象进行预测和推断.下面将介绍线性相关关系,并利用线性相关关系进行回归分析.1.变量间相关关系的描述与度量什么是线性相关关系?由表9-1看出,随着其他厂家平均价格与本公司销售价格之差(即价格差)的增加,牙膏销售量也在增加,这就说明牙膏销售量与价格差有关系,但是这种关系不是我们以前研究过的函数关系.也就是说当一个变量(如价格差)确定后,无法确定另一个变量(如牙膏销售量).相关关系是指变量之间确实存在密切关系,但是一个变量或几个变量取的确定值时,不能求出另一个变量的确定值,而在大量的资料中,这种关系又具有统计规律性的关系.为了刻画变量之间是否具有线性相关关系,可以通过散点图直接观察,也可以通过相关系数的大小进行判断.=1\*GB2⑴散点图用坐标的水平轴代表自变量,纵轴代表因变量,每组数据在坐标系中用一个点表示,组数据在坐标系中形成的个点称为散点,由坐标及其散点形成的二维数据图称为散点图(scatterdiagram).散点图是描述变量之间关系的一种直观方法,从中可以大体上看出变量之间的关系形态及关系强度.如果散点图中的散点都大致分布在一条直线的周围,这就说明变量之间存在线性相关关系,否则不存在线性相关关系.以引例9.1中所给的数据为例,得到牙膏销售量对价格差及广告费用的散点图分别如图9-1、图9-2所示.图9-1销售量对价格差散点图图9-2销售量对广告费用散点图由图9-1、图9-2可以看出,虽然数据点不全在一条直线上,但近似在一条直线附近.因此可以认为牙膏销售量对价格差及广告费用之间存在线性相关关系.=2\*GB2⑵相关系数相关系数(correlationcoefficient)是对变量之间线性关系密切程度的度量.若变量的个数据,,则变量相关系数r的计算公式为.其中.可以证明,相关系数的取值范围在+1和-1之间,即.若,表明变量之间存在正线性相关关系;若,表明变量之间存在负线性相关关系.当时,变量可视为高度相关;时,变量可视为中度相关;时,变量可视为低度相关;当时,说明变量之间的相关程度极弱,可视为不线性相关.例9.5根据表9-1中所给的数据,计算牙膏销售量和价格差以及牙膏销售量和广告费用之间的相关系数.解牙膏销售量和价格差之间的相关系数为.牙膏销售量和广告费用之间的相关系数为.从牙膏销售量对价格差及广告费用之间的相关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论