![上海大学统计学课件_第1页](http://file4.renrendoc.com/view/dd19c3cbc17cc937add77b180c5a9843/dd19c3cbc17cc937add77b180c5a98431.gif)
![上海大学统计学课件_第2页](http://file4.renrendoc.com/view/dd19c3cbc17cc937add77b180c5a9843/dd19c3cbc17cc937add77b180c5a98432.gif)
![上海大学统计学课件_第3页](http://file4.renrendoc.com/view/dd19c3cbc17cc937add77b180c5a9843/dd19c3cbc17cc937add77b180c5a98433.gif)
![上海大学统计学课件_第4页](http://file4.renrendoc.com/view/dd19c3cbc17cc937add77b180c5a9843/dd19c3cbc17cc937add77b180c5a98434.gif)
![上海大学统计学课件_第5页](http://file4.renrendoc.com/view/dd19c3cbc17cc937add77b180c5a9843/dd19c3cbc17cc937add77b180c5a98435.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统学计统计学
第一章导论第二章统计搜集与整理第三章数据的汇总第四章统计比率与统计指数第五章抽样推断法第六章显著性检验第七章统计变量和统计函数第八章回归分析预测第九章时间数列第十章计算机在统计中的应用第一章导论一、数据信息和统计学的关系二、统计学的研究对象和研究方法三、统计学的要素和内容四、计算机软件在统计中的应用主要内容案例一、数据信息与统计学的关系(一)统计包含三种涵义,两重关系1、统计工作:调查研究。资料收集、整理和分析。2、统计资料:工作成果。包括统计数据和分析报告。3、统计学:研究如何搜集、整理、分析数据资料的一门方法论科学。统计工作统计资料统计学工作与工作成果关系实践与理论关系(二)统计学的性质及其特点统计学的性质是一门有关数据资料的搜集、整理、描述、推断和分析的方法论学科。统计学的特点数量性大量性差异性具体性统计学的性质:是一门适用于自然现象和社会现象的方法论学科。统计学的研究对象:大量现象的数量方面。包括数量特征、数量关系、数量界限等。二、统计学的研究对象和方法统计学的研究方法1、大量观察法是指对所研究的事物的全部或足够数量进行观察的方法。它可以使影响个体的偶然因素相互抵消,显示出现象的一般特征。其数理依据是反映随机现象基本规律的大数定律。2、综合指标法是从数量方面对现象总体特征的概括说明。综合指标法,就是运用各种综合指标对现象的数量特征、数量关系进行对比分析的方法。它是统计分析的基本方法。3、统计推断法是在一定置信程度(即可靠程度)下,根据样本资料的特征对总体特征作出估计和预测的方法。统计推断是现代统计学的基本方法。三、统计学的要素和内容1、描述统计(descriptivestatistic)指搜集、整理、分析并提供统计资料的理论和方法。主要任务:使反映客观事物的统计数据可以一目了然,条理清晰,使用方便,可以说明现象的数量特征和数量关系。2、推断统计(inferencestatistic)是依据样本资料推断总体特征的技术和方法,包括参数估计和假设检验的方法。描述统计是推断统计的前提,推断统计是描述统计的发展。1、统计总体和总体单位总体统计研究所确定的客观对象,是具有共同性质的许多单位组成的整体。无限总体:含无限多个单位范围有限总体:含有限个单位。总体单位:组成总体的各个单位(或元素),是各项统计数字的原始承担者。同质性:总体中各个单位具有某种共同的性质。大量性:总体总是包含大量的单位。统计学的要素特点2、标志标志总体单位的属性、特征。品质标志:用文字表示属性分类数量标志:用数字表示特征不变标志:各单位具体表现相同可变标志:各单位具体表现不同指标:综合反映总体数量特征的概念和数值。构成:指标名+指标数值特点:具体性;综合性3、指标和指标体系分类:数量指标;质量指标描述指标;评价指标;预警指标绝对数指标;相对数指标;平均数指标在推断统计中:说明总体的指标也称参数。说明样本的指标称统计量。指标体系:具有内在联系的一系列指标构成的整体。标志与指标的联系与区别:联系(1)一些数量标志汇总可以得到指标的数值。区别(1)标志是说明总体单位特征的,而指标是说明统计总体数量特征的;(2)数量标志与指标之间存在变换关系。(2)标志的具体表现,有的用数值有的用文字表示,而指标都是用数值表示的。统计指标重要特点:具体性;综合性描述指标评价指标监测指标分类数量指标质量指标绝对数指标相对数指标平均数指标指标体系具有内在联系的一系列指标所构成的整体,即称为指标体系。分类社会指标体系经济指标体系科技指标体系基本统计指标体系是针对某项社会经济问题而制定的专项指标体系,如工业经济效益指标体系、价格指标体系等。专题统计指标体系4、变量和变量值变量可变的数量标志和统计指标。确定性变量分类随机性变量离散性变量连续性变量变量值:即变量的具体数值,包括标志值和指标数值社会经济现象中许多变量,既受确定性因素影响,又受随机性及其它不确定性因素影响。要根据具体情况加以认定。5、样本是从总体中随机抽取部分单位所构成的集合体。必须取自所要研究的总体;特点从一个总体中可抽取许多个样本,这些样本的数值是不同的,也即存在着随机的差异;样本必须具有代表性;样本必须具有客观性,也即排除主观因素的影响6、推断:就是以样本信息为依据对总体的某些特征作出预测和估计。7、推断的可靠性:根据随机抽取的样本对总体推断所得出的结果的可靠程度,也称置信度。四、计算机在统计中的应用统计信息的存储和检索微型机的内存容量已相当可观,新的光盘技术的发展,又使计算机的容量成倍增加。1234量化等级功能包容1234统计资料的分析和检验软件名称特征运算功能举例1、Minitab2、SAS3、SPSS4、Statistica分类分类;排序分类;排序;有基本测量单位有基本测量单位;有绝对零点计数计数;排序计数;排序;加减计数;排序;加减乘除产业分类企业等级产品质量差异商品销售额5、Excel6、EviewsEviews下载网站:/index.html或/soft.html第二章数据搜集与整理统计调查统计整理统计分析有组织、有计划地搜集资料。要求:准确、完整、及时对调查资料去伪存真、去粗取精、科学分类、浓缩简化描述性分析推断分析、决策分析。要求:定性定量结合统计工作的三个中心阶段统计调查一、调查组织方式案例统计调查二、调查方案设计报表制度普查重点调查典型调查抽样调查方案内容调查表、问卷设计制度化的经常性调查专门组织调查全面调查非全面调查网上调查一、统计调查的组织方式统计报表制度由政府部门组织,采用统一的表格,自上而下布置,自下而上报告。任务:搜集国民经济和社会发展基本情况的资料,为制订国民经济和社会发展计划和检查计划执行情况服务。优点:精心周密设计、高度统一、规范。回收率高,内容相对稳定,便于资料积累、对比。层层上报、逐级汇总,可以满足各部门需要。特点:普查特点:工作量大,时间性强,需要大量人力和财力。任务:搜集重要的国情国力和资源状况的全面资料,为政府制定规划、方针政策提供依据。方式:建立专门机构,配备专门人员调查。利用基层单位原始记录和核算资料发表调查。原则:规定统一的标准时点。规定统一的普查期限。规定调查的项目和指标。重点调查特点:在总体中选择个别或部分重点单位进行调查。任务:及时了解总体基本情况,为主管部门指导工作服务。方式:一次性调查;专门设计和备配人员现场调查。重点单位指在总体中有举足轻重地位的单位,其标志值在总体标志总量中占有绝大比重。经常性调查;同报表制度结合,用统计报表调查。典型调查特点:在全面分析的基础上,有意识地选择代表性的典型单位进行现场调查。任务:为研究某种特殊的社会经济问题,搜集详细的第一手资料,借以认识事物的本质特征、因果关系、变化趋势。为理论和政策性问题研究提供依据。作用:适宜于研究处于萌芽状态事物和倾向性问题;适宜于分析事物的类型,它们之间的差别和关系。方法:解剖麻雀;划类选典;抓两头。抽样调查特点:1·按随机原则从总体中抽取样本;2·以样本指标(统计量)为依据推断总体参数或检验总体的某种假设;3·抽样误差可以事先计算并加以控制。调查误差登记性误差代表性误差偏差随机误差抽样平均误差实际误差统计推断中的抽样误差就是抽样平均误差。它是处于调查所固有的,是对抽样推断精确度的量度。影响抽样误差的因素样本容量抽样方式总体内部差异抽样调查的组织方式:1·简单随机抽样(纯随机抽样)方法:将总体单位编成抽样框,而后用抽签或随机数表抽取样本单位。适用:总体规模不大;总体内部差异小(见教材p109-111)2·类型抽样(分层抽样)方法:将总体全部单位分类,形成若干个类型组,然后从各类型中分别抽取样本单位,组合成样本。总体N样本n等额等比例最优······3·等距抽样(机械抽样)方法:将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。排序依据的标志:(1)无关标志;(2)有关标志(总体单位按某一标志排序)············4·整群抽样(clustersampling)方法:将总体全部单位分为许多个“群”,然后随机抽取若干“群”,对被抽中的各“群”内的所有单位登记调查。例:优点:组织工作简便,费用节约。局限性:调查单位过于集中在少数样本群中,限制样本在总体分布的均匀性。适用于两类现象:一类是根据行政、地域或自然形群体;另一类是连续不断的总体。与类型抽样的区别:主要是抽样目的有区别。总体群数R=16样本群数r=4样本容量例:ABCDEFGHIJKLMNOPLHPD例:在某省100多万农户抽取1000户调查农户生产性投资情况。5·多阶段抽样第一阶段:从省内全部县中抽取5个县第二阶段:从抽中的5个县中各抽4个乡第三阶段:从抽中的20个乡中各抽5个村第四阶段:从抽中的100个村中各抽10户样本n=100×10=1000(户)抽样方法1·放回抽样:抽出样本单位登记后放回总体,再抽时总体不变2·不放回抽样:抽出样本单位登记后不放回总体,再抽时总体渐次减少网上调查(surveyoninternet)优越性:反映在及时性和共享性;便捷性和低费用;交互性和充分性;可靠性和客观性;无时空和地域限制等方面。形式有:1、网上直接调查2、网上间接调查二、调查方案统计调查方案的主要内容1、确定调查目的2、确定调查对象和调查单位3、拟订调查提纲4、确定调查时间5、编制调查的组织计划调查表与问卷设计调查表单一表一览表例:《工业企业统计报表》问卷结构:说明词+主题词句+作业记录例:《人口普查登记表》问卷设计基本要求:主题明确,形式简明,文字通俗,容易理解,词句编排,先易后难,层次分明,便于回答。问卷形式:①开放式词句②对选式词句③多项选择式词句④顺位式词句⑤标度式词句〖案例〗统计整理主要任务资料审核、分组、汇总、制表、制图等。分组频数分布统计表统计图分组标志的选择与分组形式关键:服从研究任务需要,反映总体本质特征形式按分组标志性质分品质标志分组数量标志分组按分组标志个数分简单分组复合分组分组体系分类品质数列变量数列单项数列组距数列等距数列异距数列地区数列、时间数列和质别数列例例例例变量数列的编制1·计算极差2·确定形式单项数列:离散型且取值不多。组距数列:离散型且取值多或连续型。3·组距数列:组距;组数;4·计算各组频数,频率,累计频数,累计频率等。5·组中值的计算:闭口组;开口组分组分组前分组后25%33%42%1·划分现象类型作用:例:按所有制性质划分,我国现有:国有经济;集体经济;私营经济;个体经济股份制经济;外商投资经济等经济类型。
2·研究总体结构例:上海市按GDP计算的三次产业结构(%)1990年 1995年1999年 2000年GDP100 100100100 第一产业 4.3 2.5 1.91.8第二产业 63.8 57.3 48.5 47.5第三产业 31.9 40.2 49.6 50.73·研究现象之间的依存关系例:中国农民家庭按收入分组的恩格尔系数(1984年)按收入分组(元)<200<300<400<500<600<800<1000恩格尔系数(%)64.960.256.754.450.549.943.6
频数分布(分布数列)是一种重要的分组资料,反映总体单位在各组的分布状态。基本形式:分组单位数频率合计………100频数分布频率分布分类按反映总体的内容分按反映的时间状态分(1)社会总产品,(2)增加值,(3)国内生产总值(GDP)按计量单位分国民经济统计中几个重要的生产总量指标标志总量总体单位总数时期总量时点总量实物量劳动量价值量统计表和统计图
统计表(statisticaltable)和统计图(statisticalgraph)是重要的统计描述方法。它们具有简单、明了、易于理解和接受的优点,而且便于比较和分析。同样的事实,用文字叙述可能需要进行长篇大论的解释,而且还受语言不同的限制,而用统计表或统计图则可一目了然。
统计表构成总表题横行标题:统计研究的对象。也称主词。纵栏标题:说明主词的指标名。也称宾词数字资料分类主词简单表分组表复合表宾词平行形式交叉形式编制规则:见教材26统计图直方图等距数列:(变量,频数)教材p26异距数列:(变量,频数密度)折线图曲线图等距数列:(组中值,频数)异距数列:(组中值,频数密度)单项数列:(变量,频数)向上累计分布:(变量上限,累计频数)向下累计分布:(变量下限,累计频数)变量的组数无限增多时,折线便趋于一条光滑的曲线。图形教材p27绘制统计图的注意事项
1.统计图类型。例如:独立资料用直条图;连续资料用线图或直方图;构成比资料用百分条图或圆图;双变量资料用散点图;地区性资料用统计地图等。2.统计图要有合适的标题。标题写在图的下方,其要求和统计表的标题的要求一样,要能够概括图的内容3.直条图、线图、半对数线图和直方图的纵、横坐标上要有刻度和单位,刻度要均匀等距(半对数线图的纵坐标除外)。纵横周长度之比为5∶7较合适,比例太大或太小都是不合适的。4.直条图与直方图纵坐标要求从0开始。如果不从0开始,容易造成错觉。5.比较不同事物时用不同的线条和颜色来表示。散点图(scatterdiagram)
1.概念:以点的密集程度和趋势来表示两种现象的相关关系。2.适用资料:双变量资料。3.绘制要点:横轴代表一个变量,纵轴代表另一个变量。纵横轴的坐标起点不一定要从0开始,根据资料的情况而定。4.应用:反映两事物间的相关关系,主要用于相关回归分析。
直方图(histogram)
1.概念:以各矩形的面积来代表各组频数的多少。2.适用资料:连续变量的频数分布。3.绘制要点ⅰ坐标轴:横轴代表变量值,要用相等的距离表示相等的数量。纵轴坐标要从0开始。ⅱ各矩形间不留空隙。ⅲ对于组距相等的资料可以直接作图;组距不等的资料先进行换算,全部转化为组距相等的频数,用转化后的频数作图。下面举例说明。线图(linediagram)
概念:以线段的上升或下降来表示事物在时间上的发展变化或一种现象随另一种现象变迁的情况适用资料:连续性资料。绘制要点:ⅰ坐标轴:横轴表示时间或组段,纵轴表示频数或率。纵轴坐标可以不从0开始,因此在看图时要注意纵轴的起点坐标。ⅱ数据点画在组段中间位置。相邻的点用直线连接,不要用平滑的曲线连接。无数据的组段用虚线连接。直线不能任意外延。ⅲ同一张线图上不要画太多条曲线,否则不易分清。当有两条或两条以上曲线在同一张线图上时,须用不同颜色或不同的图形形式加以区分,并附图例加以说明。应用:反映事物的连续的动态变化规律。
某厂某年职工人数统计表按性别分组男职工女职工合计人数(人)(频数)比率(%)(频率)25311536868.7531.25100.00某厂某年职工家庭人口分组统计按家庭人口分组1合计职工户数(频数)比率(%)(频率)723456381055431202.915.241.320.512.18.0255100第三章数据的汇总一、综合指标概述二、总量指标(绝对数指标)三、平均数指标(平均数)四、标志变异指标五、运用主要内容案例一、综合指标概述统计指标统计指标是综合反映统计总体数量特征的概念和数值。指标名称指标数值反映总体某一方面的质的规定性,是对总体本质特征的一种概括。是总体量的规定性在一定时间、地点、条件下的具体表现。二、总量指标(绝对数指标)概念总量指标是反映社会经济现象总规模、总水平的总和指标。(1)反映国情、国力和企事业单位人、财、物的状况;(3)是计算相对指标和平均指标的基础。(2)是国民经济宏观管理和企业经济核算的基础性指标,是实行目标管理的工具;作用三、平均指标(平均数)概念平均指标反映同类现象的一般水平,是总体内各单位参差不齐的标志值的代表值,也是对变量分布集中趋势的测定。数据集中区变量x常用的几种平均数概念 计算公式 特点 优点:①容易理解,便于计算②灵敏度高③稳定性好④和缺点:①易受极值影响②在偏斜分布和U形分布中,不具有代表性。1.算术平均数()标志总量与总体单位总数的比值 简单:加权:常用的几种平均数概念 计算公式 特点 优点:①灵敏度高②在某种不能计算的条件下,可以代替
缺点:①不易理解②易受极值影响③有“0”值时不能计算
2.调和平均数()标志值倒数平均数的倒数简单:加权:价格(元)3.32.52.0合计销售量(斤)34512算术平均求某种商品三种零售价格的平均价格调和平均价格(元)3.32.52.0合计销售额(元)9.9101029.9常用的几种平均数概念 计算公式 特点 4.中位数(Me)标志值由小到大顺序排列中居中间位置的标志值位置的平均数 上限公式:下限公式:优点:①容易理解,②不受极值影响③适宜于开口组资料和不能用数字测定的事物缺点:①灵敏度和计算功能差②间断数Me常用的几种平均数概念 计算公式 特点 5.众数(Mo)分配数列中出现次数最多的标志值位置平均数 上限公式:下限公式:优点:①容易理解,②不受极值影响缺点:①灵敏度和计算功能差②稳定性差③具有不唯一性常用的几种平均数概念 计算公式 特点 优点:(1)灵敏度高(2)受极值影响小(3)适宜于各比率之积为总比率的变量求平均缺点:①有“0”或负值时不能计算②偶数项数列只能用正根3.几何平均数()几个变量值连乘积的几次根简单:加权:要点解释权数(Weighted),是分布数列中的频数或频率。对求平均数具有权衡轻重的作用,是影响平均数变动的两个因素之一(另一因素是变量值)。权数例(1)(2)(3)X456合计频数频率(%)10201025.050.025.040100.0X456合计频数频率(%)20402025.050.025.080100.0X456合计频数频率(%)20101050.025.025.040100.0=5=5=4.75调和平均数与算术平均数的区别例注意:频率分布变了,均值也变。因此,严格说,权数应指频率。凡是掌握被平均指标的分母资料时,用算术平均法。凡是掌握被平均指标的分子资料时,用调和平均法。平均指标分子:标志总量分母:总体单位总数=几何平均等于对数的算术平均例组矩数列求中位数是用插值法对中位数组分割的结果。例组距数列求众数是以频数之差计算的比例分割众数组组距的结果。例例求95%、93%、90%的几何平均数(计算误差:0.0007)例分组: <60<80<100<120<140< 频数: 5 730 8 2
△1=23△2=22众数组100~80①求比例:△
1/(△
1+△
2)=23/(23+22)=0.511②分割众数组的组距:0.511×(100-80)=10.22(元)下限公式③加下限,即M0=80+10.22=90.22(元)Y(次数)L
△1
△2xU例①求比例:26-12/(42-12)=0.466②分割中位数组的组距:(100-80)×0.47=9.33下限公式③加下限,即Me=80+9.33=89.33(元)标志值由小到大分组: <60<80<100<120<140<频数: 573082 累计频数:512425052 中位数位置:52/2=26∑f/2=26X(元)89.33Y累计次数(∑f)=52LU见教材p45位置平均数与算术平均数的关系XfXfXf对称分布正偏态分布(右)负偏态分布(左)在偏斜不大时1212应用平均指标的原则1.必须是同质的量方可平均;2.总平均数与组平均数结合分析;3.根据具体条件选择平均方法;4.平均数与典型值和分配数列结合分析;5.集中趋势与离散趋势结合分析某厂职工人数统计表按人数分组5~1011~16合计人数(人)(频数)比率(%)(频率)512325.051.04.017~2220100某厂职工人数统计表按人数分组5~1011~19合计人数(人)(频数)比率(%)(频率)512325.051.04.020~2220100上海市总人口数(1980~1991)年份1980年末总人口1146.52年份年末总人口198119821983198419851986198719881989199119901162.841180.511194.011204.781216.691232.331249.511262.421276.451283.351287.20EXCEL应用
使用“分析工具”的操作如下:单击“工具(T)”→“数据分析(D)”命令,弹出如图所示的“数据分析”对话框。
如果在“工具”菜单中没有“数据分析”命令,必须在MicrosoftExcel中安装“分析工具库”。MicrosoftExcel安装的方法是:
1、在Excel“工具”菜单中,单击“加载宏”命令。2、从“加载宏”对话框中找到“分析工具库”选项,将其选中,然后单击“确定”按钮即可完成安装。3、安装完成后在Excel“工具”菜单下就会新增加“数据分析”命令。如果在上面的步骤2“加载宏”对话框中没有找到“分析工具库”选项,必须采用手工方式来进行“分析工具库”的加载。完成Excel数据分析程序安装后,点击工具菜单中的“数据分析”,即会弹出Excel统计分析工具选择菜单(如上图)选中某一个统计分析工具,点击确定按钮,就OK了。
Excel的直方图分析直方图是描述统计的图解方法,它与其它统计定量方法相辅相成,共同完成汇总、揭示数据分布特征的任务。但它们一般不能正确估计总体特征(除非满足抽样有关的统计假定)。以第2章习题1为例,说明应用Excel进行统计频率分布和直方图等操作的步骤。1.进入Excel并打开新工作簿,在A单元列中逐个输入原始数据,在B单元列中输入各组的分组上限,不管连续性变量还是离散性变量,分组的频数都只计算到各组上限包括的变量值数目为止。一般均取“10”的倍数减1,而分组的下限将默认为“10”的倍数。2.输入原始数据。在B1单元中输入标志名称,在B2单元中输入“59”(说明在小于和等于“59分”的变量数计在第一组的频数内,等于“60分”的变量数将计到下一组的频数内),作为第一组的分组上限,在B3单元中输入“69”作为第二项数据,依此输入。3.从工具菜单中下拉,选择数据分析→直方图→点击确定按钮。4.在直方图分析选项框的“输入区域(I)”中输入含有原始数据单元范围的引用(A1:An),本例为$A$1:$A$51,更为简便的是直接用光标圈选A列的数据。此外,如果引用范围包括标志值的名称,必须勾选“标志”选项。分组上限频率593694791889189951092其他0
5.在“接收区域”中输入含有分组单元的引用(B1:Bn),输入包含有分组标志值单元范围的引用,本例为$B$1:$B$7,通常这些分组区间的界限(上限)必须按升序排列。
6.在“输出区域”中输入想让输出表显示其范围的左上角单元引用(必须是空的单元),注意防止表格与图表以及原始数据的覆盖和重叠。本例取$D$1。勾选“图表输出(C)”复选框,单击确定。输出如下图表。Eviews应用Eviews软件是应用广泛的经济计量分析软件,尤其在金融分析、宏观经济预测、销售预测和成本分析经济领域具有非常强大的数据分析处理和预测功能。这里涉及的软件为Eviews3.l版本。下面介绍它的基本操作方法。主窗口简介软件安装后,在相应的目录下用鼠标双击图标启动Eviews3.l程序,进入主窗口。主窗口上方排列着按照功能划分的9个主菜单选项(见下图)。
建立工作文件Eviews要求数据的分析处理过程要在特定的工作文档(Workfile)中进行,并且该文档需要在具体数据的录入之前建立。工作文档的作用在于存储分析数据和分析结果。点击File→New→Workfile,屏幕上出现一个工作文件定义对话框,要求用户指定序列观测数据的频率和样本大小(见图2-5-5)。
上海市城市居民消费与投资倾向调查问卷尊敬的先生、女士:我们是上海大学的学生。为了积极参与贯彻国家关于扩大内需推动经济增长的方针和理论与实践相结合的教育原则,在老师指导下我们组织了这次千户居民的社会调查。请您给予支持。调查不记名,全部资料用计算机处理,绝对保密和安全,您只需在符合您的情况的答案上打个勾,化费几分钟时间。谢谢!(1)您家是否已经拥有下列耐用家电设备1、□彩电,2、□组合音箱,3、□VCD(或DVD),4、□冰箱,5、□空调,6、□电脑(2)您家的住房是:1、□租赁公房,2、□有产权公房,3、□新商品房,4、□其他(请注明)
(3)您家今明两年是否准备以下项目支出:1、□购买家电设备 5、□现有住房装修2、□购买成套家俱 6、□支付子女教育费3、□购买汽车 7、□国内或国际旅游4、□购买(或置换)房屋 (4)您今明两年不准备上列大项目支出的主要原因是:(选填3项)
1、□没有必要 5、□售后服务差2、□经济不宽裕 6、□价格不合理3、□品牌不中意 7、□其他(请注明)
4、□质量信不过(5)您购买商品考虑的主要因素是:1、□实用价值 4、□品牌 2、□商品质量
5、□售后服务
3、□价格 (请按您认为的重要性□在中写上位序)
(6)您家平均每月总收入是:1、□800元以下 5、□2000~3000元2、□800~1200元 6、□3000~5000元3、□1200~1500元 7、□5000~8000元4、□1500~2000元 8、□8000元以上(7)您家平均每月日常生活费开支是
元A、其中用于吃(食品)支出大约是
元(8)您认为您家近几年生活水平是1.□2.□3.□ 4.□ 5.□提高很多略有提高没有变化略有下降下降很多 (9)您收入节余用予以下哪些项?各项约占多大比重?1.银行储蓄 ()%4.其他债券 ()%2.国债(国库卷)()%5.股票()%3.基金 ()%6.保险()% 7.其他()%(10)您存钱的主要目的是:1、□购买设备 4、□子女教育2、□购买住房 5、□养老防病3、□结婚6、□旅游 (请按你认为的重要性在□中写位序)(11)您是否了解现在推行的信贷消费1、□不了解,2、□了解一点,3、□了解,4、□很了解(12)您是否打算参加信贷消费:1、□是,2、□不(跳过第13问题)(13)您信贷消费的项目是()
(请按第3题的编号填写)(14)您是否同意下列看法:很同无不很同意所同不意谓意同 意1、信贷消费不合中国国情 2、信贷消费是资本主义国家的做法 3、信贷消费是先甜后苦 4、借债享受有风险 5、借债消费不光彩 6、信贷消费是现代通行的做法 7、只要量力借贷,有利无害 8、发展信贷消费能促进经济增长 (15)最后,了解一下您的基本情况A、您的性别:1、□男,2、□女B、您的年龄:
周岁C、您的文化程度: 1、□不识字或识字不多,2、□小学3、□初中4、□高中或中专, 5、□大专或大学以上D、您家庭人口数
人其中D(1)在业
人;D(2)离退休
人;D(3)失业、下岗
人;D(4)在校学生
人E、您的职业
(见卡片)F、职务
四、标志变异指标(Dispession)概念标志变异指标是反映变量分布离散趋势、与平均指标相匹配的指标。(1)反映变量分布的离散趋势;(3)是对事物发展均衡性的量度。(2)是对平均数的代表性程度的量度;作用常用的几种标志变异指标概念 计算 特点 数列中最大值与最小值之差1.极差(R)R=最大值-最小值优点:容易理解,计算方便缺点:不能反映全部数据分布状况2.平均差(A、D)各标志值与均值离差绝对值的算术平均 简单:加权:优点:反映全部数据分布状况缺点:取绝对值,数字上不尽合理 概念 计算 特点 各标志值与均值离差平方的平均。方差的平方根(取正根)3.方差(σ2)和标准差(σ) 优点:反映全部数据分布状况,数字上合理。缺点:受计量单位和平均水平影响,不便于比较4.标准差系数(Vσ) 标准差与均值之商,是无量纲的系数 简单:加权:优点:适宜不同数据集的比较缺点:对数据结构变化反应不灵敏 方差(σ2)和标准差(σ)是应用最广的标志变异指标σ2和σ的简易计算公式由组方差(或组标准差)求总方差(或总标准差)平均组内方差组间方差标准差的应用测定分布的偏度1.偏度系数SK=0SK>0SK<0对称分布正偏态分布(右)负偏态分布(左)2.偏度系数(m3——三阶中心矩)定义M=∑(X-A)k/n为变量X关于A的k阶矩。当A=0,即以原点为中心,上式称为““K阶原点矩”。K=1,2,3时,有:一阶原点矩M1=∑(X-0)1/n=∑X/n二阶原点矩M2=∑(X-0)2/n=∑X2/n三阶原点矩M3=∑(X-0)3/n=∑X3/n当A=,即以为中心,上式称为“K阶中心矩”。K=1,2,3时,有:一阶中心矩二阶中心矩三阶中心矩K=1,2,3时,有:一阶中心矩二阶中心矩三阶中心矩所以,m3可以测定偏度。为消除量纲,转变为系数,再除以σ3。<0负偏态=0对称分布>0正偏态第四章统计比率与指数概念相对指标(statisticalratio)是两个有联系的指标对比的比值,反映事物的数量特征和数量关系。(1)反映总体内在的结构特征(3)反映事物发展变化的过程和趋势。(2)用于不同对象的比较评价;作用种类计划完成相对数结构相对数比例相对数比较相对数强度相对数动态相对数六种相对数指标的比较不同时期比较动态相对数强度相对数不同现象比较不同总体比较比较相对数同一总体中部分与部分比较部分与总体比较实际与计划比较比例相对数结构相对数计划完成相对数同一时期比较同类现象比较应用原则(1)正确选择对比的基数;(2)必须注意统计的可比性;(3)相对指标要与总量指标相结合。<案例>
概念总指数的编制指数的因素分析指数的应用
案例指数
指数(IndexNumber)是研究现象差异或变动的重要统计方法。它起源于18世纪欧洲关于物价波动的研究。至今,已被广泛应用于社会经济生活各方面;一些重要的指数已成为社会经济发展的晴雨表。主要内容概念概念广义指数:狭义指数:反映现象数量差异或变动程度的相对数。例如,动态相对数,比较相对数、计划完成程度相对数。反映不能直接相加的复杂现象综合变动程度的相对数。例如,零售物价指数,消费价格指数、股价指数。反映复杂的社会经济现象总体的综合变动;测定现象总变动中各个因素的影响;对多指标复杂现象综合测评。作用:按对象的范围分 按指标的性质分按采用的基期分个体指数组指数总指数种类:数量指标指数质量指标指数定基指数环比指数总指数的编制一、综合指数概念:综合指数是总指数的基本形式。它是通过引入一个同度量因素将不能相加的变量转化为可相加的总量指标,而后对比所得到的相对数。综合指数指数化因素×同度量因素指数化因素×同度量因素总量指标总量指标==所要研究其变动程度的两个时期的某一经济变量引入一个同一时期的经济量,起到媒介或权数的作用综合指数平均数指数综合指数的编制1、数量指标的综合指数(例:销售量指数)报告期和基期的销售量,为指数化因素基期价格作为同度量因素基期实际销售额以基期价格计算的报告期销售额该指数说明多种商品销售量的综合变动程度。分子、分母之差:说明由产量变动带来的销售额的增(减)量2、质量指标的综合指数(例:价格指数)报告期和基期的价格,为指数化因素报告期销售量作为同度量因素报告期实际销售额以报告期销售量计算的基期销售额该指数说明多种商品价格的综合变动程度。分子、分母之差:说明由价格变动带来的销售额的增(减)量。3、其他形式的综合指数公式拉氏公式:派氏公式:马歇尔—艾奇沃斯公式:费暄的“理想公式”:固定价格的物量指数:固定物量的价格指数:编制综合指数的一般方法原则:(1)同度量因素与指数化因素相乘后必须是有实际经济意义的总量指标;(2)数量指标指数以质量指标为同度量因素;质量指标指数以数量指标为同度量因素;(3)同度量因素的固定时期必须以指数的经济意义为依据。二、平均数指数是以总量指标为权数对个体指数进行加权平均的总指数。概念:编制方法1、加权算求平均数指数通常用来计算数量指标指数(如销售量指数)销售量个体指数与销售量个体指数相对应的销售额占总销售额的比重2、加权调和平均数指数通常用来计算质量指标指数(如价格指数)价格个体指数与价格个体指数相对应的产品销售额占总销售额的比重销售量指数价格指数比较:用哪种公式好?实际工作中,常采用相对固定的权数。某个经济发展较稳定时期的产值或销售额的结构。三种指数的比较性质资料计算方法差额分析综合指数平均数指数狭义指数广义指数全面资料样本资料先综合后对比先对比后综合分子、分母之差为总量差异有经济意义分子、分母之差,不形成实际总量,无经济意义总平均数指数广义指数分组资料 三种形式的总平均数对比自成体系分子、分母之差为平均数差异,有意义 指数的因素分析一、总量指标指数的因素分析1、方法:这是利用综合指数的指数体系进行的因素分析。构造有实际经济意义的指标体系:分析对象:S=A·B(因素指标)将指标体系转换为指数体系:分析某一因素变动影响时,将其他因素固定:分析相对变动影响时,也分析绝对差额影响:方法步骤(A1-A0)B0;(B1-B0)A1A1B0A1B1A0B0A1B0______;_____2、举例两因素分析产值=产量×价格产值指数=产量指数×价格指数指数体系代入资料计算得到:151.33%=126.67%×119.47%770=400+370(万元)注意:(1)固定因素时期的选择要满足平衡的要求;(2)因素的排序要使相邻两变量能分能合。S=A·B·C;D·C或S=A·B·CA·E原材料支出总额指数=产量指数×单耗指数×原材料单价指数原材料支出总额=产量×单耗×原材料单价代入资料计算得到: 108.53%=109.17%×88.37%×112.50% 2420=2600-3600+3420(万元)指数体系多因素分析二、平均数指标指数的因素分析1。特点:总平均数指数是对总平均指标变动程度的测定(1)属于广义指数;(2)以组平均数为基础,突出结构因素;(3)有三种形式。可变构成指数固定构成指数结构变动影响指数2、例:某企业成本变动总指数(1)可变构成指数(包含组平均数变动和结构变动双重影响)某企业报告期和基期单位成本报告期和基期各车间产量所占比重即双重因素影响企业单位成本变动。(2)固定构成指数(只反映各车间平均单位成本变动影响)各车间报告期、基期单位成本代入资料计算代入资料计算即由于各车间单位成本的平均变动带来的企业总成本的增加。(3)结构变动影响指数代入资料计算报告期和基期各车间产量所占比重即由于企业产量结构变动带来的企业平均单位成本的减少。三个指数的关系:可变构成指数=固定构成指数×结构变动影响指数劳动生产率变动的差额:三、将综合指数同平均数指数结合进行多因素分析。混合型因素分析 例:某煤矿公司产量增长因素分析。煤产量指数=劳动生产率指数×工人人数指数代入资料计算得到:207.14%=199.18%×104%1500=14440+560(千吨)式中的即劳动生产率可变构成指数代入产量指数分解式:代入资料计算得到:207.14%=176.62%×115.39%×104%15000=12200+2240+560(千吨)指数的应用一、居民消费价格指数1、是关系国计民生最重要的一种指数;可用于分析居民实际收入水平的变化,也是国民经济核算和宏观经济分析与决策的重要指标;2、采用加权算术平均方法,由代表商品个体指数逐级加权平均为总指数。即由基本分类指数,再中类、大类,最终由各大类指数加权平均为城市(或农村)居民消费价格总指数;3、关键问题:商品分类,代表品选择,价格采集,权数确定等。(一)居民消费价格指数的编制方法指数的应用1、测定通货膨胀率(%)计算期居民消费价格(二)居民消费价格指数的应用(举例)=_____________________基期居民消费价格指数×100-1002、测定货币购买力和职工实际工资的变动;货币购买力指数=_____________________1居民消费价格指数职工实际工资指数=职工平均工资指数/居民消费价格指数=职工平均工资指数×货币购买力指数3、计算商品需求的价格弹性系数等。指数的应用二、股票价格指数1、道·琼斯股价平均数2、标准·普尔股价指数3、香港恒生指数4、上海证交所股份指数5、深圳证交所股份指数三、工业经济效益综合指数(一)多指标综合评价的概念和方法多指标综合评价法就是将多个指标合成为一个综合数值的方法。三个关键问题:1、构建一个科学合理的评价指标体系;指数的应用2、指标的无量纲处理;3、确定各指标在合成中的权数。(二)工业经济效益综合指数我国现行的工业经济效益综合指标包括:1、总资产贡献率;2、资本保值增值率;3、资产负债率;4、流动资金周转率;5、成本费用利润率;6、工业全员劳动生产率;7、产品销售率。第五章抽样推断法推断统计:利用样本统计量对总体某些性质或数量特征进行推断。随机原则总体样本总体参数统计量推断估计参数估计检验假设检验抽样分布案例1、概率概述抽样调查概率概念实验样本空间实验结果的概率(古典法、相对次数法、主观法)2、随机变量和随机变量的概率发布随机变量离散型随机变量概率分布(累计分布函数)连续型随机变量的分布(概率密度)3、常用的概率分布二项分布泊松分布正态分布4、大数定律及中心极限定理大数定律中心极限定理根据这个流程图,结合一个具体实例,说明数学建模的过程。工厂加工某种零件有三道工序:粗加工、返修加工和精加工。每道工序完成时,都要对产品进行检验。粗加工的合格品进入精加工,不合格品进入返修加工;返修加工合格品进入精加工,不合格品作为废品处理;精加工合格品为成品,不合格品为废品。请用流程图表示这个零件的加工过程。抽样分布简单随机抽样和简单随机样本的性质无限总体有限总体不放回放回样本样本放回不放回样本样本独立性和同一性同一性当n/N≤5%时,有限总体不放回抽样等同于放回抽样无限总体统计量与抽样分布统计量:即样本指标。样本均值样本成数样本方差如:抽样分布:某一统计量所有可能的样本的取值形成的分布。性质数字特征0≤P(Xi)
1∑P(Xi)=1均值E(X)方差E[x-E(x)]2方差的平方根即抽样分布的标准差就是推断的抽样误差。抽样误差就是样本平均数分布数列的标准差。计算标准分即将原始分数X经过线性变换转变为标准分Z。反映各原始分的平均数为中心的相对位置。XO任何原始分在总体中的位置,用Z倍的σ来测定。计算抽样误差(以平均指标为例)设:样本均值的抽样分布(简称均值的分布)抽样总体样本均值X,(N)均值μ=∑Xi/Nx,(n)样本均值是样本的函数,故样本均值是一个统计量,统计量是一个随机变量,它的概率分布称为样本均值的抽样分布。均值分布的数学期望和方差抽样方法 均值 方差 标准差 (1)从无限总体抽样和有限总体放回抽样(2)从有限总体不放回抽样抽样误差抽样误差从正态总体中抽样得到的均值的分布也服从正态分布。从非正态总体中抽样得到的均值的分布呢?中心极限定理:无论总体为何种分布,只要样本n足够大(n≥30),均值()标准化为(z)变量,必定服从标准正态分布,均值()则服从正态分布,即:两个样本均值之差的抽样分布抽样总体样本X1,(N1)x1,(n1)抽样总体样本X2,(N2)x2,(n2)估计(1)如:(2〕如果两个总体都是非正态总体,只要n1、n2足够大,根据中心极限定理,可知:样本成数(即比例)的抽样分布(简称成数的分布)抽样总体样本成数X,(N)成数P=Ni/Nx,(n)所有可能的样本的成数()所形成的分布,称为样本成数的抽样分布。成数分布的数学期望和方差抽样方法 均值 方差 标准差 (1)从无限总体抽样和有限总体放回抽样(2)从有限总体不放回抽样根据中心极限定理,只要样本足够大,的分布就近似正态分布。(np和nq大于5时)抽样误差抽样误差两个样本成数之差的抽样分布抽样总体样本X1,(N1)x1,(n1)抽样总体样本X2,(N2)x2,(n2)估计当n1、n2都足够大时,样本成数都近似服从正态分布,两个样本成数之差()也近似服从正态分布。P1-P2=?一个样本方差的抽样分布抽样总体样本若:从一个正态总体中抽样所得到的样本方差的分布n,S2则当则两个样本方差之比的抽样分布抽样总体样本从两个正态总体中分别独立抽样所得到的两个样本方差之比的抽样分布。n1,S12则抽样总体样本n2,S22参数估计点估计以样本指标直接估计总体参数。评价准则的数学期望等于总体参数,即该估计量称为无偏估计。无偏性有效性当为的无偏估计时,方差越小,无偏估计越有效。一致性对于无限总体,如果对任意则称的一致估计。是充分性一个估计量如能完全地包含未知参数信息,即为充分量估计量区间估计估计未知参数所在的可能的区间。评价准则随机区间置信度精确度随机区间包含(即可靠程度)越大越好。的概率的平均长度(误差范围)越小越好一般形式或总体参数估计值误差范围△:一定倍数的抽样误差例如:抽样误差一定时,越大,概率(可靠性)大;随之增大,精确度就差。抽样组织方式和参数的区间估计简单随机抽样待估计参数已知条件置信区间正态总体,σ2已知正态总体,σ2未知非正态总体,n≥30有限总体,n≥30(不放回抽样)总体均值(μ)σ未知时,用Sσ未知时,用S两个正态总体已知两个正态总体未知但相等两个非正态总体,n1,n2≥30两个总体均值之差μ1-μ2简单随机抽样待估计参数已知条件置信区间无限总体,np和nq都大于5总体成数(p)无限总体,N1P1>5,n1q1>5N2P2>5,n2q2>5两个总体成数之差(P1-P2)有限总体,np和nq都大于5有限总体,N1P1>5,n1q1>5N2P2>5,n2q2>5样本数的确定待估计参数已知条件样本数的确定正态总体,σ2已知总体均值(μ)例:误差范围简单随机抽样有限总体,不放回抽样,σ2已知总体成数(P)服从正态分布有限总体,不放回抽样简单随机抽样待估计参数已知条件置信区间正态总体总体方差
两个正态总体两个总体方差之比分层随机抽样待估计参数已知条件置信区间有限总体不放回抽样(n等比例分配于各层)各层nh≥30总体均值
(μ)有限总体不放回抽样(n等比例分配于各层)各层nh≥30总体成数(P)总体N样本n均值:平均层内方差:置信区间抽样误差估计整群随机抽样待估计参数已知条件置信区间有限总体不放回抽样,样本群数r足够大总体均值
(μ)有限总体不放回抽样,样本群数r足够大总体成数(P)总体群数RABCDEFGHIJKLMNOPLHPD样本群数r估计均值:群间方差:置信区间抽样误差待估计参数已知条件样本数的确定总体均值(μ)分层抽样总体均值(μ)整群抽样有限总体不放回抽样,等比例分配样本有限总体不放回抽样,服从正态分布未知用未知用第六章显著性检验基本思想检验规则检验步骤常见的假设检验基本思想小概率原理:如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中事件A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。总体(某种假设)抽样样本(观察结果)检验(接受)(拒绝)小概率事件未发生小概率事件发生假设的形式:H0——原假设,H1——备择假设双尾检验:H0:μ=μ0,H1:μ≠μ0单尾检验:H0:μ≥μ0,H1:μ<μ0
H0:μ≤μ0,H1:μ>μ0假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。检验规则确定检验规则检验过程是比较样本观察结果与总体假设的差异。差异显著,超过了临界点,拒绝H0;反之,差异不显著,接受H0差异临界点拒绝H0接受H0cc判断两类错误接受或拒绝H0,都可能犯错误I类错误——弃真错误,发生的概率为αII类错误——取伪错误,发生的概率为β检验决策H0为真 H0非真 拒绝H0犯I类错误(α)正确 接受H0正确犯II类错误(β) 怎样确定c?α大β就小,α小β就大基本原则:力求在控制α前提下减少βα——显著性水平,取值:0.1,0.05,0.001,等。如果犯I类错误损失更大,为减少损失,α值取小;如果犯II类错误损失更大α值取大。确定α,就确定了临界点c。①设有总体:X~N(μ,σ2),σ2已知。②随机抽样:样本均值③标准化:④确定α值,⑤查概率表,知临界值⑥计算Z值,作出判断0接受区拒绝区拒绝区当检验判断为接受原假设H0时,就有可能犯取伪的错误即II类错误。犯II类错误的概率计算:(1)先求出拒绝H0的临界值;(2)再求得在统计量真实的抽样分布下达到临界值的概率β。统计中,称不犯取伪错误的概率1-β为统计检验的能力或效力。II类错误的概率β的计算检验步骤建立总体假设H0,H1抽样得到样本观察值12选择统计量确定H0为真时的抽样分布3根据具体决策要求确定α确定分布上的临界点C和检验规则计算检验统计量的数值比较并作出检验判断7456几种常见的假设检验总体均值的检验条件检验条件量拒绝域H0、H1(1)H0:μ=μ0H1:μ≠μ0
z(2)H0:μ≤μ0H1:μ>μ0(3)H0:μ≥μ0H1:μ<μz0z0正态总体σ2已知总体均值的检验条件检验统计量拒绝域H0、H1(1)H0:μ=μ0H1:μ≠μ0
t(2)H0:μ≤μ0H1:μ>μ0(3)H0:μ≥μ0H1:μ<μt0t00正态总体σ2未知(n<30)总体均值的检验条件检验统计量拒绝域H0、H1(1)H0:μ=μ0H1:μ≠μ0
z(2)H0:μ≤μ0H1:μ>μ0(3)H0:μ≥μ0H1:μ<μz0z00非正态总体n≥30σ2已知或未知两个总体均值之差的检验条件检验统计量拒绝域H0、H1(1)H0:μ1=μ2H1:μ1≠μ2
z(2)H0:μ1≤μ2
H1:μ1>μ2
(3)H0:μ1≥μ2
H1:μ1<μ2
z0z00两个正态总体已知两个总体均值之差的检验条件检验统计量拒绝域H0、H1(1)H0:μ1=μ2
H1:μ1≠μ2
t(2)H0:μ≤μ2
H1:μ>μ2
(3)H0:μ1≥μ2
H1:μ1<μ2
t0t00两个正态总体未知,但相等两个总体均值之差的检验条件检验统计量拒绝域H0、H1(1)H0:μ1=μ2
H1:μ1≠μ2
(2)H0:μ1≤μ2
H1:μ1>μ2
(3)H0:μ1≥μ2
H1:μ1<μ2
0z00两个非正态体n1≥30n2≥30已知或未知zz总体成数的检验条件检验统计量拒绝域H0、H1(1)H0:P=P0H1:P≠P0
z(2)H0:P≤P0H1:P>P0(3)H0:P≥P0H1:P<P0z0z00np≥5nq≥5两个总体成数之差的检验条件检验条件量拒绝域H0、H1(1)H0:P1=P2H1:P1≠P2
z(2)H0:P1≤P2H1:P1>
P2(3)H0:P1≥P2H1:P1<P2z0z00n1p1≥5n1q1≥5n2p2≥5n2q2≥5 一个总体方差的检验条件检验条件量拒绝域H0、H1总体服从正态分布 两个总体方差之比的检验条件检验条件量拒绝域H0、H1总体服从正态分布 FFF
相关分析
回归分析案例第八章相关与回归相关和回归分析是研究事物的相互关系,测定它们联系的紧密程度,揭示其变化的具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、预测和控制的重要工具。主要内容相关分析概念种类线性相关变量之间关系函数关系相关关系因果关系互为因果关系共变关系确定性依存关系随机性依存关系
一、相关分析(一)相关关系的概念
1.函数关系它反映现象之间存在着严格的依存关系,在这种关系中,对于某一变量的每一个数值,都有另一个变量的确定值与之相对应,并且这种关系可以用一个数学表达式反映出来。如:圆的面积与半径之间的关系,即2.相关关系它反映现象之间关系确实存在的,但关系数值不固定的相互依存关系。这一概念表明:(1)相关关系是指现象之间确实存在数量上的相互依存关系。(2)现象之间数量依存关系的具体关系值不是固定的。(一)相关关系的概念
3.相关关系与函数关系的联系由于有观察或测量误差等原因,函数关系在实际中往往通过相关关系表现出来。在研究相关关系时,又常常要使用函数关系的形式来表现,以便找到相关关系的一般数量表现形式。(一)相关关系的概念(二)相关关系的种类按相关的程度完全相关不完全相关不相关(二)相关关系的种类按相关方向正相关负相关(二)相关关系的种类按相关的形式线性相关非线性相关(二)相关关系的种类按变量多少单相关复相关偏相关各类相关关系的表现形态图
计算相关系数并检验估计值的可靠度定数学模型确定相关密切程度确定有无相关和类型相关分析内容(三)相关分析内容(四)相关表和相关图1.相关表相关表是一种反映变量之间相关关系的统计表。将某一变量按其取值的大小排列,然后再将与其相关的另一变量的对应值平行排列,便可得到简单的相关表。例1:某地区某企业近8年产品产量与生产费用的相关情况如表所示:表8-1产品产量与生产费用相关表
从上表可看出,产品产量与生产费用之间存在一定的正相关关系。2.相关图
相关图又称散点图,它是将相关表中的观测值在平面直角坐标系中用坐标点描绘出来,以表明相关点的分布状况。通过相关图,可以大致看出两个变量之间有无相关关系以及相关的形态、方向和密切程度。例2:以表为例,用EXCEL绘制相关图如下产品产量与生产费用相关图(五)相关系数
1.相关系数的定义相关系数是用来说明变量之间在直线相关条件下相关关系密切程度和方向的统计分析指标。其定义公式为:式中:表示数据项数,为自变量,为因变量。相关系数公式的涵义理解
(1)两个变量之间的相关程度和方向,取决于两个变量离差乘积之和,当它为0时,为0;当它为正时,为正;当它为负时,为负。(2)相关程度的大小与计量单位无关。为了消除积差中两个变量原有计量单位的影响,将各变量的离差除以该变量数列的标准差,使之成为相对积差,即,所以相关系数是无量纲的数量。2.相关系数的计算
(1)根据相关系数定义的公式推导得简化公式:例3:以表6-1为例,用EXCEL计算相关系数见表8-2。表8-2相关系数计算表
于是:=0.9697(2)利用EXCEL计算相关系数以表8-1的资料为例,处理的简要步骤与结果如下:在EXCEL主页面中,从[工具]——[数据分析]——[相关关系]进入相关关系窗口做相应处理得以下结果:
3.相关系数的意义相关系数一般可以从正负符号和绝对数值的大小两个层面理解。正负说明现象之间是正相关还是负相关。绝对数值的大小说明两现象之间线性相关的密切程度。(1)r的取值在-1到+1之间。(2)r=+1,为完全正相关;r=-1为完全负相关。表明变量之间为完全线性相关,即函数关系。(3)r=0,表明两变量无线性相关关系。(4)r>0,表明变量之间为正相关;r<0,表明变量之间为负相关。(5)r的绝对值越接近于1,表明线性相关关系越密切;r越接近于0,表明线性相关关系越不密切。线性相关相关系数测定两变量是否线性相关?定义式:未分组:已分组:值:|r|=0不存在线性关系;|r|=1完全线性相关0<|r|<1不同程度线性相关(0~0.3微弱;0.3~0.5低度;0.5~0.8显著;0.8~1高度)符号:r>0正相关;r<0负相关计算公式相关系数的检验(t检验)检验统计量二、回归分析特点线性回归非线性回归回归分析和相关分析的联系和区别1·理论和方法具有一致性;2·无相关就无回归,相关程度越高,回归越好;3·相关系数和回归系数方向一致,可以互相推算。1·相关分析中,x与y对等,回归分析中,x与y要确定自变量和因变量;2·相关分析中x,y均为随机变量,回归分析中,只有y为随机变量;3·
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国复合材料篮球板市场调查研究报告
- 2025年车门总成项目可行性研究报告
- 2025至2031年中国白头翁行业投资前景及策略咨询研究报告
- 2025年拼装式操作台项目可行性研究报告
- 2025年复方磺胺对甲氧嘧啶钠注射液项目可行性研究报告
- 2025年健康脱脂BBQ电烤箱项目可行性研究报告
- 2025年X射线防护单面围裙项目可行性研究报告
- 2025至2030年锥形锯齿锁紧垫圈项目投资价值分析报告
- 2025至2030年超声波负离子发生器项目投资价值分析报告
- 2025至2030年立体观景机项目投资价值分析报告
- 智能型万能式断路器框架开关RMW1、DW45-2000/3P-抽屉式1000A说明
- 客运驾驶人安全考核规程范本
- 2023静脉治疗护理技术操作标准解读
- 先天性肾上腺皮质增生症
- 2024年保密法培训课件
- 2024年湖南铁道职业技术学院单招职业技能测试题库及答案解析word版
- 新《安全生产法》全面解读“三管三必须”
- 印刷包装行业复工安全培训课件
- 蜜蜂的社会结构和功能
- 电气八大管理制度
- 财政投资评审项目造价咨询服务方案审计技术方案
评论
0/150
提交评论