




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1以以Excel Excel 和和SPSSSPSS为工具的管理统计为工具的管理统计同济大学经济与管理学院同济大学经济与管理学院管理科学与工程系管理科学与工程系 张建同张建同 教授教授2主要参考书:1.马庆国.管理统计数据获取、统计原理SPSS工具与应用研究。北京:科学出版社,20032.张建同、孙昌言、王世进.应用统计学.北京:清华大学出版社,2010,33.何晓群.多元统计分析.北京:中国人民大学出版社,20044.戴维 M.莱文、戴维 F.斯蒂芬等 (张建同、刘文驰等译)以Excel为决策工具的商务统计.北京:机械工业出版社,2009年5月以以Excel Excel 和和SPSSSPSS为
2、工具的管理统计为工具的管理统计3几种常用的统计软件几种常用的统计软件(Software)典型的统计软件典型的统计软件SASSASSPSSSPSSMINITABMINITABSTATISTICASTATISTICAExcelExcel4本章教学目标:本章教学目标:l了解统计学的基本知识;l统计数据的收集、调查;l掌握利用统计图表整理和表示统计数据的基本方法;l掌握利用 Office 软件绘制各种统计图表、计算各种统计综合指标。 第一章第一章 统计数据的收集与整理统计数据的收集与整理5本章主要内容本章主要内容1.1 统计学概述1.2 统计数据的收集1.3 问卷设计1.4 统计表和统计图 61.1
3、1.1 什么是统计学什么是统计学? ?1. 数据搜集:例如,调查与试验2. 数据整理:例如,分组 3. 数据展示:例如, 图和表4. 数据分析:例如,回归分析7StatisticsStatistics的定义的定义( (不列颠百科全书不列颠百科全书)Statistics: the science of collecting, analyzing, presenting, and interpreting data. Copyright 1994-2000 Encyclopaedia Britannica, Inc. (不列颠百科全书)8统计数据的内在规律统计数据的内在规律(一些例子)(一些例子)
4、正常条件下新生婴儿的性别比为107:100投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现16点的频率各为1/6农作物的产量与施肥量之间存在相关关系9统计学的应用领域统计学的应用领域10 基于统计学的数据转换应用基于统计学的数据转换应用 财 务 分 析 产 品 开 发 计 划 市 场 研 究 工 序 管 理 和 质 量 控 制 人 力 资 源 管 理 其 他 应 用 数 据 ( data ) 信 息 ( inform ation ) 转 化 / 抽 取 统统 计计 学学 决 策 ( decision ) 11应用统计的领域应用统计的领域12应用统计的领域应用统计的领域(续续
5、)13二、统计研究对象的特点二、统计研究对象的特点1.1.数量性数量性统计学研究的对象是客观现象的数量特征和规律性。2.2.总体性总体性统计学研究的是客观现象总体的数量特征与规律性,而不是个体的量。3.3.具体性具体性统计的对象是一定时间、地点、条件下事物的量,而不是抽象对象的量,这是统计学和数学的一个重要区别。4.4.差异性差异性组成统计研究对象总体的个体是有差异的,否则就不需要进行统计分析。统计研究中需要对总体中大量的个体进行观察并进行综合分析,由此才能获得总体的数量分布特征。 14三、统计学的分类三、统计学的分类 统计学大致有以下两种主要的分类方法。1.1.描述统计学和推断统计学描述统计
6、学和推断统计学 这一分类方法既反映了统计学发展的两个主要阶段,同时也反映了各自不同的侧重。l 描述统计学描述统计学 是研究如何对客观现象进行数量的计量、加工、概括和表示的方法。 在二十世纪之前统计学基本上处于描述阶段。描述统计学是统计学的基础。l 推断统计学推断统计学 是研究如何根据样本数据去推断总体的情况,概率论是其理论基础。 推断统计学是近代统计学的核心,也是统计学中的主要内容。 15统计学的分科统计学的分科统计学的分科统计学的分科16描述统计与推断统计的关系描述统计与推断统计的关系172.2.理论统计学和应用统计学理论统计学和应用统计学l理论统计学理论统计学是研究统计学的数学原理,它基于
7、概率论的原理,还包括不属于传统概率论的一些内容,如随机化原则的理论、各种估计的原理、假设检验的原理以及一般决策的原理。在统计实践中经常会遇到一些原有的统计方法不能适应的新问题,需要创造新的统计模型和统计分析方法,这就需要统计理论的研究与指导。l应用统计学应用统计学将统计学的基本原理应用于各个领域就形成各种应用统计学的分支。它包括适用于各个领域的一般性的统计方法,如参数估计、假设检验、方差分析、回归分析等,还包括在某一领域中特定的分析方法,如经济统计中的时间数列分析和指数分析等。应用统计学侧重于阐明统计学的基本原理,并将理论统计学的成果作为工具应用于各个领域。 18统计基本术语统计基本术语变量:
8、变量:事物的特征,是运用统计方法所分析的对象。例如,在商业模型中,销售额、每年的开支和每年的净利润都是企业想要分析的变量。数据数据 :是与变量相关的值。变量可能随时间变动,如某一公司的期望销售额、开支和净利润每年都有所不同。这些不同的值就是与变量相关的数据,或者简单地说,就是统计所要分析的“数据”。注意注意:变量需赋予可操作定义 ,否则会产生歧义。如:对销售额的操作性定义可能会发生这样错误的理解:一个人认为年销售额是指全部连锁店的年销售额,而另一个人则认为是每家店的年销售额。 19统计基本术语统计基本术语总体总体:所研究对象的全体。个体个体:指总体中的每个元素或单元。总体依其所包含的个体总数分
9、为有限总体和无限总体。样本样本:从总体中挑选出来用于分析的一部分。这种挑选通常是相对独立的。样本是进行推断统计的依据。参数参数:参数是描述总体特征的数值。统计量:统计量:是描述样本特征的数值201.21.2统计学中将变量分为分类变量或数值变量。 分类变量分类变量(也称为定性变量)的值只能按类别分开。数值变量数值变量(也称为定量变量)的值表示数量。数值变量可进一步分为离散变量和连续变量。 21四种计量尺度1.21.2数据的计量尺度数据的计量尺度22定类尺度定类尺度( (概念要点概念要点) )计量层次最低对事物进行平行的分类各类别可以指定数字代码表示使用时必须符合类别穷尽和互斥的要求数据表现为“类
10、别”具有=或的数学特性23定序尺度定序尺度( (概念要点概念要点) )对事物分类的同时给出各类别的顺序比定类尺度精确未测量出类别之间的准确差值数据表现为“类别”,但有序具有或的数学特性24定距尺度定距尺度( (概念要点概念要点) )1. 对事物的准确测度2. 比定序尺度精确3. 数据表现为“数值”4. 没有绝对零点5. 具有 + 或 - 的数学特性25定比尺度定比尺度( (概念要点概念要点) )1. 对事物的准确测度2. 与定距尺度处于同一层次3. 数据表现为“数值”4. 有绝对零点5. 具有 或 的数学特性26四种计量尺度的比较四种计量尺度的比较四种计量尺度的比较四种计量尺度的比较定类尺度定
11、类尺度定序尺度定序尺度定距尺度定距尺度定比尺度定比尺度 分类(,分类(, ) 排序(排序( ) 间距(间距( + ,- ) 比值(比值( ,) 计量尺度计量尺度数学特性数学特性“”27数据类型与统计方法数据类型与统计方法数据类型与统计方法数据类型与统计方法定类数据定类数据定序数据定序数据品质数据品质数据28 数据是统计分析的基础,社会经济统计中所需要的数据与资料主要来源于统计调查。 一一. .数据采集的基本要求数据采集的基本要求 1.1.准确性准确性 2.2.及时性及时性 3.3.完整性完整性 4.4.系统性系统性 指统计调查的数据资料应配套,要能从不同侧面反映所研究总体的特征,才能为科学的判
12、断和决策提供依据。 1.3 统计数据的统计数据的收集收集29二二. .普遍调查普遍调查普遍调查简称普查,是专门组织的一次性的全面调查 。如全国的人口普查、能源普查、工业普查等。 组织方式有两种:1.建立专门的普查机构2.利用调查单位的原始记录和核算资料,发放调查表,由登记单位填报。普查时注意的原则:b规定统一的标准时点 b规定统一的普查期限(1)规定普查的项目和指标。 30普遍调查实例普遍调查实例【例1.1】 2002年在国务院统一部署下,开展全国“基本单位普查”。关于这次普查的部分重要要求与规定如下:调查目的:统计分析全国和各省市地区的单位总数、性质、隶属关系、分布情况等。标准时间:2001
13、年12月31日。调查对象:各类法人单位,各类法人单位所属的产业活动单位。调查项目:单位总数; 性质分类(企业法人、事业法人、社团法人、机关法人、其他法人); 基本情况 性质划分、隶属关系(中央、省市、区县、街道等); 主要构成(产业结构、行业分布、地区分布、经济成分、规模结构); 分布情况。 31三三. .重点调查重点调查 在总体中选择部分重点单位进行调查,以了解总体基本情况总体基本情况的一种非全面调查。重点调查的特点:重点调查的特点:(1) 重点调查适用于调查对象的标志值比较集中于某些单位的场合,这些单位的管理比较健全,统计力量比较充实,能够及时取得准确资料。(2) 重点调查的目的在于了解总
14、体现象某些方面的基本情况,而不要求全面准确地推算总体数字。(3) 重点调查比实际调查的单位数目少,在满足调查目的所要求的前提下,可以比全面调查节省人力、物力和时间。 32四四. .典型调查典型调查也是专门组织的一种非全面调查,在总体中选择有代表性的典型单位进行深入细致深入细致的调查。典型调查的作用和目的典型调查的作用和目的(1) 研究新事物或某种倾向性的社会问题研究新事物或某种倾向性的社会问题通过对典型单位深入细致的调查,可以发现新情况、新问题,探测事物发展变化的趋势,形成科学的预见。(2) 分析事物的不同类型分析事物的不同类型通过研究造成它们间差别的原因,总结经验教训,研究对策,促进事物的转
15、化和发展。 33五五. .典型调查(续)典型调查(续)(3 3)典型调查可用来研究事务的变化规律。)典型调查可用来研究事务的变化规律。(4 4)典型调查的资料可用来补充和验证全面统)典型调查的资料可用来补充和验证全面统计的数字,推论和测算有关现象的总体。计的数字,推论和测算有关现象的总体。34六六. .抽样调查抽样调查是指按随机原则从总体中抽取部分单位组成样本。目的是利用样本数据推断(估计)总体的数量分布特征。抽样调查是现代推断统计的核心,也是最重要的统计调查方法。 35抽样调查中四种误差抽样调查中四种误差b涵盖误差涵盖误差 :当某一组代表性的样本被排除在抽样调查之外时所引起的选择偏差。b无回
16、应误差无回应误差 :抽样时,对样本个体数据收集失败会导致无回应偏差。 b抽样误差:抽样误差:选择抽样调查是因为这种方法简单、低成本和有效。但同时也意味着有的个体被抽中,有的个体没有被抽中。 b测量误差:测量误差:测量误差是指由于样本数据测量程序的设计和应用不当所引起的误差。b课堂讨论:课堂讨论:举例说明这几种误差。 36七七. .网上调查网上调查截至2009年6月底,中国网民规模达到3.38亿人,较2008年底增长13.4%,上网普及率达到25.5%。网民规模持续扩大,互联网普及率平稳上升。其中宽带网民数达到3.2亿,占比高达94.3%,较2008年底上升了3.7个百分点。另外,截至2009年
17、6月底,作为国家域名,CN域名总计达到1,296万个。作为我国互联网的重要基础资源,CN域名已经广泛地应用在金融、汽车等各个行业中。截止2009年6月我国互联网用户发展情况如图1.2所示。37图1-2 2008-2009年我国互联网用户发展情况(资料来源:第23次中国互联网络发展状况统计报告)38网上调查优势网上调查优势b及时性和共享性 b便捷性和低成本 b可靠性和客观性 b更好的接触性 b穿越时空性 39问卷是一种特殊形式的调查表。其特点是表中用一系列按照严密逻辑结构组成的问题,向被调查者调查具体事实和个人对某问题的反映、看法,它不要求被调查者填写姓名。问卷设计一般要遵循以下原则。1.合理性
18、 合理性指的是问卷必须紧密与调查主题相关。 2.一般性一般性 即问题的设置是否具有普遍意义。 3. 逻辑性逻辑性 问卷的设计要有整体感,这种整体感即是问题与问题之间要具有逻辑性,独立的问题本身也不能出现逻辑上的谬误。 4. 明确性 所谓明确性,事实上是问题设置的规范性。 5.非诱导性 非诱导性指的是问题要设置在中性位置、不参与提示或主观臆断,完全将被访问者的独立性与客观性摆在问卷操作的限制条件的位置上。 1.4 问卷设计问卷设计40在获得原始数据资料之后,需要使用一定的方法对数据进行整理和综合,目的是从大量的原始数据资料中提炼所需要的信息,使之可以提供概要信息并能反映对象总体的基本数量特征,便
19、于人们的理解和使用。表格和图形是整理和反映统计资料的主要工具。1.4统计表和统计图统计表和统计图 41一、分类数据的图表一、分类数据的图表1 1、频数分布表、频数分布表频数分布表列出了一系列分类数据的频率、总数或百分比,可以看出不同类别数据间的区别。 表2-1 1 000美元用途的频数分布表用钱做什么百分比/%购买奢侈品、旅游或礼物20向慈善机构捐款2还贷24储蓄31购买必需品16其他742一、分类数据的图表一、分类数据的图表2 2、条形图、条形图 05101520253035购买奢侈品、旅游或礼物向慈善机构捐款还贷储蓄购买必需品其他100美元的使用百分比/%43一、分类数据的图表一、分类数据
20、的图表3 3、圆饼图、圆饼图 向慈善机构捐款 2% 储蓄 31% 购买必需品 16% 购买奢侈品、 旅游或礼物 20% 其他 7% 还贷 24% 44一、分类数据的图表一、分类数据的图表4、 帕累托图 在帕累托图中,不同类别的数据是按其频率降序排列的,并在同一张图中画出累积百分比图。帕累托图可以体现帕累托原则:数据的绝大部分存在于很少类别中,极少剩下剩余的数据分散在大部分类别中。这两组经常被称为“至关重要的极少数”和“微不足道的大多数” 0 5 10 15 20 25 30 35 储蓄 还贷 购买奢侈品、 旅游或礼物 购买必需品 其他 捐款 有钱要做什么 0 20 40 60 80 100 1
21、20 45二、数值数据的图表二、数值数据的图表例:例:某公司汽车销售量 (单位:辆)487152533641695847605329417281374358684273625944515347665952344973294716395843294652384680585167545758634940546158664750 461、频数分布表、频数分布表 分组统计整理后, 将杂乱无章的 60 个原始数据压缩到8组,清晰地反映了更多的有用信息。 47制作频数分布表的注意事项制作频数分布表的注意事项b分组的数量 实际应用中分组的数量和组距应根据对象的特点和分析的需要决定。如果分组是为了揭示数据的分
22、布规律,则分组不能过多和过少。通常应在515 之间。在绘制直方图时可以参照下表: 样本容量 n 参考分组数 2050 56 51100 78 101200 89 201500 910 5011000 1011 1000以上 112048制作频数分布表的注意事项制作频数分布表的注意事项2) 分组的方法分组的方法可以有等距分组和不等距分组两类。采用哪种分组方法应根据数据的分布特点而定。通常,当数据在一定范围内基本呈对称分布时,宜采用等距分组;而当数据的分布状态极度偏斜时,则宜采用不等距分组。 49例:例: 按雇工人数分组的私营企业规模统计按雇工人数分组的私营企业规模统计 50制作频数分布表的注意事
23、项制作频数分布表的注意事项3 3)组限:)组限:组限也即各组区间的上、下限。确定各组区间的上限和下限时,应保证各组之间既不重叠,又不能遗漏任一数据,使每一个数据都属于某一确定的分组。重叠和组限不重叠组限重叠和组限不重叠组限重叠组限重叠组限相邻组的上下限重合。适用于连续型变量。但各组上、下限中有一个不包含再内。通常按“上限不在内”处理,即组区间是 a, b)的形式。注意:注意:Excel在制作频数分布表时采用的是“上限在内”的规则。不重叠组限不重叠组限相邻组的上下限不重合。适用于离散型变量。 51例:离散型变量的分组(不重叠组限)例:离散型变量的分组(不重叠组限)某公司某月汽车销售量的频数分布表
24、 52例:连续型变量的分组例:连续型变量的分组( (上限不在内上限不在内) )月工资(分组)人数(频数)比率(频率%)1000 以下15014.51000150018517.91500200025624.72000300026225.33000350012011.635004000545.24000 及以上80.8合 计1035100某企业职工工资的分组统计某企业职工工资的分组统计 53制作频数分布表的注意事项制作频数分布表的注意事项4) 组中值组中值是各组的代表值,在计算分组数据的许多统计指标时要用到。通常取该组上限和下限的平均值为组中值。如表2-7所示,1019的组中值是14.5,2029
25、的组中值是24.5,等等。5) 表格线统计表中的表格线应当是两边开口的表格。54使用使用 Excel 制作频数分布表制作频数分布表利用 Excel 的 FREQUENCY 函数语法规则:格式:格式:FREQUENCY(,) 接收区间各组上限值组成的一列区域功能:功能:返回各组的频数。使用【工具】“数据分析”“直方图”功能 55统计图可以形象、直观、生动、简洁地显示数据的特征。常用的统计图有以下几种:1.1.折线图折线图 通常用来描述时间序列数据,用以表示某些指标的变化趋势。制作折线图时应正确选择坐标轴轴的刻度。对同样的统计资料,延伸或压缩某一坐标轴可能传达不同的甚至是误导的印象。 二、二、 统
26、计图统计图56010002000300040001989199019911992199319941995失失业业人人数数:千千人人图1.2 失业人数统计图过分压缩了过分压缩了Y轴轴5710002000300040001989199019911992199319941995失失业业人人数数:千千人人图1.3 失业人数统计图过分压缩了过分压缩了X轴轴582.2.柱形图、条形图和直方图柱形图、条形图和直方图柱形图、条形图和直方图是使用的最为广泛的统计图表。通常将横向绘制的柱形图称为条形图,而将各柱形之间没有间隔的称为直方图,但在Office中将直方图和柱形图统称为柱形图。(1)(1)柱形图柱形图主要
27、用于表示时间序列数据。 590 02002004004006006008008001000100012001200140014001600160018001800199019901991199119921992199319931994199419951995食品食品燃料燃料工业原料工业原料最终产品最终产品图1.4 各类进口商品的变化情况柱形图示例柱形图示例60(2)(2)直方图直方图用以表示数据的频数分布规律。051015202509101 9202 9303 9404 9505 9606 9707 9808 990以上频频数数图1.5 比特公司啤酒销售量的频数分布61未分组数据的茎叶图未分组
28、数据的茎叶图用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶对于n(20n300)个数据,茎叶图最大行数不超过 L L = 10 = 10 log log 10 10 n n b茎叶图类似于横置的直方图,但又有区别直方图可大体上看出一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息62未分组数据未分组数据茎叶图茎叶图(茎叶图的制作)(茎叶图的制作)634.4.曲线图曲线图用于描述连续型变量的分布特征。 Office 中曲线图的绘制中曲线图的绘制方法一:使用“平
29、滑线散点图”绘制方法二:将折线图转换为曲线图右击折线后选择“数据系列格式”,在“图案”标签下选“平滑线”复选框,就将折线图转换为曲线图。 64Cumulative DistributionCumulative Distribution累积分布累积分布累积分布表示的是小于或等于每一组上限的项目累积分布表示的是小于或等于每一组上限的项目数数累积相对频数分布表示的是小于或等于每一组上累积相对频数分布表示的是小于或等于每一组上限的项目比例限的项目比例累积百分数分布表示的是小于或等于每一组上限累积百分数分布表示的是小于或等于每一组上限的项目的百分数的项目的百分数65OgiveOgive穹形图穹形图穹形图
30、是一种累积频数分布或累积相对频数分布穹形图是一种累积频数分布或累积相对频数分布的图形的图形数据值列示在横轴上数据值列示在横轴上纵轴为累积频数或相对累积频数纵轴为累积频数或相对累积频数66Example:Example:比特啤酒公司销售量比特啤酒公司销售量累积频数01020304050607010-1920-2930-3940-4950-5960-6970-7980-89累积频数67经济管理中几种常见的频数分布曲线经济管理中几种常见的频数分布曲线正态分布曲线正态分布曲线这是客观事物数量特征上表现得最为普遍的一类频数分布曲线。如人的身高、体重、智商,钢的含碳量、抗拉强度,某种农作物的产量等等。图1.7 正态分布曲线68偏态曲线偏态曲线图1.8 偏态曲线右偏(正偏)左偏(负偏) 例如收入和财富的频数分配曲线就是右偏的,大量财富都集中在极
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 基础设施项目咨询服务合同模板
- 地下管道施工合同范本合同
- 基础设施建设造价合同
- 劳动合同签订样本合同
- 浅析我国劳动合同法变革与发展趋势
- 租赁市场标准合同
- 房地产买卖合同正规范本
- 环保产业技术合作与研发合同
- 新能源技术研发合同
- 个人汽车抵押借款合同
- 家政收纳培训课件
- 声学基础课后题答案
- 烟雾探测与报警系统
- 【七年级下册地理中图版】专题04 交通运输 【知识梳理】
- 课题申报书:产教融合共同体在东盟国家跨境建设的风险与防范对策研究
- 2025年海南省三亚市吉阳区人民政府招聘12人高频重点提升(共500题)附带答案详解
- 《平面设计中的互动体验研究》
- 钢结构厂房拆除施工方案
- 生态停车场方案
- 脊髓疾病护理
- 江南大学《互换性原理与技术测量Ⅰ》2022-2023学年第一学期期末试卷
评论
0/150
提交评论