




已阅读5页,还剩536页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章绪论 第一节统计的产生与发展第二节统计研究的特点 方法和作用本章小节 主要内容 第一节统计的产生与发展 一 统计与统计学统计学是研究如何对社会总体的数量特征和规律进行描述 推断 认识的一门学科 从字面上直观理解 统计 是指对大量事物进行汇总计数 因此可以简单地说统计就是总起来计量 即统而计之 例如计算全国的总人口数 国内生产总值 计算某个企业的职工人数 产品产量 甚至是计算某个家庭每月的收入和支出等等都是统计 一 统计与统计学 统计活动一般按照统计设计 统计调查 统计整理 统计分析和统计资料的开发利用这几个阶段依次进行 如图1 1 1所示 二 统计的产生与发展 统计产生 原始社会后期 统计萌芽于计数活动 奴隶制国家产生 使统计日显重要 封建社会时期 统计已具规模 资本主义的兴起 统计扩展到社会经济各方面 统计学作为一门系统的科学 距今已有300多年的历史 二 统计的产生与发展 统计发展按照统计学的发展历程 我们可以把统计学划分为古典统计学 近代统计学和现代统计学三个时期 如图1 1 2所示 一 统计学学派 1 德国的记述学派 国势学派 康令 1606 1681 阿痕瓦尔 1719 1772 1764年首创统计学一词 他们在大学中开设 国势学 采用记述性材料 讲述国家 显著事项 籍以说明管理国家的方法 特点是偏重于事物质的解释而忽视量的分析 三 统计学学派与统计学学科体系 二 统计学的近代期 18世纪末 19世纪末 2 政治算术学派代表人物 英国的威廉 配第 约翰 格朗特等 威廉 配第的代表著 政治算术 对当时的英 荷 法等国的 国富和力量 进行了数量的计算和比较 格朗特写出了第一本关于人口统计的著作 他们开创了从数量方面研究社会经济现象的先例 三 统计学学派与统计学学科体系 三 统计学学派与统计学学科体系 数理统计学派代表人物 法国的拉普拉斯 比利时的凯特勒 拉普拉斯把古典概率论引进统计学 发展了概率论 推广了概率论在统计中的应用 凯特勒把德国的国势学派 英国的政治算术学派和意大利 法国的古典概率论加以融合改造为近代意义的统计学 他是数理统计学派的奠定人 有 统计学之父 之称 4 社会统计学派代表人物 德国的克尼斯 恩格尔 梅尔等 他们强调统计学是研究社会现象的科学 包括统计资料的搜集 整理和分析研究 目的是要揭示现象内部的联系 三 统计学学派与统计学学科体系 二 统计学学科体系 三 统计学学派与统计学学科体系 统计学学科体系如图1 1 3所示 二 统计学学科体系 理论统计学指统计学的数学原理 它根植于纯数学的一个领域 概率论 应用统计学将统计学的基本原理应用于各个领域就形成各种各样的应用统计学 它包括一整套统计分析方法 有的是适用于各个领域的一般性的统计方法 如数据收集与整理 参数估计 假设检验 方差分析 相关与回归等 有的则是某一专业领域中特有的分析方法 例如经济统计学中的指数分析法 统计决策及产品质量统计管理等 理论统计学 数理统计学数理统计学是应用数学的一个分支 在这里作为统计学的一个分支 它以概率论等数学理论为基础 研究随机现象的数量规律 是一门纯方法论的科学 为其它学科提供数学分析和推断的方法与技术 统计学原理统计学原理是在统计实践的基础上 对统计理论方法的最一般概括 内容包括统计的对象和任务 统计的理论基础和方法论基础 以及关于统计活动各个环节的理论和方法 统计学原理中结合了数学 概率论和数理统计学的知识 又是统计实践经验的高度总结 是指导统计实践活动的科学依据 一般所说的统计学就是指统计学原理 社会经济统计学社会经济统计学是将理论统计学应用于社会经济领域 以社会 经济 人口 科技和文化等人类自身及其活动为对象的统计方法论 为对社会经济现象数量特征进行的调查研究提供原理 原则和方式方法 自然统计学自然统计学是将理论统计学应用于自然现象领域 是探索地理 地质 气候 天文 生物等非人类现象的数量关系和数量规律的统计方法论 其中较为重要的分支有生物统计学 气象统计学 天文统计学等 应用统计学 三 统计学与其他学科的关系 统计学和数学的关系统计学中具有方法论性质的数理统计学是应用数学的一个分支 因此统计学与数学的关系十分密切 且与其他的应用数学有一定的共性 如和数学中的有关定理一样 统计中的一些分布也是客观现象数量特征的一种抽象 统计学与其他的数学分支相比又有其特殊性 1 处理的数据不同 2 处理的方法不同 三 统计学与其他学科的关系 统计学与其他专门学科的关系统计方法一般的数据分析方法适用于其他任何科学中的偶然现象 因此它与很多专门学科都有关系 但是统计方法只是从事物的外在数量表现去推断该事物可能的规律性 它本身不能说明何以会有这个规律性 这是各专门学科的任务 第二节统计研究的特点 方法和作用 统计研究的特点 第二节统计研究的特点 方法和作用 数量性 数字是统计的语言 数量性是统计研究的基本特点 统计研究系统如图1 2 1所示 统计研究的特点 总体性统计研究就是总的 综合的数量研究 一般理解的总体是指统计总体 是由同类个体组成的集合体 如人口总体 企业总体 商品总体等等 这时统计研究的目的不是计量个体的特征表现 而是对个体的特征表现进行统计整理和统计分析 得到总体的综合的数量特征 具体性具体性即客观性 统计对象是具体的 是客观存在的事物或现象 统计数据包括原始数据和计算结果 都是客观现象在一定时间 地点 条件下的数量表现 是具体的数据 统计研究的特点 统计研究的方法 按照统计工作的不同阶段和作用列出的常用统计方法如图1 2 2所示 大量观测法所谓大量观测法就是对所研究的客观现象总体中的全部或者足够多的个体进行观测以达到正确认识总体的目的 大量观测法不是一种具体的应用方法 而是研究客观现象总体数量特征的重要思想方法和原则 是统计研究的指导原则 统计实验法和统计调查法统计实验法是按照一个设定的实验程序 观测现象开始实验以后的数量特征 根据实验收集的资料进行整理 分析 得到对现象总的认识 统计调查法指主要依靠调查人员 通过各种途径收集所研究现象的数据资料 包括历史资料和现实资料 统计研究的方法 统计描述法和统计推断法统计描述法是综合描述的方法 是通过对所收集的数据进行加工处理 计算综合性的统计指标 描述所研究现象总体数量特征和数量关系的方法 根据所描述问题的特点 可以具体使用综合指标法和数学模型法 统计推断法是在对已知事物进行描述的基础上 对未知事物进行推断的方法 根据推断的内容不同可分为抽样估计法以及假设检验法等 统计研究的方法 统计具有以下三个方面的作用 提供信息服务提供统计信息是统计的信息职能 是统计的首要职能 提供咨询服务提供咨询服务是统计的咨询职能 统计工作的任务不仅要完成提供信息的基本任务 还要进一步利用已经掌握的各种统计信息资料 为政府 企业以及个人等提供各种咨询建议和对策方案 提供监督服务提供监督服务是统计的监督职能 监督职能是指根据长期的大量的统计信息 按照标准监督客观现象发展变化状况 确定其是否正常 有无警情 统计研究的作用 本章小节 统计是对变量观测值产生的变异性的研究 统计学 statistics 是收集 描述和解释数据的科学 是科学的一种普遍性语言 统计方法包括 收集资料方法 整理资料方法 统计分析方法等 统计分析方法是统计方法的核心 统计分析方法可以分为两部分 描述性统计和推断性统计 描述性统计是通过对所收集的数据进行加工处理 计算综合性的统计指标 描述所研究现象总体数量特征和数量关系的方法 推断性统计阐明如何利用样本数据来推断被抽样总体的性质 并按规定的置信度来实现这种推断 统计过程的一个非常重要的部分是研究统计的结果和给出恰当的结论 这些结论必须正确地被表达 不能随意添加 除非还有其他的信息 第二章统计数据的收集与整理 第一节统计调查方案设计第二节统计数据收集第三节统计数据整理第四节统计数据表现形式第五节统计数据特征描述本章小节 主要内容 第一节统计调查方案设计 一 明确调查目的和任务明确调查目的和任务是设计统计调查方案最根本的问题 它决定着调查工作的内容 范围 方法和组织 二 确定调查对象和调查单位确定调查对象调查对象是指根据调查目的 任务确定的由那些性质上相同的众许多调查单位所组成的总体 即统计总体 确定调查单位调查单位就是构成调查总体的每一个单位 调查总体中的个体 也就是在调查过程中应该登记其标志的那些具体单位 第一节统计调查方案设计 三 确定调查项目 设计调查表或问卷确定调查项目调查项目是指对调查单位所要调查的具体内容属性 这些属性在统计上又称标志 它是由调查对象的性质 调查目的和任务所决定的 包括一系列品质属性和数量属性 设计调查表或问卷调查项目一般采用调查表或调查问卷的形式 将调查项目科学地分类 排列 就构成调查表或调查问卷 第一节统计调查方案设计 四 确定调查时间 调查地点和调查方式方法调查时间调查时间是指调查资料所属的时点或时期 调查时间包括三方面内容 调查资料所属的时间 调查期限和调查工作进行的时间 调查地点调查地点是指调查单位的空间位置 确定调查地点 就是规定在什么地方进行调查 调查方式方法调查方式方法是指调查工作的组织方式方法 这主要取决于调查的目的 内容和调查的对象 统计调查的方式多种多样 按其组织形式不同 可分为统计报表制度和专门组织的统计调查 专门组织的调查有普查 重点调查 典型调查和抽样调查等方式 统计调查的方法有直接观测法 实验法 报告法 采访法和网上调查法等 五 制定调查的组织实施计划调查的组织计划 是指为确保实施调查的具体工作计划 调查的组织实施计划应包括以下内容 建立调查工作的组织领导机构 做好人员的配备与分工 做好调查前的准备工作 如宣传教育 人员培训 文件资料的印发 方案的传达布置 经费的筹措等 制定调查工作的检查 监督方法 调查成果的公布及工作后的总结等 第一节统计调查方案设计 第二节统计数据收集 一 收集资科的方式取得统计数据有多种途径 但概括起来不外乎是直接方式和间接方式 一 统计资料的直接收集直接获取第一手统计资料的主要方法包括 统计调查和试验设计 统计调查的方式主要有普查抽样调查重点调查统计报表制度 普查普查是专门组织的一次性的全面调查 用来调查属于 定时点上或时期内的社会经济现象的总量 抽样调查抽样调查是一种非全面调查 它是按照随机的原则 从总体中抽取一部分单位作为样本来进行观测研究 以抽样样本的指标去推算总体指标的一种调查 重点调查重点调查的组织方式有两种 一种是专门组织的一次性调查 另一种是利用定期统计报表经常性地对一些重点单位进行调查 统计报表制度统计报表制度是根据国家有关统计法的规定 依据自上而下统一规定的表格形式 项目及其指标 报送时间与程序布置调查要求和任务 自下而上逐级汇总上报的统计报表制度 一 统计资料的直接收集 试验设计科学试验是进行科学研究的重要手段 在许多学科中几乎都起着积极的作用 统计中的试验设计是科学试验研究的组成部分之一 试验设计 包括五个相互关联的环节 分别是 方案设计方案实施数据采集数据分析优化生产 一 统计资料的直接收集 凡不是通过直接的统计调查和试验 而是从其他各种渠道搜集的第二手资料 我们把它总称为统计资料的间接收集 间接资料的来源大体包括 统计年鉴 统计摘要 统计资料汇编 统计台账 统计公告 报纸 杂志 网上资料等 一 统计资料的间接收集 二 收集资料的方法 数据资料的收集方法可以分为初级资料收集方法和次级资料收集方法或称文案资料 初级资料收集方法访问法访问法是按所拟调查事项 有计划地通过访谈询问方式向被调查者提出问题 通过他们的回答来获得有关信息资料的方法 按访问内容的传递方式不同 可分为 面谈调查 电话调查 邮寄调查 留置调查 日记调查和网上调查等方法 二 收集资料的方法 观测法观测法是指调查者通过直接观测 跟踪和记录被调查者的情况来收集资料的 种调查方法 报告法报告法是由报告单位根据原始记录和核算资料 按照统计机关颁发的统 的表格和要求 按 定的报送程序提供资料的方法 次级资料收集方法次级资料又称二手资料 是指他人为了他自己的研究目的而调查 整理的资科 统计的整个工作过程就是对数据的加工过程 从原始数据的收集开始 经过整理 显示 样本信息的获取到总体数量规律性的科学推断 都有一个减少误差 提高数据质量的问题 也就是说 统计数据的质量控制问题是贯穿于统计全过程的重要问题 因此 加强统计数据质量的管理要体现在统计研究的全过程 三 统计数据的质量问题 主要任务 资料审核 分组 汇总 制表 制图等 分组 频数分布 统计表 统计图 第三节统计数据整理 一 统计分组统计分组是根据统计研究目的 将总体按一定标志区分为不同类型或不同性质的组 使组与组之间有比较明显的差别 而在同一组内的单位具有相对的同质性 即同一组内各单位之间具有某些共同的特征 一 统计分组原则根据统计研究的目的选择分组标志选择能够反映现象总体本质特征的标志考虑现象所处的具体时间 地点 条件来分组满足完备性 互斥性及一致性 第三节统计数据整理 二 统计分组的方法按标志的特征分组总体单位的各个标志按分组标志的特征分组区分为品质标志和数量标志 按分组标志数量分组统计分组按分组标志多少不同 可分为简单分组和复合分组 第三节统计数据整理 第三节统计数据整理 简单分组简单分组是对研究对象按照一个标志进行的分组 例如某高校职工按照性别或者职称进行的分组 如表2 3 1 2 3 2所示 第三节统计数据整理 复合分组复合分组是对研究对象按两个或两个以上的标志层叠起来进行的分组 即先按一个标志进行分组 然后再按另一个标志在已分好的各个组内划分成若干个小组 例如企业职工按性别分组后 在每组内再按年龄分组 如表2 3 3所示 第三节统计数据整理 三 统计分组体系统计分组体系有两种 平行分组体系和复合分组体系 如图2 3 1 2 3 2所示 三 统计分组体系 二 分布数列 将统计总体按某一标志分组后 用来反映总体单位在各组中分配情况的数列叫分布数列 分配在各组的总体单位数叫次数或频数 各组次数与总次数的比值称为频率 一 分布数列的分类根据分组标志的不同 分布数列可以分为品质分布数列和变量分布数列两种 一 分布数列的分类 品质数列按品质标志分组所形成的分布数列称品质分布数列或属性分布数列 简称品质数列 它是由总体各组名称及各组总体单位数 次数 组成 如表2 3 4所示 一 分布数列的分类 变量数列按数量标志分组形成的分布数列 称为变量分布数列 简称变量数列 它由各组变量值及各组总体单位数 次数 组成 变量数列按照用以分组的变量的表现形式 可分为单项数列和组距数列两种 单项数列就是指以一个变量值代表一组而编制的变量数列 如表2 3 5所示 组距数列的分类组距数列可分为等距分组和异距分组 等距分组即各组组距相等的分组 异距分组即各组组距不相等的分组 在标志值变动比较均匀的条件下 可采用等距分组 当标志值变动很不均匀 如急剧的增大 下降 变动幅度大时 可采用异距分组 组数的确定组距数列中组距的大小与组数的多少成反比 组限和组中值当组距 组数确定后 只需划分各组数量界限便可编制组距数列 二 分布数列的编制 二 分布数列的编制 组限和组中值由于变量有离散型与连续型两种 因此 其组限的划分也有所不同 离散变量其变量值可以依次列举 而相邻组两个变量值之间没有中间数值 因此 分组时相邻组的组限必须间断 连续变量由于其变量值不能依次列举 而且相邻两个变量值之间可以存在无限多的中间数值 因此 相邻组的上限和下限无法用两个确定的数值分别表示 这时相邻的上 下限采用重叠的方法分组界定 在统计工作中 为保证变量的分组不发生混乱 习惯上规定各组一般均只包括本组下限变量值的单位 而不包括上限变量值的单位 这就是 上限不在内 原则 二 分布数列的编制 若按照间断式组限分组时 则需要转换成连续式组限后再计算组中值 闭口组时采用上 2 3 1 式计算 若按照间断式组限分组时 则需要转换成连续式组限后再计算组中值 闭口组时采用上 2 3 1 式计算 开口组时需要采用 2 3 2 式 2 3 3 式以下近似算 第一组为 以下 缺少下限 则 组中值 组上限 下一组组距 2 2 3 2 最末组为 以上 缺少上限 则组中值 组下限 上一组组距 2 2 3 3 二 分布数列的编制 间断式组中值的计算事例如表2 3 6所示 第四节统计数据表现形式 一 统计表 一 统计表的结构 从形式上看 统计表的结构是由表题 横行标题 纵栏标题和指标数值等要素构成 统计表结构的一般形式如图2 4 1所示 一 统计表的结构 例 2001年我国工业增加值的一个统计表示如表2 4 1所示 按照统计表的主词是否分组和分组的程度 分为简单表 分组表和复合表三种 简单表简单表是统计表的主词未经任何分组的统计表 分组表分组表指统计表的主词按某一标志进行分组 复合表复合表指统计表的主词按两个或两个以上标志进行复合分组 二 统计表的种类 二 统计图 条形图 Barchart 条形图常用于描述离散型数据的情况 是我们经常见到的一种图形 它是用宽度相等而高度为频数 率 来表示各类数据的大小 例2 4 1某高校2005年各院教师在国内核心杂志上发表论文情况 如表2 4 2所示 条形图 Barchart 解 由表2 4 2中的数据应用Excel软件中的 插入 功能中的 图表 功能绘成的条形图如图2 4 2所示 直方图 Histogram 直方图表征数据的频数分布特征 它与条形图在形式上有类似之处 都是用条形来表示数据特征 但直方图中的条形之间是没有间隔的 例2 4 2某连锁企业2005年度各分公司完成销售计划如表2 4 3所示 试绘制直方图 直方图 Histogram 解 应用Spss软件中的 Gragh 功能绘制的直方图 如图2 4 3所示 饼分图 Piechart 饼分图经常用来表示各成分在总体中所占的百分比 例2 4 3某课题组为了科学评价某高校学科建设项目的绩效 对构建的学科建设绩效评估指标权重进行了问卷调查 累计发放问卷调查表243份 回收有效问卷223份 其中 教授占65 研究员占1 副教授占12 副研究员占1 讲师占20 助教占1 则样本职称分布如图2 4 4所示 洛伦茨曲线是20世纪初美国经济学家 统计学家洛伦兹 M E Lorentz 绘制成的描述收入和财富分配性质的曲线 洛伦兹曲线如图2 4 5所示 洛伦茨曲线 洛伦茨曲线 为了更准确地反映收入分配的变化程度 20世纪初意大利经济学家基尼 Gini 根据洛伦茨曲线 提出了计算收入分配公平程度的统计指标 称为基尼系数 其公式为 联合国有关组织规定 G小于0 2表示收入绝对平均 在0 2 0 3之间表示比较平均 在0 3 0 4之间表示相对合理 在0 4 0 5之间表示收入差距较大 大于0 6表示收入差距悬殊 基尼系数0 4为国际警戒线 超过了0 4则应采取措施缩小收入差距 箱形图也称箱线图 是由一组数据的最大值 最小值 中位数和两个四分位数5个特征值绘制的一个箱子和两条线段的图形 如图2 4 6所示 箱形图 Boxplot 箱形图 Boxplot 不同箱形形状可反映出不同的分布特征 如图2 4 7所示 箱形图 Boxplot 例2 4 42005年度某高校经济管理学科共有10篇博士学位论文需要评审 分别请该领域8位专家进行审稿 论文得分数据如表2 4 4所示 解 应用Spss软件中的 Gragh 功能绘制的各博士学位论文得分情况的箱形图 如图2 4 8所示 箱形图 Boxplot 图2 4 810篇博士学位论文得分的箱形图 第五节统计数据特征描述 一 总量指标总量指标是反映社会经济现象在一定时间 地点 条件下的总规模或总水平的统计指标 总量指标也称为绝对指标或绝对数 一 社会总产品社会总产品也称总产出 它是指一个国家或地区在一定时期 如一年 内全部生产活动的总成果 当以货币表现时 即为全部生产活动成果的价值总量 二 增加值增加值是企业或部门在一定时期 如一年 内从事生产经营活动所增加的价值 它是总产出减去中间投入后的余额 因此 从价值构成看 它包括全部新创造的价值和物质消耗中本期固定资产折旧 一 总量指标 三 国内生产总值 GDP 国内生产总值是按市场价格计算的国内生产总值的简称 它是一个同家 或地区 所有常住单位在一定时期内生产活动的最终成果 国内生产总值有三种表现形态 即价值形态 收入形态和产品形态 在实际核算中 国内生产总值的三种表现形态表现为三种计算方法 即生产法 收入法和支出法 生产法国内生产总值 各部门增加值之和 2 5 1 增加值 总产出一中间投入 2 5 2 收入法增加值 固定资产折旧 劳动者报酬 生产税净额 营业盈余 2 5 3 支出法国内生产总值 最终消费十资本形成总额十净出口 2 5 4 国民总收入 国内生产总值十国外要素收人净额 2 5 5 国外要素收入净额 来自国外的劳动者报酬和财产收入 国外从本国获得的劳动者报酬和财产收入 2 5 6 一 总量指标 例2 5 1如表2 5 1所示的 国内生产总值及其使用表 是国民经济核算体系中再生产核算表的重要组成部分 是 张平衡表 该表从生产 分配 使用三个不同角度充分揭示了国内生产总值是衡量社会生产与使用的核心指标 它将国内生产总值的三种计算方法集中体现在一张表中 既可以从不同角度对国内生产总值指标进行观测分析 又保证了指标概念的完整性 逻辑关系的清晰性和技术方法的统一性 二 相对指标 相对指标又称相对数 它是两个有联系的指标数值对比的结果 用来对比的两个数 既可以是绝对数 也可以是平均数和相对数 一 计划完成相对指标 1 根据总量指标计算计划完成相对指标例2 5 2设某工厂某年计划工业增加值为600万元 实际完成660万元 求增加值计划完成相对数 二 相对指标 2 根据平均指标计算计划完成相对指标根据平均指标计算计划完成相对数的计算公式为 二 相对指标 例2 5 3某企业生产某产品 本年度计划单位成本降低9 实际降低12 求成本降低率计划完成相对数 例2 5 4某企业某月生产某产品 计划每人每日平均产量为36件 实际每人每日平均产量为39件 求劳动生产率计划完成相对数 二 结构相对指标 总体是在同一性质基础上由各种有差异的部分所组成的 结构相对指标就是利用分组法 将总体区分为不同性质 即差异 的各部分 以部分数值与总体数值对比而得出比重或比率 来反映总体内部组成状况的综合指标 其计算公式为 例2 5 5某公司男职工为员工总数的60 女职工为员工总数的40 它反映了该公司在男女性别上的构成情况 三 比较相对指标 比较相对致也称类比相对数 是将两个同类指标做静态对比得出的综合指标 表明同类现象在不同条件 如在各国 各地 各单位 下的数量对比关系 其计算公式为 例2 5 6某年有甲 乙两企业同时生产一种性能相同的产品 甲企业工人劳动生产率为21776元 乙企业为30994元 求两企业劳动生产率比较相对数 解 两企业劳动生产率比较相对指标 四 比例相对指标 比例相对指标是将总体内某一部分数值与另一部分数值对比所得到的相对数 常用系数或倍数表示 计算公式为 例2 5 7我国2003年国内生产总值为116898 4亿元 其中第 产业为17092 1亿元 第二产业为61131 3亿元 第三产业为38675 0亿元 则第 产业生产总值 第二产业生产总值 第三产业生产总值 1 3 6 2 3 五 强度相对指标 强度相对指标是两个性质不同 但有一定联系的总量指标对比的结果 用来表明现象的强度 密度和普通程度的综合指标 强度相对指标的计算 五 强度相对指标 例2 5 8某地区占地10 2万平方公里 据统计2005年初和2005年底的人口分别为4216万人和4372万人 2005年国民收入总额为9768亿元 求2005年的人口密度 平均人口数 人均国民收入 五 强度相对指标 强度相对指标的正逆指标 强度相对数是两个有联系的不同事物的总量指标数值的对比 因此 分子和分母可以互换 这就产生了有些强度相对数有正指标和逆指标两种 例2 5 9某城市人口620万人 有大学66所 求大学密度正指标与大学密度负指标 动态相对指标是同类指标在不同时期上的对比 其计算公式为 五 动态相对指标 式 2 5 16 中 作为对比标准的时期叫做基期 而同基期比较的时期叫做报告期 有时也称为计算期 动态相对数的计算结果用百分数或倍数表示 三 平均指标 一 算术平均数 简单算术平均数 一 算术平均数 加权算术平均数 加权算术平均数的简略形式为 一 算术平均数 例2 5 12表2 5 2为某企业职工月平均工资的分组数据 试计算职工的月平均工资 二 调和平均数 调和平均数也称 倒数平均数 它是对变量的倒数求平均 然后再取倒数而得到的平均数 三 几何平均数 简单几何平均数 例2 5 14某高校自2001 2005年学生人数如表2 5 3所示 求该校平均发展速度 解 三 几何平均数 加权几何平均数 三 几何平均数 例2 5 15某银行在过去15年中的年利率资料如表2 5 4所示 求15年的平均年利率 解 用几何平均法求15年平均利率 四 中位数 中位数是将总体中各单位标志值按大小顺序排列 居于中间位置的那个标志值就是中位数 用表示 未分组资料中位数的确定 例2 5 167名工人的日产量依次从小到大排列为16件 18件 22件 23件 26件 29件 31件 8名工人的日产量依次从小到大排列为16件 18件 22件 24件 26件 29件 31件 33件 分别求其中位数 解 7名工人的日产量的中位数位次 用 为 四 中位数 8名工人的日产量的中位数位次为 分组资料中位数的确定下限公式 向上累计时 为 四 中位数 上限公式 向下累计时 四 中位数 例2 5 17某车间共有工人130名 生产某种产品按日产量分组资料如表2 5 5所示 试确定该车间工人日产量的中位数 例2 5 18某高校某学院学生体重的数据资料如表2 5 6所示 计算该学院学生体重的中位数 四 中位数 按下限公式计算 按上限公式计算 例2 5 18计算 五 众数 众数是指总体中出现次数最多的标志值 它能够直观地说明客观现象分配中的集中趋势 按单项数列确定众数只须观测标志值出现的次数 把次数最多的组定为众数组 该组的标志值即为众数 按组距数列确定众数的方法 下限公式 上限公式 五 众数 六 各种平均数的适用范围及其相互关系 不同平均指标的适用范围算术平均数易受极端变量值影响 使的代表性变小 当组距数列为开口组时 由于组中值不易确定 使的代表性变得不可靠 几何平均数适用于各个变量值的连乘积等于其发展总速度时 求算其平均数 求等比数列的平均数 众数适用于总体的单位数较多 各标志值的次数分配又有明显的集中趋势的的情况 中位数属于位置平均数 它与众数一样 都是从数据位置的角度来反映数据的代表水平 中位数不受极端值的影响 各个变量值相对其中位数的绝对离差之和为最小 六 各种平均数的适用范围及其相互关系 算术平均数 中位数和众数三者的关系 四 变异指标 标志变异指标是评价平均数代表性的依据 标志变异指标愈大 平均数代表性愈小 标志变异指标愈小 则平均数代表性愈大 极差 range 极差也称全距 是指总体分布中最大标志值与最小标志值之差 用以说明标志值变动范围的大小 通常用来表示 其计算公式为 极差 range 例2 5 20某商场连续11天销售某品牌手机的数量分别为 22 36 43 12 31 52 42 20 35 26 33 求极差 解 将销售数量由大到小排序为 12 20 22 26 31 33 35 36 42 43 52 则极差为 标准差 standarddeviation 和方差 variance 由未分组数据资料计算标准差是总体各单位标志值与平均数离差平方平均数的平方根 标准差的平方即为方差 设从某个总体中抽取的数据为 则称 为样本标准差 为样本方差 标准差 standarddeviation 和方差 variance 若某总体的全部元素就是 则称 为该总体的标准差 为该总体的方差 标准差 standarddeviation 和方差 variance 由分组资料计算 例2 5 22以例2 5 18中学生体重的样本资料 计算学生体重的方差与平均差 例2 5 23某高校经济管理学院中的0401和0402两个班各有9名学生选修了管理预测与决策方法课程 考试成绩如表2 5 7所示 试计算各班管理预测与决策方法成绩的平均值和标准差 解 根据表2 5 7的数据资料计算得 变异系数 coefficientofvariation 离散系数是消除平均数影响后的标志变异指标 用来对两组数据的差异程度进行相对比较 其形式为相对数 因此 也称为标志变异相对数指标 常见的离散系数是标准差系数 变异系数 coefficientofvariation 例2 5 24某电器公司中的两个车间生产不同的产品 其中一车间生产手机 二车间生产MP3 某月两个车间产量的平均数和标准差资料如表2 5 8所示 试分析两者标志的变异程度 解 五 偏度与峰度 偏度 Skewness 偏度是用于衡量分布的不对称程度或偏斜程度的指标 峰度 Kurtosis 五 偏度与峰度举例 例2 5 26根据例2 5 18中学生体重的样本资料 计算学生体重的峰度 本章小节 统计资料的收集与整理是对数据的直接处理与分析 目的是计算数据的特征值 发现其数量规律性 进而用样本数据的特征值推断未知总体的参数 统计调查方案的设计与统计资料的收集主要介绍如何用数据对客观事物进行计量 如何获得数据 以及对数据质量的评价 统计整理是根据统计研究的目的 将调查所得到的资料进行科学地分组 汇总 表现并对总体的数量特征加以描述 为统计分析准备系统的 条理化的综合资料的工作过程 统计资料整理的结果可以用不同的形式表现 其中统计表和统计图是表现统计资料的常用形式 最重要的数字描述性指标有两类 一类测量数据集的集中趋势 平均值 中位数和众数 另一类测量数据的变异性 极差和标准差 第三章抽样分布 第一节随机样本第二节抽样分布本章小节 主要内容 第一节随机样本 对一个总体而言 个体的取值是按一定的规律分布的 一个总体就是一个具有确定概率分布的随机变量 一般来说 总体的分布是未知的 或分布形式中含有未知参数 在统计学中 人们总是通过从总体中抽取一部分个体 根据获得的样本数据对总体分布进行推断 而被抽出的部分个体叫做总体的一个样本 从总体中抽取有限个个体对总体进行观察的过程叫做抽样 在相同的条件下我们对总体进行次重复的 独立的观察 将次观察结果按试验的次序记为 由于是对随机变量观察的结果 且每次观察是在相同的条件下独立进行的 故可以认为它们相互独立 且都是与总体具有相同分布的随机变量 这样得到的随机变量称为来自总体的一个简单随机样本 称为这个样本的容量 当次观察结束后 我们就得到一组实数 它们依此是随机变量的观察值 称为样本值 第二节抽样分布 一 统计量定义不含有任何未知参数的样本的函数 称为统计量 显然 统计量为随机变量 几个常用统计量样本矩 样本均值 样本方差 原点矩 中心矩等 二 几个常用的抽样分布 抽样分布的定义统计量的分布称为抽样分布 来自正态总体的几个常用统计量的分布 已有一些重要的结果 人们已经获得这些统计量的具体的分布密度函数 下面介绍来自正态总体的几个常用统计量的分布 第二节抽样分布 一 分布 设是来自总体的样本 则称统计量为服从自由度为的分布 记为的一个重要性质 可加性 二 分布 设 且设与独立 则称统计量为服从自由度为的分布 记为 可以证明 当充分大时 分布趋向于标准正态分布 二 几个常用的抽样分布 三 分布 设 且设独立 则称随机变量为服从自由度为的分布 记为 分布的上分位点满足下列关系 四 基于正态总体样本的均值与方差的分布 设来自正态总体的样本 分别为样本的均值和方差 则 设为来自正态总体的样本 为来自正态总体的样本 分别为两个样本的均值和方差 则当时 则 三 样本比例的抽样分布 一 重复抽样下样本比例的抽样分布可以证明 二 不重复抽样下样本比例的抽样分布可以证明 本章小结 统计量是统计推断的基本变量 统计量是不含有任何未知参数的样本的函数 统计量的分布称为抽样分布 对于正态总体 我们给出了几个常用的统计量的分布 对于实际应用中的比率问题 给出了大样本下的抽样分布 第四章统计推断 第一节参数估计第二节假设检验第三节假设检验中的两个问题本章小节 主要内容 第一节参数估计 一 点估计设总体的分布函数的形式已知 但它含有一个或多个未知参数 借助于总体的一个样本来估计总体未知参数的值的问题称为参数的点估计问题 常用的构造估计量的方法 矩估计法和最大似然估计法 一 矩估计法 英国统计学家K Pearson提出的矩估计法 其主要思想是 以样本矩作为相应的总体矩的估计 以样本矩的函数作为相应的总体矩的函数的估计 这里 表示总体的矩 它是总体分布参数的函数 而是样本的函数 由上述个方程组成的方程组 可以解出总体分布中的个未知参数 例1设总体的均值及方差 不为零 都存在 且均未知 又设是来自总体的一个样本 试求的矩估计量 解由 得再以代替 即得的矩估计量分别为 二 最大似然估计法 由R A Fisher引进的最大似然估计法 无论从理论上还是从应用上 至今仍然是一种重要且普遍适用的方法 估计过程 由所谓的似然函数 它是参数和样本的函数 若则称为参数的最大似然估计值 为的似然估计量 一般情况下 可由方程求得 例2设 为未知参数 是来自此总体的一个样本的观测值 试求这两个未知参数的最大似然估计量 解容易得到样本的对数似然函数求此二元函数的最大值 得到两参数的最大似然估计值分别为即两参数的最大似然估计量分别为 二 估计量的评选标准 一 无偏性设为参数的点估计量 若则称为参数的无偏估计量 二 有效性 设和是的无偏估计量 若对于的变化范围内的任意一个值 都有且至少有一个使得不等号成立 则称较有效 三 相合性 无偏性与有效性都是基于样本容量n固定的前提下提出的 我们希望随着样本容量的增大 一个估计量的值趋向于待估参数的真值 设为参数的一个估计量 若对于其变化范围内的任意一个 当时 依概率收敛于 则称为的相合估计量 三 区间估计 定义设总体的分布函数中含有未知参数对于给定的 有两个样本统计量 使得则称随机区间是的置信度为的置信区间 分别称为置信度为的双侧置信区间的置信下限和置信上限 确定未知参数置信区间的一般步骤 1 构造一个样本的函数 它包含待估未知参数 而不含其它未知参数 并且 的分布已知且不依赖于任何未知参数 2 对于给定的置信度 定出两个常数a b 使得 3 若能由上式得到等价的不等式 其中 都是统计量 那么就是的一个置信度为的置信区间 正态总体参数的置信区间 1 单个正态总体的情况 1 的置信区间 已知时 未知时 2 方差的置信区间 仅以未知为例 例3现从某天生产的洗衣粉中随机地取16袋 称得重量 以克计 如下表所示 设洗衣粉的重量近似地服从正态分布 试求总体均值的置信度为0 95的置信区间 解这里 总体的方差未知 故总体均值的置信区间为 而 经过计算得 又查表得 故所求的置信区间为 500 4 507 1 2 两个正态总体的情况 实际中存在这样的问题 已知产品的某一指标服从正态分布 但由于原料 设备条件 操作人员不同 或工艺过程的改变等因素的影响 而引起总体均值 方差的改变 我们要考察这些变化的大小 这就涉及两个正态总体均值差或方差比的估计问题 设有两个正态总体 样本均值和方差分别为 1 两个总体均值差的置信区间 均已知 的置信区间未知但相等 的置信区间 例4为提高某一化学生产过程的得率 拟采用一种新的催化剂 为此 先进行试验 设采用原来的催化剂进行了次试验 得到得率的平均值和样本方差分别为 又采用新的催化剂进行了次试验 得到得率的均值和样本方差分别为 假设两总体都服从正态分布 方差相等 两样本独立 试求两总体均值差的置信度为0 95的置信区间 解由题意 可得 则的置信度为0 95的置信区间为即 4 15 0 11 2 两个总体方差比的置信区间 这里仅讨论未知的情形对于给定的置信度 的置信区间为 四 大样本下总体均值 比率的区间估计 一 总体均值的区间估计这里的大样本 是指样本的容量不小于301 总体方差已知时总体均值的置信区间2 总体方差未知时总体均值的置信区间 例5某保险公司有36个投保人的年龄资料如表表所示所示 试求投保人平均年龄的置信度为95 的置信区间 解这里总体的方差未知 但为大样本情形 查标准正态分布表得 再由上表数据 得 由此 可以得到投保人平均年龄的置信度为95 的置信区间为 即 39 96 42 04 二 总体比率的区间估计 由样本比率的抽样分布可以知 当样本容量足够大时 一般指不小于30 且都大于5 样本比率的抽样分布近似正态分布 设总体比率为 则有对于置信度 P的置信区间为 例6某公司要估计某天生产的某型号的全部产品的合格率 为此随机抽取了100件产品 经检验其中有94件为合格品 对于置信度95 试求该天此型号产品合格率的区间估计 解由题意 易得样本合格率 从而得全部产品合格率置信度为95 的置信区间为即 89 35 98 65 三 两个总体均值差的区间估计 对于给定的置信度 的置信区间这里 为来自与两个总体的样本均值 为样本的方差 例7为了评估甲乙两种方法包装某产品所需要的时间 在不同的方法下独立地抽取两个随机样本 经整理计算得到下列资料 试在置信度95 下 给出这两种方法下包装某产品平均时间之差的置信区间 解由公式得到这两种方法下包装某产品平均时间之差的置信度为95 的置信区间为 3 86 10 14 第二节假设检验 一 参数假设检验在总体的分布函数已知 但参数未知时 如对总体分布中的未知参数提出假设 则如何利用样本提供的信息来检验这个假设 即接受此假设还是拒绝此假设 这类统计问题我们称之为参数的假设检验问题 参数估计和参数检验是利用样本对总体的统计特性提供的信息 建立样本的函数 即估计量或检验统计量 是从不同角度处理总体未知参数的两种统计方法 一 假设检验的基本思想 设总体为 建立假设这里表示原假设 表示备择假设 假设检验问题 就是要建立一个合理的法则 根据这一法则 利用已知样本作出接受原假设 即拒绝备择假设 还是拒绝原假设 即接受备择假设 的决策 二 判断 假设 的依据 实际推断原理 概率很小的事件在一次试验中几乎是不会发生的 如果原假设为真 则由一次抽样计算而得的样本观测值 满足不等式此事件几乎是不会发生的 现在在一次观测中竟然出现了满足上述不等式的样本均值 则我们有理由怀疑原来的假设的正确性 因而拒绝原假设 若出现的观测值不满足上述不等式 此时没有足够的理由拒绝 因此只能接受原假设 三 两类错误 在使用任何一个检验法 相当于确定一个拒绝域 时 由于抽样的随机性 作出的判断总可能会犯两类错误 一是假设实际上为真时 我们却作出拒绝的错误决策 称这类 弃真 的错误为第一类错误 二是当实际上不真时 我们却接受了 称这类 取伪 的错误为第二类错误 我们这里讨论的检验问题中的显著性水平控制了犯第一类错误的概率 这种只对犯第一类错误的概率加以控制 而不考虑犯第二类错误的检验问题 称为显著性检验问题 参数假设检验问题的步骤 第一步 根据实际问题的要求 提出原假设和备择假设 第二步 给定显著性水平以及样本容量 第三步 确定检验统计量及其分布 并由原假设的内容确定拒绝域的形式 第四步 由 拒绝 为真 求出拒绝域 第五步 根据样本观测值计算检验统计量的具体值 第六步 作出拒绝还是接受原假设的统计判断 四 单个总体参数的假设检验 1 单个正态总体下参数的假设检验 1 单个正态总体均值的检验 已知 关于的检验 Z检验 检验统计量 可以根据假设检验的不同类型 确定检验问题的拒绝域 例8某厂生产某种型号的内胎 从长期的生产经验知道其扯断强力服从均值 1380 N 标准差 50 N 的正态分布 该厂为提高产品的质量 改变了原来的配方进行现场生产试验 设新配方生产的内胎其扯断强力仍服从正态分布 由于在试验中除配方外 其他条件都保持不变 因此可以认为新配方未改变此型号内胎扯断强力的方差 采用新配方的5次试验 测得内胎扯断强力为 单位 N 1450 1460 1360 1430 1420 试问采用新配方 是否能提高内胎的扯断强力 解对这个假设检验问题 需要检验假设形如这样的假设检验 称为右边检验 类似也有左边检验 此检验问题的拒绝域的形式为查表得 而经计算得 从而有 即 据此 拒绝原假设 未知 关于的检验 t检验 检验统计量 可以根据假设检验的不同类型 确定此检验问题的拒绝域 例8某种元件 按照标准其使用寿命不低于1000 小时 现从生产出的一批元件中随机抽取25件 测得其平均寿命为950 小时 样本标准差为100 小时 假设该种元件寿命服从正态分布 对于置信度95 试问这批元件是否可以认为合格 解此问题即要检验拒绝域的形式为而由已知可得 又 即 故接受原假设 2 单个正态总体的方差检验 设未知 建立假设 检验统计量 拒绝域 或 2 非正态总体参数的假设检验 这里讨论的是在大样本 样本容量 情形下总体均值和总体比率的假设检验 总体均值和总体比率的假设检验这里利用中心极限定理 在样本容量充分大时 样本均值近似服从正态分布 从而可以构造相应的检验统计量和确定出检验问题的拒绝域 对于总体比率的检验 在样本容量充分大时 样本比率近似服从正态分布 也可以类似构造检验统计量及确定出拒绝域 五 两个正态总体下参数的假设检验 1 有关平均值的假设检验设分别表示来自两个具有相同方差的正态总体的样本均值 则对于两个总体均值的假设检验问题 可以通过构造检验统计量来确定拒绝域的形式 2 方差的假设检验 设分别表示来自两个具有不同方差的正态总体的样本方差 则对于两个总体方差的假设检验问题 可以通过构造检验统计量 在原假设为真的情形下 根据备择假设的不同类型可以确定出检验问题的拒绝域 二 非参数假设检验 前一节所讨论的假设检验问题 只是对服从正态分布的总体中的某些未知参数进行假设检验 但在实际问题中 总体的分布函数的形式往往未知 或者知道的很少 甚至只知道是离散型或连续型 本节讨论总体分布函数的拟合问题 即研究检验总体分布函数的非参数假设检验问题 一 符号检验法 这里只介绍检验两个总体分布函数是否相同的符号检验法设有两个总体 要检验假设设有来自两个总体的样本将它们所对应的样本观察值进行比较 可以得到对应值差的符号 以记正 负号的个数 则它们为随机变量 构造检验统计量就可以确定出检验问题的拒绝域 例9甲 乙两分析人员分析同一物体中的某成分含量 测得数据如下表 单位 问两人的分析结果有无显著差异 对于显著性水平0 1 解 由上表 可以得到数据间比较的符号 若对比的数据相等 符号以0表示 结果见上表 再根据数据计算得 12 7 所以 19 且 7 由显著性水平 0 10及 19 由附表查得 因 7 5 于是接受原假设 即认为两人的分析结果无显著差异 由上面的分析可以看到 符号检验法简单 直观 且无须知道被检验量的分布形式 但其精度较差 而且要求数据成对出现 二 秩和检验法 设从总体中分别抽取容量为的独立样本 要检验假设为讨论
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汽车使用与维护 课件 项目四 汽车安全带及座椅的使用与维护
- 汽车使用与维护 课件 项目一 制动系统的使用与维护1-1 行车制动操纵机构检查与维护
- 人教版五年级上册语文反义词 多音字总结
- 2025年电动直通控制阀项目可行性研究报告
- 2025年玻璃果盆项目可行性研究报告
- 2025年特种纤维织带项目可行性研究报告
- 湖北省鄂州地区市级名校2025届初三(语文试题文)一模试题含解析
- 吉林省四平市铁西区2025年初三下学期5月调研考试物理试题含解析
- 中国劳动关系学院《智能产品原型制作》2023-2024学年第二学期期末试卷
- 低压电器 课件 单元二 项目一 任务一 低压熔断器的使用
- 国家级职业资格考试题库管理办法
- 2024-2030年中国审计服务行业竞争格局及投资模式分析报告
- 拍卖师资格考试题库及答案(答案附后面)
- 城市轨道交通安全生产
- Spectrum-2010(根据规范生成设计反应谱)
- 2024年长期照护师职业技能竞赛理论考试题库(含答案)
- 清创缝合术操作
- 2024年代理要账居间协议合同范本
- 2024年江苏省南通市中考地理试题(含答案)
- 2024年度中药的性能《四气五味》课件
- 篮球课件英文教学课件
评论
0/150
提交评论