应用统计学总复习_第1页
应用统计学总复习_第2页
应用统计学总复习_第3页
应用统计学总复习_第4页
应用统计学总复习_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、应用统计学应用统计学总复习总复习 2012年12月 第一章第一章 绪论绪论 第二章第二章 数据搜集数据搜集 第三章第三章 数据的图表显示数据的图表显示 第四章第四章 数据的概括性度量数据的概括性度量 第五章第五章 概率与概率分布概率与概率分布 第六章第六章 抽样与抽样分布抽样与抽样分布 第七章第七章 抽样调查和参数估计抽样调查和参数估计 第八章第八章 假设检验假设检验 第九章第九章 相关与回归相关与回归 第十章第十章 时间数列分析与预测时间数列分析与预测 第十一章第十一章 指数指数 第一章第一章 绪论绪论 统计与统计学的概念 统计数据统计数据的类型 统计学的一些基本概念 统计的三种含义 1.统

2、计工作:是指搜集、整理、分析和显示统 计数据的活动。 2.统计资料:是指统计活动的结果,即统计数 据。 3.统计学:是一门关于搜集、整理、分析、解 释统计数据的方法论科学和艺术。 统计的研究对象:客观现象的数量表现、 数量关系和数量变化 统计学的研究对象:统计工作的规律性 统计与统计学的概念 统计数据的类型统计数据的类型 数据的类型 按计量尺度分 l 分类数据、顺序数据、数值型数据 l按数据的收集方法分 l 观测数据和实验数据 按被描述的现象与时间的关系 l 截面数据和时间序列数据 统计学的一些基本概念统计学的一些基本概念 1、统计总体、总体单位、样本、样本容量 二者的关系:没有总体单位,总体

3、就不存在;没有总 体,也就无法确定总体单位。 2、标志与指标、变量、变量值 标志;描述总体单位特征的名称 统计指标:描述总体数量特征的名称 l 数量指标:是指反映事物的规模或总量的指标。 l 质量指标:是指反映事物的性质、质量和管理水平的指标。 l两者的关系:指标数值由数量标志汇总而来,两者随总体单位 的相互转化而转化。但两者说明的对象不同,表现形式也不同。 变量:说明现象某种特征的名称, 变量值:变量的取值,称变量值。 统计学的一些基本概念(续)统计学的一些基本概念(续) 3、参数和统计量 参数:研究者想要了解的总体的某种特征值 统计量:由样本数据构成的不依赖于任何未知 参数的函数 4、指标

4、体系:以共同的研究目的为纽带而 相互联系的一系列统计指标,叫指标体系。 重点、难点重点、难点 在具体的调查中,能辨别总体、总体单位、 样本、样本容量、参数、统计量 例:一项调查表明,消费者每个月在网上购物 的平均花费是200元,这一研究的总体、样本、 样本容量、参数、统计量分别是什么? 重点、难点重点、难点 辨别变量(数据)的类型 员工对某项改革措施的态度(赞成、中立、反对) 汽车产量 消费者在网上购物的原因 数据、变量、变量值的区别 参数与统计量的区别与联系 离散型变量与连续型变量的概念 分类数据、顺序数据、数值型数据的含义 本章主要术语本章主要术语 统计学:收集、整理、分析、解释数据的科学

5、 *描述统计:研究数据的收集、处理、汇总、图表描述、概括和分析的 统计方法 *推断统计:研究如何利用样本数据来推断总体特征的统计方法。 *总体:包含所研究的全部个体的集合。 有限总体:是指总体的范围能够明确确定,而且元素的数目是有限可 数的。 无限总体:是总体所包括的元素是无限的,不可数的。 *样本:从总体中抽取的一部分元素的集合。 *参数:用来描述总体特征的概括性数字度量。 *统计量:由样本数据构成的不依赖于任何未知参数的函数。 *变量:说明现象某种特征的名称。 标志:说明总体单位特征的名称 指标:说明总体数量特征的名称。 *分类变量:说明事物类别的一个名称 *顺序变量:说明事物有序类别的名

6、称 *数值型变量:说明事物数字特征的一个名称 第二章数据的搜集第二章数据的搜集 数据的来源 统计调查的种类 统计调查的方式、方法 统计调查方案的设计 调查误差 (一)统计调查的概念与种类(一)统计调查的概念与种类 数据的来源: 直接来源(原始数据) 间接来源(二手数据) 统计调查:根据统计研究的目的,有计划、有组 织地搜集统计资料的过程。 统计调查的要求:准确性、及时性 调查的种类 1、统计调查根据被研究总体的范围,分为全面调查和 抽样调查。 2、统计调查按调查登记的时间是否连续,分为连续调 查和不连续调查。 3、按调查组织形式,分为专门调查和统计报表 *抽样调查抽样调查 1概率抽样:是指遵循

7、随机原则进行的抽样,总体中每个 单位都有一定的机会被选入样本。 (2)非概率抽样:是指抽取样本时不依据随机原则,而是根 据研究目的对数据的要求,采用某种方式从总体中抽出部 分单位对其实施调查。 (3)概率抽样与非概率抽样的比较 非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不 确定的,无法使用样本结果对总体相应的参数进行推断。非概率 抽样主要合适于探索性的研究,调查结果用于发现问题,为更深 入的数量分析提供准备。非概率抽样操作简便,成本低。 概率抽样是依据随机原则抽选样本,样本统计量的理论分布是存 在的,可以根据调查的结果对总体的有关参数进行估计。概率抽 样的目的在于掌握研究对象总体的

8、数量特征,得到总体参数的置 信区间。概率抽样要求的技术含量较高,调查的成本一般来说比 非概率要高。 概率抽样的基本形式概率抽样的基本形式 简单随机抽样。 类型抽样(分层抽样) 等距抽样。 整群抽样。 多阶段抽样 非概率抽样调查非概率抽样调查 判断抽样。 重点调查:是专门组织的一种非全面调查,它是对所要调查的全 部单位中选择一部分重点单位进行调查。(所谓重点单位,是着 眼于现象量的方面而言,尽管这些单位在全部单位中只是一部分, 但是它们的某一主要标志的标志总量在总体标志总量中却占有绝 大比重。) 典型调查。典型调查是在对现象总体进行初步分析的基础上,有 意识的选择具有代表性的单位进行调查,借以认

9、识事物发展变化 规律的一种非全面调查方法。 随意抽样(方便抽样) 配额抽样。 配额抽样就是先将总体进行较详细的若干种分类,然后将既定的 样本容量分配给各个类别,在每一类中由调查员任意抽取规定个 数的被调查单位进行调查,以取得样本数据的一种非随机抽样调 查方法。 滚雪球抽样 自愿样本 数据的收集方法数据的收集方法 数据的收集方法数据的收集方法 询问调查询问调查实验法实验法 面面 访访 式式 观察法观察法 统计调查方案统计调查方案 1、调查目的:即统计研究所要解决的问题。 2、调查对象:是应搜集其资料的许多单位的总体。确定调 查对象的同时,还必须确定调查单位和报告单位。 3、调查项目:调查项目又称

10、调查纲要,它是依附于调查单 位的基本标志,由调查的目的任务和调查对象的性质特点 所决定。 4、调查方式方法。 5、调查时间和时限:调查时间是调查资料所属的时间,即 所谓客观时间,它又分为时期时间和时点时间。调查时限 是进行调查工作的期限,包括搜集资料和报送资料的整个 工作所需要的时间,即所谓主观时间。 6、调查的组织工作:包括明确调查机构、调查地点、选择 调查的组织形式等。 调查误差调查误差 调查误差:调查所得数据和研究对象的真 实结果之间的差异 调查误差的分类: 抽样误差(代表性误差):由于抽样的随机性 所带来的误差 非抽样误差(工作误差):除抽样误差之外的, 由于其他原因造成的样本观察结果

11、与总体真值 之间的差异。包括抽样框误差、回答误差、无 回答误差、调查员误差、测量误差 本章重点本章重点 二手资料的含义和使用注意事项 概率抽样与非概率抽样的含义,区别与联系 理解概率抽样的五类具体抽样方式的含义 概率抽样的特点 理解非概率抽样的五类具体抽样方式的含义及适 用场合理解抽样误差与非抽样误差的含义。二者 区别:抽样误差只是针对概率抽样而言的。而无 论是概率抽样还是非概率抽样,或者全面调查, 都存在非抽样误差。 第三章第三章 数据的图表展示(统计整理)数据的图表展示(统计整理) 统计整理的定义和步骤 数据预处理的内容 统计分组 汇总 显示 统计整理的定义和步骤统计整理的定义和步骤 统计

12、整理:统计整理是根据统计研究的目 的要求,对调查所取得的各项资料进行科 学的分组和汇总的工作过程。 统计整理的四个步骤: 1)对调查资料进行预处理; 2)根据研究的目的和分析的需要,选择分 组标志,进行具体分组; 3)对各项资料进行汇总,计算各种指标; 4)编制统计表与图,表述整理的结果。 数据的预处理数据的预处理 数据审核:是指检查数据中是否存在错误。 对原始数据主要从完整性和准确性两个方面去审核。 对二手数据主要是审核数据的适用性和时效性。 数据筛选:是指根据需要找出符合特定条件的某 类数据。 数据排序:是指按一定顺序将数据排列,以便研 究者通过浏览数据发现一些明显的特征或趋势, 找到解决

13、问题的线索。 统计分组统计分组 统计分组:是指根据统计研究的目的和要求,将总体单位 或全部数据按照一定的标志划分成若干类型组别。 分类:按分组标志的类别:品质分组和数量分组。数量标 志分组的方法主要有两种:一是单变量值分组,二是组距 分组(按组距是否相等,可分为等距分组和异距分组) 按分组标志的多少:简单分组、复合分组、并列分组 统计分组的原则:一定要遵循“不重不漏”的原则。 步骤(组距分组): 1、选择分组标志(关键) 2、确定组数 3、确定组距 4、确定组限。 5、列出各分组。 汇总汇总 计算的指标 分类数据: l频数(frequency) :落在各类别中的数据个数 l比例(proport

14、ion) :某一类别数据占全部数据的比值 l百分比(percentage) :将对比的基数作为100而计算的比值 l比率(ratio) :不同类别数值的比值 顺序数据: l1. 累积频数(cumulative frequencies):各类别频数的逐级累 加 l2. 累积频率(cumulative percentages):各类别频率(百分比) 的逐级累加 汇总的方法汇总的方法 手工汇总 计算机汇总 品质分组和单变量分组,用“数据透视表”工 具 组距分组,用frequency或“直方图”工具 分组数据的展示分组数据的展示-频数分布表频数分布表 频数分布:在分组的基础上,列出各组及落在其 中的数

15、据个数,称为频数分布(次数分布、统计 分布)。 实质:把总体的全部单位按某标志所分的组进行 分配所形成的数列,又称分配数列或分布数列 分配数列包括两个要素:1 总体按某标志所分 的组;2 各组所占有的单位数次数。 分配数列的种类:根据分组标志的不同分为品质 分配数列和变量分配数列;变量分配数列又有单 项式数列和组距式数列。任何一个分布都必须满 足:1 各组的频率大于0;2 各组的频率和等于1 (或者说100%) 频数分布图频数分布图 次数分布的主要类型: 钟型分布:特征是两头小,中间大; U型分布:特征是两头大,中间小; J型分布:特征是次数随着变量值的增大 而增多,或次数随着变量值的增大而减

16、小; 频数分布图的制作 品质数列和单项式数列 l 条形图、折线图、饼图(环形图) 组距数列 l直方图、折线图 统计表统计表 定义:把汇总结果的资料按一定的规则在表格上表现出 来,这种表格就叫统计表,广义上说,任何用以反映统计 资料的表格都是统计表。 统计表的结构(P66) 统计表的编制规则: 统计表的各种标题,应简明,确切,概括地反映出表的内容; 表中的主词各行和宾词各栏应先列各个项目,后列总计; 如果统计表的栏数较多,通常要加以编号; 表中数字应填写整齐,对准位数; 统计表中必须注明数字资料的计量单位; 必要时统计表应加注明或注释。 统计图统计图 常用的统计图及适用的数据类型 分类数据。可选

17、用条形图、饼图、环形图 顺序数据。除条形图、饼图、环形图外,还可使用累 计频数分布图 对于数值型数据,除用于顺序数据的图形外,还可使 用直方图 对于未分组数据,可使用茎叶图和箱线图 对于时间序列数据,常用线图。 多变量数据,常用散点图、气泡图和雷达图。 直方图与条形图的区别。(见讲义) 鉴别图形优劣的准则 重点重点 *数据预处理的含义和主要内容:审核、筛选和排序 分类数据的整理与展示 *频数与频数分布的含义和计算 *比例、百分比、比率的含义和计算 数值型数据的整理和展示 *组距分组的基本步骤 *数据分组的方法:单变量值分组和组距分组P61 数据分组:每组的上限和下限,组距,组中值,开口组的组中

18、值 确定规则* *组距分组要遵循的基本原则是“不重不漏”P63 *时间序列数据的最佳图形展示线图P70 *统计表的主要构成部分:表头、行标题、列标题、数字资料和表 外附加。P76 *编制频数分布表的步骤 第四章第四章 数据的概括性度量 集中趋势的测量 离散程度的测量 偏态与峰度的度量 集中趋势的测量集中趋势的测量 一、众数:出现次数最多的变量值。 二、中位数是一组数据按大小排序后,处于正中间位置上 的变量值。中位数也是一个位置代表值。 中位数位置= (N+1)/2 *三、算术平均数是最常用的一种集中趋势测度值。它是 总体各单位某一数量标志值的平均,它等于总体各单位某 一数量标志的标志值的总和除

19、以总体单位数。(了解算术 平均数的性质) 简单算术平均数是将变量数列中各标志值简单相加求 得标志总量,然后除以总体单位总量而求得的平均数。 计算公式为: 加权算术平均数它是先将各组标志值与相同组的频数 相乘以后加总求得标志总量,同时,把各组频数相加 得到总体单位总数,再将两者相除得到加权算术平均 数。其计算公式为: 加权算术平均数受到两个因素的影响,一是各组变量 值;二是各组频数。频数的影响至关重要。 几何平均数:n个变量值乘积的n次方根 众数、中位数和均值的特点众数、中位数和均值的特点 (1)众数是一组数据分布的峰值,是一种位置代表值。其优点是易 于理解,不受极端值的影响。当数据的分布具有明

20、显的集中趋势时, 尤其是对于偏态分布,众数的代表性比均值要好。其缺点是具有不唯 一性,对于一组数据可能有一个众数,也可能有两个或多个众数,也 可能没有众数。 (2)中位数是一组数据中间位置上的代表值。其特点是不受数据极 端值的影响。对于具有偏态分布的数据,中位数的代表性要比均值好。 (3)均值是就全部数据计算的,它具有优良的数学性质,是实际中 应用最广泛的集中趋势测度值。其主要缺点是易受数据极端值的影响, 对于偏态分布的数据,均值的代表性较差。作为均值变形的调和平均 数和几何平均数,是适用于特殊数据的代表值,调和平均数主要用于 不能直接计算均值的数据,几何平均数则主要用于计算比率数据的平 均数

21、,这两个测度值与均值一样易受极端值的影响。 各种代表值应用的场合各种代表值应用的场合 (1)当数据呈对称分布或接近对称分布时, 三个代表值相等或接近相等,这时应选择均值作 为集中趋势的代表值,因为均值包含了全部数据 的信息,而且易被大多数人所理解和接受; (2)当数据为偏态分布,特别是当偏斜的程 度较大时,我们应选择众数或中位数等位置代表 值,这时它们的代表性要比均值好。 (3)对于分类数据,应使用众数作为平均指标; 对于顺序数据,常使用中位数作为平均指标 此外,应注意当一组数据中出现0或负数时, 无法计算调和平均数或几何平均数。 数据分布离散程度的测度数据分布离散程度的测度 1、方差是数据组

22、中各数据值与其算术平均数离差平方的 算术平均数,用符号“2”表示。方差的平方根就是标准 差,用符号“”表示。 方差和标准差的计算公式因掌握资料形式不同,有两种: (1)简单平均式 (2)加权平均式 2、标准差系数是将一组数据的标准差与其算术平均数对 比的结果,以测定其相对离中程度,常用符号“V ”表示, 其公式为: 标准差可以比较平均数代表性的大小,当两个数列的平均 数相同的情况下,标准差越大,它所代表的那组平均数的 代表性越小;如标准差越小,它所代表的那组平均数的代 表性越大。当两个数列的平均数不相同的情况下,不能进 行比较。必须要在相对的标准差系数的条件下进行比较。 偏度与峰度偏度与峰度

23、偏度与峰度的作用 如何判断分布曲线的偏度 利用算术平均数与中位数、众数的关系。如果 算术平均数中位数,则为右偏分布。 利用偏度 如何判断分布曲线的峰度 利用峰度 标准分的计算标准分的计算 标准分的含义 标准分的计算公式 本章重点本章重点 集中趋势 未分组数据众数、中位数的计算 算术平均数、几何平均数的计算 l注意算术平均数基本公式中对分子、分母的要求(分子分母属于同一总体 、 分子的标志是数量标志 、分母是分子的的直接承担者 ) 众数、中位数和平均数的关系P95 离散程度的度量 度量指标:分类数据:异众比率;顺序型数据:四分位差;数值型数据: 极差、平均差、方差和标准差;相对离散程度:离散系数

24、(变异系数) 标准差的计算(重点是对未分组数据) 离散系数的计算,及用离散系数判断平均数的代表性及数据的一致性、 差异性 如何判断数据的偏态和峰态 弄清偏态系数的取值含义,会判断左偏、右偏和对称情形P104 弄清峰态系数的取值含义,会判断尖峰、扁平和正常情形P107 第五章第五章 概率与概率分布概率与概率分布 了解以下概念:试验、事件、样本空间、了解以下概念:试验、事件、样本空间、 概率、随机变量、离散型随机变量、连续概率、随机变量、离散型随机变量、连续 型随机变量型随机变量 了解离散型随机变量的概率分布了解离散型随机变量的概率分布 了解连续型随机变量的概率分布了解连续型随机变量的概率分布 了

25、解用了解用Excel计算正态分布的概率计算正态分布的概率 基本概念基本概念 试验:对试验对象进行一次观察或测量的过程 事件:事件:试验的每一个可能结果(任何样本点集合) *随机事件(random event):每次试验可能出现也可能不 出现的事件 *样本空间:样本空间:一个试验中所有结果的集合 概率:用以度量事件发生的可能性大小 随机变量:随机变量:一次试验的结果的数值性描述 离散型随机变量:随机变量的所有取值都可以逐 个列举出来 连续型随机变量:随机变量的所有可能取值不可以 逐个列举出来,而是取数轴上某一区间内的任意点 离散型随机变量的概率分布离散型随机变量的概率分布 0-1分布:随机变量只

26、能取0或1两个值 均匀分布:随机变量取各个值的概率是相同 的 二项分布:重复进行 n 次试验,出现“成功” 的次数的概率分布称为二项分布,记为XB(n, p) 泊松分布:用来描述在一指定范围内或在 指定的面积或体积内某一事件出现的个数 的分布 连续型随机变量的概率分布连续型随机变量的概率分布 概率密度函数 分布函数 连续型随机变量的常见分布 正态分布(P142) 本章重点本章重点 常见的离散型分布:二项分布和泊松分布 的应用背景* 正态分布的概念与特点* 第六章第六章 抽样与抽样分布抽样与抽样分布 *区分总体分布、样本分布、抽样分布区分总体分布、样本分布、抽样分布 了解次序统计量的了解次序统计

27、量的含义 了解由正态分布导出的几个重要分布 理解抽样分布与总体分布的关系理解抽样分布与总体分布的关系 *掌握单总体参数推断时样本均值、样本掌握单总体参数推断时样本均值、样本 比例的分布比例的分布 *掌握中心极限定理掌握中心极限定理 *三种不同性质的分布三种不同性质的分布 总体分布:总体中各元素的观察值所形成 的分布 样本分布:一个样本中各观察值的分布, 也称经验分布 抽样分布:样本统计量的概率分布。在重 复选取容量为n的样本时,由该统计量的所 有可能取值形成的相对频数分布 由正态分布导出的几个重要分布由正态分布导出的几个重要分布 分布分布 t t分布分布 F F分布分布 2 *样本均值抽样分布

28、 抽样分布与总体分布的关系抽样分布与总体分布的关系 正态分布正态分布非正态分布非正态分布 正态分布正态分布正态分布正态分布非正态分布非正态分布 样本均值的数学期望 样本均值的方差 重复抽样 不重复抽样 *样本均值的抽样分布样本均值的抽样分布 (数学期望与方差数学期望与方差) )(xE n x 2 2 1 2 2 N nN n x 在重复选取容量为的样本时,由样本比例的所有可能取 值形成的相对频数分布 当样本容量很大时当样本容量很大时,样本比例的抽样分布可用正态分布 近似 样本比例的数学期望 样本比例的方差 重复抽样 不重复抽样 *样本比例的抽样分布样本比例的抽样分布 )(pE n p )1 (

29、 2 1 )1 ( 2 N nN n p 样本方差的分布样本方差的分布 ) 1( ) 1( 2 2 2 n sn 2 2 ) 1( sn 第七章第七章 参数估计参数估计 了解一些基本概念:参数估计、置信区间、 置信度、标准误差、边际误差等 *掌握总体均值的区间估计方法 *掌握评价优良估计量的标准 掌握总体比例的区间估计方法 掌握重复抽样中样本容量的计算,了解不 重复抽样中样本容量的计算 基本概念基本概念 *参数估计:用样本统计量去估计总体参数 估计量:用于估计总体参数的随机变量 估计值:估计参数时计算出来的统计量的具体值 *抽样误差:由于抽样的随机性而产生的样本估计量与总体 参数之间的代表性误

30、差。它是抽样的平均误差。也叫标准 误差 *抽样极限误差:是指在一定概率下抽样误差的可能范围, 也称为允许误差,用表示。也叫边际误差 点估计:用样本的估计量直接作为总体参数的估计值 区间估计:在点估计的基础上,给出总体参数估计的一个 区间范围,该区间由样本统计量加减抽样误差而得到的, *置信区间:由样本统计量所构造的总体参数的估计区间 *置信度:将构造置信区间的步骤重复很多次,置信区间包 含总体参数真值的次数所占的比例称为置信度,也叫置信 水平 *评价估计量优良的标准评价估计量优良的标准 无偏性 无偏性是指估计量抽样分布的数学期望等于被 估计的总体的参数。 有效性 有效性是指对同一总体参数的两个

31、无偏统计量, 有更小标准差的估计量更有效。 一致性 一致性是指随着样本量的增大,点估计量的值 越来越接近被估总体的参数。 抽样误差计算公式抽样误差计算公式 抽样平均误差(见第六章) 重复抽样 不重复抽样 抽样极限误差(最大误差、边际误差)的 计算 掌握一个总体参数的估计及所使用的分布 (P189图7-9) 影响抽样误差的因素:影响抽样误差的因素: 1、 方差和标准差 (总体内部存在客观 因素,不可避免) 2、 样本容量n (可控制的主观因素) 3、 抽样的组织形式:等距抽样误差最小, 整群抽样误差最大。 4、 抽样的方法:重复抽样误差大,不重复 抽样误差小。 重点和难点重点和难点 一些基本概念

32、(见前) 总体均值的区间估计 影响抽样误差的因素 评价估计量的标准 第八章第八章 假设检验假设检验 掌握假设检验的概念及步骤 掌握总体均值、总体比例的检验方法 了解总体方差的检验方法(不考计算) 一、假设检验的概念一、假设检验的概念 *假设检验的概念:就是事先对总体参数或总体分 布形式作出一个假设,然后利用样本信息来判断 原假设是否合理,即判断样本信息与原假设是否 有显著差异,从而决定应接受或否定原假设。所 以,假设检验也称为显著性检验。 假设检验的特点: 1、假设检验所采用的逻辑推理方法是反证法。 2、*所依据的是“小概率事件实际不可能发生的原理”。 假设检验的反证法是带有概率性质的反证法,

33、并非严 格的逻辑证明。假设检验是基于样本信息来推断总体 特征的,这种推断是在一定的置信概率下进行的。 *二、假设检验的思路二、假设检验的思路 首先,对总体参数作出某种假设。其次, 根据样本得到的信息,考虑接受假设是否 导致发生了小概率事件。如果发生了小概 率事件,则拒绝原假设,否则不能拒绝原 假设。 *三、假设检验的步骤三、假设检验的步骤 1)根据研究要求建立原假设和备择假设; 2)确定检验统计量,并根据样本数据计算 检验统计量的实际值; 3)决定检验的显著性水平a,查出临界值; 4)将检验统计量值与临界值进行比较,做 出拒绝或不拒绝原假设的决策。 四、假设的三种形式 双侧检验:所研究的问题只

34、需判断有无显著差异或要 求同时注意总体参数偏大或偏小的情况。 左侧检验:所关心的是总体参数是否比某个数值偏小。 右侧检验:所关心的是总体参数是否比某个数值偏大。 五、总体参数的检验 利用统计量进行检验 l*总体均值检验。注意何时用t 检验,何时用z 检验,重点掌握 双侧检验 l总体比例检验 l总体方差检验 *利用p值进行检验。注意P值的含义及利用p值进行统 计决策的规则 假设检验中的两类错误假设检验中的两类错误 *两类错误的含义 犯两类错误的概率 具体检验中,应该主要防止哪类错误 第九章第九章 一元线性回归分析一元线性回归分析 了解基本概念:相关关系、函数关系、相关系数、因变量、 自变量、判定

35、系数、标准误差、残差 *掌握相关关系的分类 *掌握相关关系的描述及测度:散点图和简单相关系数的 取值特点及相关含义 了解回归分析的基本流程 *能看懂回归分析结果 会根据P327的类似于表11-4的软件输出结果,找出相关系数、判 定系数的取值并解释;会根据输出结果判断回归方程和回归系数 是否通过了显著性(利用P值判断)检验;会根据结果写出回归方 程并对方程的回归系数的含义进行解释;会根据通过了检验的回 归方程进行点估计及区间估计。 基本概念基本概念 *函数关系:现象之间存在着严格的、确定的依存关系。 *相关关系:现象之间存在着非严格的、不确定的依存 关系。 相关系数:对变量之间关系密切程度的度量

36、 *因变量:被预测或解释的变量 *自变量:用于预测或解释因变量的变量 *判定系数:回归平方和占总离差平方和的比例, *估计标准误差:实际观察值与回归估计值离差平方和的 均方根,反映估计值与观察值的平均离差 残差:观测值与估计值之差 *相关关系的种类相关关系的种类 按相关程度划分:完全相关、不完全相关、 完全不相关。 按相关方向划分:正相关、负相关。 按相关形式划分:线性相关、非线性相关。 相关系数相关系数 相关系数:对两个变量之间的相关程度进行分析 (单相关线性分析)所用的指标。( 样本相关系 数r ) 取值范围:1 r 1 当r = 0 时,X与Y之间没有线性相关关系。 当r = 1 时,X

37、与Y之间是完全负相关;当 r = 1 时,X与Y之间是完全正相关。 等级划分:当| r |0.3时,微弱相关;当 0.3 | r | 0.5时,低度相关;当0.5 | r | 0.8时, 显著相关;当0.8 | r | 1时,高度相关。 注意:如何利用相关系数判断相关关系的强弱 (用相关系数的绝对值大小) 一元回归一元回归 1、一元线性回归参数求解的最常用方法:* 最小二乘法(含义) 2、回归方程的计算、参数的含义 3、回归方程、回归系数的检验方法。 4、一些概念: 回归平方和、残差平方和、均方回归、均方残 差 第十章第十章 时间序列分析和预测时间序列分析和预测 1、时间序列及其分解 *时间序列的含义 *平稳序列和非平稳序列的差别 *趋势、季节性变动、周期性变动和不规则变动的具体含义 2、时间序列的描述性分析 *增长率,环比增长率,定基增长率 *平均增长率的计算 理解增长率分析中应该注意的问题 增长1%的绝对值的计算* 3、平稳序列的预测方法 简单平均法* 移动平均法(了解) 时间序列分析时间序列分析 时间序列的概念:同一现象在不同时间上 的相继观察值排列而成的数列 构成:形式上由现象所属的时间和现象在 不同时间上的观察值两部分组成 分类 按指标性质,可分为绝对数时间序列、相对数 时间序

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论