统计学2016年春季学期第二次答疑提纲_第1页
统计学2016年春季学期第二次答疑提纲_第2页
统计学2016年春季学期第二次答疑提纲_第3页
统计学2016年春季学期第二次答疑提纲_第4页
统计学2016年春季学期第二次答疑提纲_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2016年春季统计学年春季统计学第二次答疑提纲第二次答疑提纲时间:时间:2016年年5月月8日日1一、期末考试一、期末考试 考试形式:开卷考试(带计算器) 考试时间:90分钟 考试题型:名词解释题、简答题、计算题二、成绩分布二、成绩分布考核方式作业平时表现语音答疑期末考试 合计成绩比例205570100三、教材及课件三、教材及课件 教材名称:应用经济统计学,李心愉编著,第三版,北京大学出版社。 说明:本学期使用新教材第三版,但内容与第二版基本一致,考试内容 和要求也没有发生变化。 配套课件:黄嘉佑主讲,统计学视频教学课件。四、四、课程重要考点解析课程重要考点解析第一章导言 1、统计学的分类、统

2、计学的分类 描述统计学和推论统计学;理论统计学和应用统计学 2、统计变量的分类 数量型变量和属性变量;数量型变量又分为离散型变量和连续型变量。 3、总体与样本总体与样本6第二章 数据搜集 1、定期统计报表制度和普查、定期统计报表制度和普查 2、随机抽样调查和非随机抽样调查、随机抽样调查和非随机抽样调查 3、问卷调查法、问卷调查法 4、调查的误差有哪些?怎么看待这些误差?、调查的误差有哪些?怎么看待这些误差? 7第三章 数据整理 3.1 数据分组 分组是将总体所有单位按一定标准区分为若干部分。 分组的基本作用:把大量原始资料条理化,显现出现象的数量分布特征,揭示其内在的规律性。 分组的原则:保证

3、总体中的任何一个个体都能归于某一个组且仅能归于某一个组,即保证不重、不漏。 按分组标志的性质不同分: 品质分组:按品质标志进行的分组,如人口总体按性别分组、高校教师按职称分组。 变量分组:按数量标志进行的分组,如企业按职工人数分-1000人以下、1000-5000人、5000人以上8第三章 数据整理 次数分配 次数分配的定义:将总体资料按某个标志分成若干组,并统计出各组数据的个数,这种分组的结果称为次数分配或次数分布。 次数分配的作用:次数分配描述了总体的结构和分布特征,据此,可进行许多统计分析和研究。 在次数分布中,各组数据的个数成为频数;频数与总次数之比称为频率。9第四章 集中趋势和离中趋

4、势 4.1 集中趋势的计算 集中趋势反映一组数据中各数据所具有的共同趋势,即资料中各数据聚集的位置。 衡量集中趋势的统计指标有算术平均数、中位数、众数、分位数等。 一、算术平均(也叫均值 ) 1.简单算术平均数 计算公式: 10NXNXXXXNiiN121.第四章 集中趋势和离中趋势 二、中位数 将数据观察值x1,x2,xn按其变量值由小到大的顺序排列,处于数列中点位置的数值就是中位数(Md)。 中位数的确定方法: 如果数据可以一一排列 如果数据个数为奇数,则处于(n+1)/2位置的标志值是中位数。 如果数据个数为偶数,则处于n/2、n/2+1的两个标志值的平均数为中位数。11第四章 集中趋势

5、和离中趋势 三、众数 众数是一组资料中出现次数最多的那个数值,也反映数据集中的程度( Mo )。 四、集中趋势的其它测度量 1.分位数:四分位数、十分位数、百分位数。 分位数的计算: (1)将资料按大小顺序排列; (2)求出分位数所在位置i; (3)若i为整数,则所求分位数为该位置上的数值;若i为非整数,则取i左右位置的两个数值的平均数为所求分位数。12第四章 集中趋势和离中趋势 4.2 离中趋势的计算 离中趋势是数据分布的又一特征,它表明变量值的差异或离散程度。 离中趋势测度经常用到的指标有:极差、方差和标准差、四分位差等,它们也被称为变异指标。 一、 极差 极差也称为全距,是一组数据的最大

6、值和最小值的差: 13maxminRxx第四章 集中趋势和离中趋势 二、平均差 平均差是指数据值与其均值之差的绝对值的算术平均值,用符号AD表示。计算公式: 三、方差与标准差 总体方差是观察值与其均值离差平方和的均值; 总体标准差是总体方差的正平方根;141.niixxADn11.niiiniixx fADf221()NiixxN 第四章 集中趋势和离中趋势 样本方差与样本标准差 当样本数据个数足够大时,样本方差与总体方差很接近 方差和标准差是较重要的离中趋势测度量,其大小说明了各数值在均值周围的分布情况。 其中,与之相关的有切比雪夫(Chebishev)定理和经验法则15221()1Niix

7、xN 21()1NiixxN 第四章 集中趋势和离中趋势 四、相对离中趋势变异系数C.V. 变异系数又称离散系数,是标准差与均值的比值。 C.V.是对数据相对离散程度的测度,消除了数据水平高低和计量单位的影响,可用于对不同组别数据离散程度的比较 例: 从上看,甲的 更具代表性,但是从C.V.来看,乙的产量比甲农场稳定,因此乙的 最具有代表性。16xx第五章 概率和概率分布 1、概率的定义 概率的统计定义: 在不变的一组条件S下,重复作n次试验,m是n次试验中事件A发生的次数,当试验次数n很大时,如果频率m/n稳定地在某一数值p的附近摆动,且随着试验次数的增多,摆动的幅度越来越小,则称数值p为事

8、件A在条件组S下发生的概率。 概率的古典定义:在古典模型中,事件A所包含的基本事件个数m与样本空间基本事件个数n的比值成为事件A的概率。利用概率的古典定义求事件的概率的例题。 概率的几何定义:设区域G的长度(或面积、体积)为D,指点可以等可能地落在区域G中的任何一点,设事件A=“质点落在G内一个长度(或面积、体积)为d的区域g内”,定义A的概率为P(A)=d/D利用概率的几何定义求事件的概率的例题。17第五章 概率和概率分布 2、概率的性质:性质1-性质4 3、概率的运算法则 概率加法法则:P(A+B)= P(A)+P(B)P(AB) 概率乘法法则:P(AB)= P(B/A) P(A) 如果P

9、(A)0,则事件A和B相互独立的充要条件是P(B/A)= P(B)18第五章 概率和概率分布 4、离散型随机变量的概率分布 重要的离散型随机变量及其概率分布 两点分布 二项分布 泊松分布 几何分布 超几何分布 负二项分布19第五章 概率和概率分布 5、连续型随机变量的概率密度函数 重要的连续型随机变量及其概率分布 均匀分布 指数分布 伽玛分布 正态分布20第五章 概率和概率分布 6、随机变量的数字特征 数学期望 定义 性质 方差 定义 方差和期望的关系:方差的计算公式 性质21第五章 概率和概率分布 7、常见分布的数学期望和方差 0-1分布:期望为p,方差为pq 二项分布:期望为np,方差为n

10、pq 泊松分布:期望为 ,方差为 均匀分布:期望为(a+b)/2,方差为1/12(b-a)2 指数分布:期望为 1/ ,方差为 1/ 2 正态分布:期望为 ,方差为 222第五章 概率和概率分布 8、协方差与相关系数 定义 协方差和期望的关系:协方差的计算公式 性质23第六章 参数估计 1、样本统计量与抽样分布(了解) 根据样本值构造的特定量称为样本统计量。 样本统计量是随着样本不同而变化的量,由于样本是随机样本,所以样本统计量也是一个随机变量。既然是随机变量,就有一定的概率分布,我们把样本统计量的分布称做抽样分布。 2、大数定律、中心极限定理(掌握) 3、点估计量的评价原则(掌握) 无偏性;

11、有效性;最小均方误差;一致性 其中,为小样本情况下点估计量的评价原则,是大样本情况下的评价原则。24第六章 参数估计 4、点估计(重点) 极大似然估计法:教材例题 基本步骤:确认总体分布、列出似然函数和对数似然函数、对参数求导、求出参数估计结果 矩估计法: 教材例题 基本步骤:求出包含参数的总体矩、令总体矩等于样本矩、求出参数估计结果 5、区间估计(重点) 在区间估计中称以一定概率保证的总体参数可能落入的区间为置信区间,称置信区间的两个界限值为置信下限和置信上限。25第六章 参数估计 (1)区间估计的基本步骤: 第一步,确定待估参数和置信水平 第二步,确定包含待估参数的估计量,并找出估计量的抽

12、样分布 第三步,利用估计量的抽样分布给出置信区间 (2)呈正态分布的总体的期望的区间估计 正态总体,总体方差已知的情况 正态总体,总体方差未知的情况 例题:教材例题2627例:例:从正态总体中随机抽取样本,测得结果如下:从正态总体中随机抽取样本,测得结果如下: 6,15,3,12,6,21,15,18,12若已知总体方差为若已知总体方差为40,试以,试以95的可靠性估计总计均值的置信区间。又若未知总体方差的可靠性估计总计均值的置信区间。又若未知总体方差,以相同的可靠性估计总体均值的置信区间。,以相同的可靠性估计总体均值的置信区间。第七章 参数的假设检验 1、假设检验的三种方法(掌握) 2、假设

13、检验的基本思想(掌握) 为了检验一个假设是否成立,先假设这个假设是成立的,然后看由此会产生什么结果(例如某个样本)。如果这个假设导致了一个不合理的现象(例如小概率事件发生了),就表明有理由拒绝该假设,反之,则不能拒绝。 通常把概率不超过0.05的事件当做小概率事件。 注意:原假设为真的情况下小概率事件仍旧可能发生,如果小概率事件出现了,而我们却拒绝了原假设,很显然我们就犯了“以真为假”的错误,即第一类错误。28第七章 参数的假设检验 2、理解并掌握假设检验的一般步骤(重点) 根据研究问题的需要提出原假设H0和备择假设H1 找出检验统计量及其分布 确定显著性水平 根据样本值计算检验统计量的值 作

14、出判断或决策 3、会查标准正态分布表和t分布表(注意单侧和双侧检验的区分) 4、单个总体均值的假设检验(重点)、单个总体均值的假设检验(重点) (1)正态总体,总体方差已知的情况 (2)正态总体,总体方差未知的情况 例题:教材例题2930例:例:某旅馆的经理认为其客人每天的平均花费为某旅馆的经理认为其客人每天的平均花费为1000元。假如抽取了一组元。假如抽取了一组16张帐单作为张帐单作为样本资料,样本平均数为样本资料,样本平均数为900元,样本方差为元,样本方差为400元,试以元,试以5的显著水平检验是否与该的显著水平检验是否与该经理的说法有显著差异。经理的说法有显著差异。第十章 相关与回归分

15、析 1、一元线性回归分析(重点)、一元线性回归分析(重点) (1)简单线性回归模型的统计假设(4个假定) (2)简单线性回归模型的参数估计(2个公式) (3)最小平方估计线和估计量的性质(5个性质) (4)拟合优度(判定系数r2、SST、SSR、SSE)31第十一章 时间序列分析 1、时间序列的构成:长期趋势、季节波动、循环波动、随机波动 2、长期趋势分析 数学曲线拟合法:直线趋势的拟合、指数趋势线的拟合等 移动平均法:简单移动平均、加权移动平均 一次指数平滑法 3、季节变动分析 简单平均法、移动平均趋势剔除法 4、循环波动分析 剩余法32第十二章 指数 1、简单指数 2、加权综合指数(重点)、加权综合指数(重点)质量指标综合指数A、拉氏指数:以基期的销售量为权数B、帕氏指数:以报告期的销售量为权数数量指标综合指数A、拉氏指数:以基期价格为权数B、帕氏指数:以报告期价格为权数 3、加权算术平均指数 以基期价值总额为权数 以固定值为权数 4、消费者价格指数:固定权数加权算术平

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论