《统计学原理》总复习_第1页
《统计学原理》总复习_第2页
《统计学原理》总复习_第3页
《统计学原理》总复习_第4页
《统计学原理》总复习_第5页
已阅读5页,还剩140页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2011年6月制作人:暨南大学统计学系王艳丽制作人:暨南大学统计学系王艳丽统计的含义统计学的概念与研究对象数据的类型统计学的一些基本概念制作人:暨南大学统计学系王艳丽1.统计工作:是指搜集、整理、分析和显示统计数据的活动。2.统计资料:是指统计活动的结果,即统计数据。3.统计学:是一门关于搜集、整理、分析、解释统计数据的方法数量性具体性统计是认识世界的有力武器统计是治国和管理的重要手段统计是科学研究的有效工具制作人:暨南大学统计学系王艳丽..统计学的研究对象:统计工作的规律性数据的类型制作人:暨南大学统计学系王艳丽1、统计总体、总体单位、样本、样本容量l数量指标:是指反映事物的规模或总量的指标。l质量指标:是指反映事物的性质、质量和管理水平的指标。l两者的关系:指标数值由数量标志汇总而来,两者随总体单位的相互转化而转化。但两者说明的对象不同,表现形式也不标制作人:暨南大学统计学系王艳丽3、参数和统计量4、指标体系:以共同的研究目的为纽带而相互联系的一系列统计指标,叫指标体制作人:暨南大学统计学系王艳丽..在具体的调查中,能辨别总体、总体单位、样本、样本容量、参数、统计量制作人:暨南大学统计学系王艳丽辨别变量(数据)的类型变量、变量值的区别离散型变量与连续型变量的概念分类数据、顺序数据、数值型数据的含义制作人:暨南大学统计学系王艳丽统计学:收集、整理、分析、解释数据的科学*描述统计:研究数据的收集、处理、汇总、图表描述、概括和分析的统计方法*推断统计:研究如何利用样本数据来推断总体特征的统计方法。*总体:包含所研究的全部个体的集合。有限总体:是指总体的范围能够明确确定,而且元素的数目是有限可无限总体:是总体所包括的元素是无限的,不可数的。*样本:从总体中抽取的一部分元素的集合。*参数:用来描述总体特征的概括性数字度量。*统计量:由样本数据构成的不依赖于任何未知参数的函数。*变量:说明现象某种特征的名称。标志:说明总体单位特征的名称指标:说明总体数量特征的名称。*分类变量:说明事物类别的一个名称*顺序变量:说明事物有序类别的名称*数值型变量:说明事物数字特征的一个名称制作人:暨南大学统计学系王艳丽数据的来源统计调查的种类统计调查的方式、方法统计调查方案的设计调查误差制作人:暨南大学统计学系王艳丽数据的来源:统计调查:根据统计研究的目的,有计划、有组统计调查的要求:准确性、及时性调查的种类制作人:暨南大学统计学系王艳丽.普查:是为某一特定目的而专门组织的一次性全(2)普查一般需要规定统—的标准调查时间,以避免(4)普查适用的对象比较狭窄,只能调查一些最基制作人:暨南大学统计学系王艳丽〈1〉*概率抽样:是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入(2)*非概率抽样:是指抽取样本时不依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实(3)概率抽样与非概率抽样的比较制作人:暨南大学统计学系王艳丽②类型抽样(分层抽样)制作人:暨南大学统计学系王艳丽重点调查:是专门组织的一种非全面调查,它是对所要调查的全部单位中选择一部分重点单位进行调查。(所谓重点单位,是着眼于现象量的方面而言,尽管这些单位在全部单位中只是一部分,但是它们的某一主要标志的标志总量在总体标志总量中却占有绝大比重。)典型调查。典型调查是在对现象总体进行初步分析的基础上,有意识的选择具有代表性的单位进行调查,借以认识事物发展变化规律的一种非全面调查方法。配额抽样就是先将总体进行较详细的若干种分类,然后将既定的样本容量分配给各个类别,在每一类中由调查员任意抽取规定个数的被调查单位进行调查,以取得样本数据的一种非随机抽样调制作人:暨南大学统计学系王艳丽..统计表:定期统计报表是按国家统一规定的表格形式,统一的报送程序和报送时间,自下而上定期向国家和各级领导报告制作人:暨南大学统计学系王艳丽制作人:暨南大学统计学系王艳丽数据的收集方法! ! ! 访问访问调查邮寄调查邮寄调查电话调查电话调查制作人:暨南大学统计学系王艳丽制作人:暨南大学统计学系王艳丽个别采访网上调查观察法观察法实验法实验法..调查误差:调查所得数据和研究对象的真实结果):):员误差、测量误差)。抽样调查和非抽样调查都可能制作人:暨南大学统计学系王艳丽.统计整理的定义和步骤统计审核的内容统计分组汇总显示制作人:暨南大学统计学系王艳丽.统计整理:统计整理是根据统计研究的目的要求,对调查所取得的各项资料进行科统计整理的四个步骤:2)根据研究的目的和分析的需要,选择分3)对各项资料进行汇总,计算各种指标;4)编制统计表与图,表述整理的结果。制作人:暨南大学统计学系王艳丽..数据审核:是指检查数据中是否存在错误。数据筛选:是指根据需要找出符合特定条件的某数据排序:是指按一定顺序将数据排列,以便研制作人:暨南大学统计学系王艳丽1、选择分组标志(关键)2、确定组数3、确定组距5、列出各分组。制作人:暨南大学统计学系王艳丽计算的指标频数(frequency):落在各类别中的数据个数制作人:暨南大学统计学系王艳丽手工汇总计算机汇总组距分组,用frequency或“直方图”工具制作人:暨南大学统计学系王艳丽频数分布:在分组的基础上,列出各组及落在其分配数列和变量分配数列;变量分配数列又项式数列和组距式数列。任何一个分布都必足:1º各组的频率大于0;2º各组的频率和等于1(或者说100%)制作人:暨南大学统计学系王艳丽次数分布的主要类型:③J型分布:特征是次数随着变量值的增大而增多,或次数随着变量值的增大而减小;频数分布图的制作l条形图、折线图、饼图(环形图)制作人:暨南大学统计学系王艳丽统计表的各种标题,应简明,确切,概括地反映出表的内容;表中的主词各行和宾词各栏应先列各个项目,后列总计;如果统计表的栏数较多,通常要加以编号;表中数字应填写整齐,对准位数;统计表中必须注明数字资料的计量单位;必要时统计表应加注明或注释。制作人:暨南大学统计学系王艳丽常用的统计图及适用的数据类型直方图与条形图的区别。(见讲义)鉴别图形优劣的准则制作人:暨南大学统计学系王艳丽.数据预处理的含义和主要内容:审核、筛选和排序统计分组统计分组要遵循的基本原则是“不重不漏”统计表和统计图制作人:暨南大学统计学系王艳丽.区分指标的类别(如总量指标中的时点与时期指会计算各种相对指标l中长期计划完成相对数的两种计算方法:水平法与累计法制作人:暨南大学统计学系王艳丽一、众数:出现次数最多的变量值。二、中位数是一组数据按大小排序后,处于正中间位置上的变量值。中位数也是一个位置代表值。三、算术平均数是最常用的一种集中趋势测度值。它是总体各单位某一数量标志值的平均,它等于总体各单位某一数量标志的标志值的总和除以总体单位数。(了解算术平均数的性质)简单算术平均数是将变量数列中各标志值简单相加求得标志总量,然后除以总体单位总量而求得的平均数。计算公式为:加权算术平均数它是先将各组标志值与相同组的频数相乘以后加总求得标志总量,同时,把各组频数相加得到总体单位总数,再将两者相除得到加权算术平均数。其计算公式为:加权算术平均数受到两个因素的影响,一是各组变量值;二是各组频数。频数的影响至关重要。几何平均数:简单几何平均数:n个变量值乘积的n次方根;加权几何平均数制作人:暨南大学统计学系王艳丽(1)众数是一组数据分布的峰值,是一种位置代表值。其优点是易于理解,不受极端值的影响。当数据的分布具有明显的集中趋势时,尤其是对于偏态分布,众数的代表性比均值要好。其缺点是具有不唯一性,对于一组数据可能有一个众数,也可能有两个或多个众数,也(2)中位数是一组数据中间位置上的代表值。其特点是不受数据极端值的影响。对于具有偏态分布的数据,中位数的代表性要比均值好。(3)均值是就全部数据计算的,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。其主要缺点是易受数据极端值的影响,对于偏态分布的数据,均值的代表性较差。作为均值变形的调和平均数和几何平均数,是适用于特殊数据的代表值,调和平均数主要用于不能直接计算均值的数据,几何平均数则主要用于计算比率数据的平均数,这两个测度值与均值一样易受极端值的影响。制作人:暨南大学统计学系王艳丽(2)当数据为偏态分布,特别是当偏斜的程度较大时,我们应选择众数或中位数等位置代表值,这时它们的代表性要比均值好。制作人:暨南大学统计学系王艳丽制作人:暨南大学统计学系王艳丽偏度与峰度的作用如何判断分布曲线的偏度如何判断分布曲线的峰度制作人:暨南大学统计学系王艳丽标准分的含义标准分的计算公式制作人:暨南大学统计学系王艳丽注意算术平均数基本公式中对分子、分母的要求(分子分母属于同一总体、分子的标志是数量标志、分母是分子的的直接承担制作人:暨南大学统计学系王艳丽制作人:暨南大学统计学系王艳丽1.试验:对试验对象进行一次观察或测量的过程2.事件:试验的每一个可能结果(任何样本3.*随机事件(randomevent):每次试验可能出现也可能不5.概率:用以度量事件发生的可能性大小7.离散型随机变量:随机变量的所有取值都可以逐8.连续型随机变量:随机变量的所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点制作人:暨南大学统计学系王艳丽.二项分布:重复进行n次试验,出现“成功”的次数的概率分布称为二项分布,记为X~B(n,p)超几何分布:不重复进行n次试验,出现“数的概率分布称为超几何分布泊松分布:用来描述在一指定范围内或在指定的制作人:暨南大学统计学系王艳丽连续型随机变量的概率分布.概率密度函数分布函数连续型随机变量的常见分布制作人:暨南大学统计学系王艳丽..1.常见的离散型分布:二项分布和泊松分布2.正态分布的概念与特点制作人:暨南大学统计学系王艳丽..4.*掌握中心极限定理的含义制作人:暨南大学统计学系王艳丽..总体分布:总体中各元素的观察值所形成样本分布:一个样本中各观察值的分布,也称经验分布抽样分布:样本统计量的概率分布。在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布制作人:暨南大学统计学系王艳丽在重复选取容量为n的样本时,由样本均值的所有■当总体服从正态分布N(μ,σ2)时,来自该总体的2/n/n)■中心极限定理:设从均值为μ,方差为σ2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从制作人:暨南大学统计学系王艳丽制作人:暨南大学统计学系王艳丽1.样本均值的数学期望E(x)=μ2.样本均值的方差制作人:暨南大学统计学系王艳丽3.样本比例的数学期望E(p)=πËN-1,50ËN-1,50..了解一些基本概念:参数估计、置信区间、置信度、标准误差、边际误差等*掌握总体均值的区间估计方法*掌握评价优良估计量的标准掌握总体比例的区间估计方法掌握重复抽样中样本容量的计算,了解不重复抽样中样本容量的计算制作人:暨南大学统计学系王艳丽无偏性有效性一致性制作人:暨南大学统计学系王艳丽.抽样平均误差(p199\P202)抽样极限误差(最大误差、边际误差)的制作人:暨南大学统计学系王艳丽1、方差和标准差(总体内部存在客观2、样本容量n(可控制的主观因素)整群抽样误差最大。4、抽样的方法:重复抽样误差大,不重复制作人:暨南大学统计学系王艳丽一些基本概念(见前)总体均值和总体比例的估计(P199-P201)影响抽样误差的因素抽样平均误差和抽样极限误差(即边际误差)的关系、抽样平均误差与样本容量的关系评价估计量的标准制作人:暨南大学统计学系王艳丽..掌握假设检验的概念及步骤掌握总体均值、总体比例的检验方法了解总体方差的检验方法(不考计算)制作人:暨南大学统计学系王艳丽*假设检验的概念:就是事先对总体参数或总体分假设检验的特点:假设检验的反证法是带有概率性质的反证法,格的逻辑证明。假设检验是基于样本信息来推制作人:暨南大学统计学系王艳丽..首先,对总体参数作出某种假设。其次,根据样本得到的信息,考虑接受假设是否导致发生了小概率事件。如果发生了小概率事件,则拒绝原假设,否则不能拒绝原制作人:暨南大学统计学系王艳丽1)根据研究要求建立原假设和备择假设;2)确定检验统计量,并根据样本数据计算检验统计量的实际值;3)决定检验的显著性水平a,查出临界值;4)将检验统计量值与临界值进行比较,做制作人:暨南大学统计学系王艳丽四、假设的三种形式五、总体参数的检验l*总体均值检验。注意何时用t检验,何时用z检验,重点掌握双侧检验l*总体比例检验l总体方差检验计决策的规则.制作人:暨南大学统计学系王艳丽*两类错误的含义及其关系犯两类错误的概率具体检验中,应该主要防止哪类错误制作人:暨南大学统计学系王艳丽会完成作业8.4,找出相关系数、判定系数的取值并解释;会根据输出结果判断回归方程和回归系数是否通过了显著性(利用P值判断)检验;会根据结果写出回归方程并对方程的回归系数的含义进行解释;会根据通过了检验的回归方程进行点估计及区间估制作人:暨南大学统计学系王艳丽*相关关系:现象之间存在着非严格的、不确定的依存*判定系数:回归平方和占总离差平方和的比例,反映制作人:暨南大学统计学系王艳丽.按相关程度划分:完全相关、不完全相关、完全按相关方向划分:正相关、负相关。按相关形式划分:线性相关、非线性相关。按变量多少划分:单相关、复相关、偏相关。制作人:暨南大学统计学系王艳丽相关系数:对两个变量之间的相关程度进行分析数r)注意:如何利用相关系数判断相关关系的强弱(用相关系数的绝对值大小)制作人:暨南大学统计学系王艳丽1、一元线性回归参数求解的最常用方法:*最小二乘法(含义)2、回归方程的计算、参数的含义3、回归方程、回归系数的检验方法。制作人:暨南大学统计学系王艳丽1、时间序列及其分解2、*时间序列的描述性分析l发展速度、平均发展速度3、平稳序列的预测方法制作人:暨南大学统计学系王艳丽..时间序列的概念:同一现象在不同时间上的相继观察值排列而成的数列构成:形式上由现象所属的时间和现象在不同时间上的观察值两部分组成分类制作人:暨南大学统计学系王艳丽水平指标发展水平:一定时间上的水平表现。分为最初水平、中间水平、*速度指标发展速度:时间序列中报告期水平与基期水平之比。分为环比发展各环比发展速度的连乘积,等于相应时期的定基发展速度*增长百分之一的绝对值制作人:暨南大学统计学系王艳丽*时间数列的构成要素。了解各种要素的含义时间序列的预测模型:乘法型和加法型季节指数的含义及计算制作人:暨南大学统计学系王艳丽

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论