版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《数量方法》通过宝典数据的整理和描述数据的分类:按照描述的事物分类:分类型数据:描述的是事物的品质特征,本质表现是文字形式数量型数据:事物的数量特征,用数据形式表示日期和时间型数据。按照被描述的对象与时间的关系分类:截面数据:事物在某一时刻的变化情况,即横向数据时间序列数据:事物在一定的时间范围内的变化情况,即纵向数据平行数据:是截面数据与时间序列数据的组合数据的整理和图表显示:组距分组法:将数据按上升顺序排列,找出最大值max和最小值min确定组数,计算组距c计算每组的上、下限(分组界限)、组中值及数据落入各组的频数vi(个数)和频率(),形成频率分布表唱票记频数算出组频率,组中值制表饼形图:用来描述和表现各成分或某一成分占全部的百分比。注意:成分不要多于6个,多于6个一般是从中选出5个最重要的,把剩下的全部合并成为“其他”;成分份额总和必须是100%;比例必须于扇形区域的面积比例一致。条形图:用来对各项信息进行比较。当各项信息的标识较长时,应当尽量采用条形图。柱形图:如果是时间序列数据,应该用横坐标表示时间,纵坐标表示数据大小,即应当使用柱形图,好处是可以直观的看出事物随时间变化的情况。折线图:明显表示趋势的图示方法。简单、容易理解,对于同一组数据具有唯一性。曲线图:许多事物不但自身逐渐变化,而且变化的速度也是逐渐变化的。具有更加自然的特点,但是不具有唯一性。散点图:用来表现两个变量之间的相互关系,以及数据变化的趋势。茎叶图:把数据分成茎与叶两个部分,既保留了原始数据,又直观的显示出了数据的分布。数据集中趋势的度量:平均数:容易理解,易于计算;不偏不倚地对待每一个数据;是数据集地“重心”缺点:它对极端值十分敏感。平均数= 中位数:将数据按从小到大顺序排列,处在中间位置的一个数或最中间的两个数的平均数。它的优点是它对极端值不像平均数那么敏感,因此,如果包含极端值的数据集来说,用中位数来描述集中趋势比用平均数更为恰当。众数:数据中出现次数最多的数。缺点是一个数据集可能没有众数,也可能众数不唯一;优点在于它反映了数据集中最常见的数值,而且它不仅对数量型数据(数据都是数值)有意义,它对分类型数据集也有意义;并且能够告诉我们最普遍、最流行的款式、尺寸、色彩等产品特征。分组数据的平均数(加权平均):为组数,vi为第i组频数,yi为第i组组中值。数据离散趋势的度量:极差R=最大值max-最小值min四分位点:第二四分位点Q2就是整个数据集的中位数;第一四分位点Q1是所有小于(或等于)Q2的数据所组成的数据集的中位数;第三四分位点Q3是所有大于(或等于)Q2的数据所组成的数据集的中位数。四分位极差=Q3-Q1,它不像极差R那么容易受极端值的影响,但是仍然存在着没有充分地利用数据所有信息地缺点。方差:离平均数地集中位置地远近;:频数,:组中值,:数据的个数,:用分组数据计算的平均数。标准差:。变异系数:表示数据相对于其平均数的分散程度随机事件及其概率随机试验与随机事件:随机试验:可以在相同的条件下重复进行;每次试验的可能结果可能不止一个,但是试验的所有可能的结果在试验之前是确切知道的;试验结束之前,不能确定该次试验的确切结果。样本空间:所有基本事件的全体所组成的集合称为样本空间,是必然时间;样本空间中每一个基本事件称为一个样本点;每一个随机事件就是若干样本点组成的集合,即随机事件是样本空间的子集;不包含任何样本点的随机事件就是不可能事件。样本空间的表示方法:①.列举法②.描述法:事件的关系和运算事件的关系:包含关系:事件A的每一个样本点都包含在事件B中,或者事件A的发生必然导致事件B的发生,成为事件B包含事件A,记做。若则称事件A与事件B相等,记做A=B。事件的并:事件A和事件B至少有一个发生的事件称为事件A与事件B的并记做。事件的交:事件A与事件B同时发生的事件称为事件A与事件B的交,记做。互斥事件:事件A与事件B中,若有一个发生,另一个必定不发生,则称事件A与事件B是互斥的,否则称这两个事件是相容的。。对立事件:一个事件B若与事件A互斥,且它与事件A的并是整个样本空间Ω,则称事件B是事件A的对立事件,或逆事件。事件A的对立事件是,。事件的差:事件A发生,但事件B不发生的事件,称为事件A与事件B的差,记做A-B。2.运算律:交换律:结合律:分配律: 对偶律:事件的概率与古典概型:事件A发生的频率的稳定值称为事件A发生的概率,记做:,概率的性质:非负性:规范性:完全可加性:设A,B为两个事件,若,则有,且古典概型试验与古典概率计算:古典概型试验是满足以下条件地随机试验:①.它的样本空间包含有限个样本点②.每个样本点的发生等可能的。古典概率的计算:;两个基本原理:加法原理:假如做一件事情有两类办法,在第一类办法中有m种不同方法,而在第二类办法中有n种不同方法,那么完成这件事情就有m+n种不同方法。可以推广到有多类办法的情况;乘法原理:假设做一件事情可以分成两步来做,做第一步有m种不同方法,做第二步有n种不同方法,那么完成这件事情有mn种不同方法。也可以推广到多个步骤的情形。条件概率:在事件B发生的条件下(假定P(B)>0),事件A发生的概率称为事件A在给定事件B的条件概率,简称A对B的条件概率,记做:;概率公式:互逆:对于任意的事件A,;广义加法公式:对于任意的两个事件A和B,,广义加法公式可以推广到任意有限个事件的并的情形,特别地:减法公式:——→;乘法公式:P(AB)=P(A)P(B|A),P(A)≠0;全概率公式:设事件A1,A2,…,An两两互斥,A1+A2+……+An=Ω(完备事件组),且P(Ai)>0,i=1,2,…,n则对于任意事件B,有:;贝叶斯公式:条件同上则对于任意事件B,如果P(B)>0,有:;随机变量及其分布随机变量:取值带有随机性,但取值具有概率规律的变量离散型随机变量:取值可以逐个列出数学期望:定义:,以概率为权数的加权平均数;性质:Ec=c(常数期望是本身)E(ax)=aEx(常数因子提出来)E(ax+b)=aEx+b(一项一项分开算)方差:定义:;性质:Dc=0(常数方差等于0)D(ax)=a2Dx(常数因子平方提)D(ax+b)=a2Dx公式:(方差=平方的期望-期望的平方);常用随机变量:0-1分布:随机变量X只能取0,1这两个值;X~B(1,p);Ex=p Dx=p(1-p)二项分布:分布律:;X~B(n,p)Ex=npDx=np(1-p)适用:随机试验具有两个可能的结果A或者,且P(A)=p,P()=1-p,将次贝努里试验重复n次。泊松分布:分布律:,λ>0X~P(λ)Ex=λDx=λmkmk设X是一个连续型随机变量:X的均值,记做μ,就是X的数学期望,即μ=EX;X的方差,记做DX或,是的数学期望,:X的标准差,记做σ,是X的方差的算术平方根,即;常用连续型随机变量:名称分布律或密度记法EX期望DX方差均匀分布EMBEDEquation.3指数分布,λ>0正态分布μ标准正态分布X~N(0,1)01正态分布的密度曲线y=P(x)是一条关于直线x=μ的对称的钟形曲线,在x=μ处最高,两侧迅速下降,无限接近X轴;σ越小大,曲线越高扁。标准正态分布的密度曲线y=φ(x),是关于Y轴对称的钟形曲线。随机变量的标准化(减去期望除标差)。标准化定理:设。二维随机变量:用两个随机变量合在一起(X,Y)描述一个随机试验,(X,Y)的取值带有随意性,但具有概率规律,则称(X,Y)为二维随机变量。X,Y的协方差:cov(X,Y)=E[(X-EX)(Y-EY)]=E(XY)-EXEY,cov(X,Y)>0说明X与Y之间存在一定程度的正相关关系,cov(X,Y)=0称X与Y不相关,cov(X,Y)<0说明X与Y存在一定程度的负相关关系;X,Y的相关系数:,取值范围是,越接近1,表明X与Y之间的正线性相关程度越强,越接近于-1,表明X与Y之间的负线性相关程度越弱,当等于0时,X与Y不相关。随机变量的线性组合:E(aX+bY)=aEX+bEy;决策准则与决策树:决策:对不确定的因素进行估计,从几个方案中选择一个决策三准则:极大极小原则:将各种方案的最坏结果(极小收益)进行比较,从中选择极小收益最大的方案;最小期望损失原则:选择期望损失最小的方案;最大期望收益原则:选择期望收益最大的方案。决策树:使我们把不确定因素的过程以图解的形式表示出来,有简单、直观的优点。抽样方法与抽样分布抽样基本概念:总体:研究对象的全体;个体:组成总体的每一个个体;抽样:从总体中抽取一部分个体的过程;样本:从总体中抽出的一部分个体构成的集合;样本值:在一次试验或观察以后得到一组确定的值;随机样本:①.个体被抽到的可能性相同②.相互独立③.同分布。抽样方法:简单随机抽样:总体中有n个单元,从中抽取r个单元作为样本,使得所有可能的样本都有同样的机会被抽中。有放回抽样的样本个数为;无放回抽样的样本个数为。系统抽样:将总体单元按照某种顺序排列,按照规则确定一个起点,然后每隔一定的间距抽取样本单元。分层抽样:在抽样之前将总体划分为互不交叉重叠的若干层,然后从各个层中独立地抽取一定数量的单元作为样本。整群抽样:在总体中由若干个总体单元自然或人为地组成的群体称为群,抽样时以群体为抽样单位,对抽中的各群的所有总体单元进行观察。抽样中经常遇到的三个问题:抽样选取不当无回答处理无回答常用的方法注意调查问卷的设计和加强调查员的培训进行多次访问替换无回答的样本单元对存在无回答的结果进行调整抽样本身的误差抽样分布与中心极限定理:不包含任何未知参数的样本函数称作统计量常用的统计量:样本均值:样本方差:样本标差:统计量的分布叫做抽样分布,当样本容量n增大时,不论原来的总体是否服从正态分布,其样本均值都将趋向于正态分布,当n≥30时,样本均值就可以近似的服从正态分布。中心极限定理:设随机变量X1,X2,……Xn独立同分布,且EXi=μ,DXi=σ2,i=1,2,……n,;==μ设随机变量X1,X2,……Xn独立同分布,且EXi=μ,DXi=σ2,i=1,2,……n,则;;设随机变量X1,X2,……Xn独立同(0,1)分布,则,且。常用的抽样分布样本均值的抽样分布:总体均值、方差抽样方式样本的期望样本方差有限总体重复抽样μ有限总体不重复抽样μ无限总体任意μ若有限总体不重复抽样<5%时,其修正系数近似为1,样本均值的方差可以简化为。样本比例的抽样分布:总体比例抽样方法EPDP无限总体任意有限总体有放回抽样有限总体无放回抽样若有限总体无放回抽样<5%时,其修正系数近似为1,样本比例的方差可以简化为。三种小样本的抽样分布:名称统计量记法上α分位点χ2分布χ1,χ2……χn分布χ2~χ2(n)分布X~N(0,1),Y~χ2(n)X,Y相互独立F分布,U,V相互独立,几种重要统计量的分布:设X~N(μ,σ2),X1,X2,……Xn是X的样本,样本均值,样本方差分布:χ2分布:;设X1,X2,……Xn是的样本,Y1,Y2,……Yn是的样本,并且都相互独立,则:;;参数估计参数估计:设总体分布中含有未知参数θ,从总体中抽取一个样本X1,X2,……Xn,用来估计未知参数θ的统计量(X1,X2,……Xn)称为参数θ的一个估计量,若X1,X2,……Xn是样本的一组观察值,则(X1,X2,……Xn)称为参数θ的一个点估计值。估计量的评价标准:无偏性:设是总体中未知参数θ的估计量,若则称是θ的无偏估计量。样本均值是总体均值μ的无偏估计量,;样本方差S2是总体方差σ2的无偏估计量,ES2=σ2。有效性:θ的方差最小的无偏估计量称为θ的有效估计量;正态总体的样本均值是总体均值μ的有效估计量。一致性:若当样本容量增大时,估计量的值越来越接近未知参数θ的真值,则称是θ的一致估计量。样本均值方差是总体均值方差的一致估计量。总体均值的区间估计:设θ是总体分布中的未知参数,X1,X2,……Xn是总体的一个样本,若对给定的α(0<α<1),参在两个估计量1(X1,X2,……Xn)和2(X1,X2,……Xn),使,则称随即区间(1,2)位参数θ的置信度位1-α的置信区间。α称为显著水平。意义:随机区间(1,2)包含θ真值的概率是1-α总体均值的置信区间(置信度1-α)总体分布样本量σ已知σ未知正态分布大样本正态分布小样本非正态分布大样本总体比例的区间估计:总体比例的置信区间(置信度1-α)样本量抽样方式置信区间大样本有放回抽样无放回抽样两个总体均值之差的置信区间(置信度1-α)总体分布样本量σ已知σ未知正态分布大样本用S1代替σ1用S2代替σ2正态分布小样本非正态分布大样本用S1代替σ1用S2代替σ2大样本,两个总体比例之差()的置信区间,置信度(1-α):样本容量的确定(置信度1-α):抽样方式置信区间允许误差样本容量有放回抽样(或抽样比<5%)总体均值总体比例不放回抽样总体均值先算出有放回抽样的样本容量n0;然后:总体比例假设检验假设检验的基本概念:小概率原理:小概率事件在一次试验中很难发生,但并不意味着绝对不会发生。对总体参数的取值所作的假设,称为原假设(或零假设),记做H0;原假设的对立假设称为备选假设(备择假设),记做H1。犯“H0为真,但拒绝H0”这种错误的概率α称为显著水平;这种错误称为第一类错误(弃真错误);“H0不成立,但接受H0”的这种错误称为第二类错误;犯这种错误的概率记做β。用来判断是否接受原假设的统计量称为检验统计量。当检验统计量取某个范围D内的值时,我们拒绝原假设H0;这是D称为拒绝域;拒绝域的边界点称为临界点。假设检验的基本思想:先假定H0成立,在这个前提下用样本数据进行推导、计算,如果导致小概率事件发生,择拒绝H0,否则就接受H0。当检验的统计量~N(0,1)时:H0:μ=μ0H1:μ≠μ0双假检验:H0:μ=μ0H1:μ<μ0左侧检验:H0:μ=μ0H1:μ>μ0右侧检验:假设检验的五个步骤:提出原假设与备选假设原则:1、把含有等号的式子作为原假设;2、从样本做出猜测而希望证实的问题作为备选假设选取统计量。通过选取适当的统计量来构造小概率事件按P(拒绝H0/H0真)=α确定拒绝域计算统计量的值做出判断:当样本值落在拒绝域内,小概率事件发生,拒绝H0;当样本值不落在拒绝域内,小概率事件没发生,接受H0。总体均值的假设检验:已知条件H0H1检验统计量及其分布拒绝域X~N(μ,σ2)σ=σ0,已知μ=μ0,或大样本μ=μ0μ≠μ0μ<μ0μ>μ0X~N(μ,σ2)σ未知,小样本μ=μ0μ≠μ0μ<μ0μ>μ0三、总体比例的假设检验:已知条件H0H1检验统计量及其分布拒绝域大样本两个总体均值比例之差的假设检验:已知条件H0H1检验统计量及其分布拒绝域,σ1,σ2已知,或大样本μ1=μ2μ1≠μ2(设)μ1<μ2μ1>μ2,σ1,σ2未知,或小样本μ1=μ2μ1≠μ2μ1<μ2μ1>μ2大样本相关与回归分析相关分析:线性相关:数量的关系近似线性函数;正线性相关:变量是同向变化;负线性相关:变量是反向变化;非线性相关:变量的关系近似非线性函数;完全相关:变量是函数关系;完全线性相关:变量的关系是线性函数;完全非线性相关:变量的关系是非线性函数;不相关:变量之间没有任何规律。协方差:总体相关系数:样本相关系数:一元线性回归:若对控制变量X的每一个确定值,随机变量的数学期望存在,则此数学期望是X的函数,称为Y关于X的回归函数,记做:μ(X);若一元回归函数是线性幻术,则称为一元线性回归(回归直线);回归直线:,其中称为斜率,称为截距。总变差平方和=剩余平方和+回归平方和SST=SSE+SSR总变差平方和:Y1,Y2,……Yn的分散程度;回归平方和:X1,X2,……Xn的分散性引起的Y1,Y2,……Yn的分散程度;剩余平方和:其他因素引起的分散程度。 判定系数:最小二乘法:是使因变量的观察值yi与估计值的SSE(剩余平方和)达到最小来求得a和b的方法;即:。估计标准误差:判定系数的意义:0≤r2≤1SSE意义r2=1SSE=0,观察点落在回归直线上,X,Y完全线性相关r2→1SSE→0,观察点接近回归直线,X,Y高度线性相关r2=0SSE=SSTX的变化与Y无关,无线性相关关系给定,置信度为1-α,的预测区间与的置信区间:的点估计:的预测区间:;的置信区间:。多元线性回归和非线性回归:多元线性回归:可线性化的非线性回归:名称方程变量代换线性回归双曲函数对数函数幂函数多项式函数,,……,时间数列分析时间数列的对比分析:现象在各个时间上的观察值称为发展水平(规模和发展的程度);各个时期发展水平的平均数称为平均发展水平(序时平均数);序时平均数:绝对数时期数列:算术平均法绝对数时点数列:首末折半法其中:是时间间隔长度如果,则:相对数或平均数时间数列的序时平均数:时间数列的速度分析:增长量=报告期水平-前期水平;逐期增长量=报告期水平-前期水平;累计增长量=报告期水平-固定基期水平;发展速度=;环比发展速度=;定基发展速度=;增长速度=;环比增长速度=;定基增长速度=;平均增长量=各个逐期增长量的算术平均数=;平均发展速度=各环比发展速度的几何平均数;水平法:累积法:(查表)平均增长速度=平均发展速度-1;长期趋势分析及预测:影响时间数列的因素T:长期趋势S:季节变动C:循环变动I:不规则变动时间数列的模型:乘法模型:Y=T×S×C×I加法模型:Y=T+S+C+I;混合模型移动平均法:适当扩大时间间隔,逐期移动,算出移动平均趋势率,消除短期波动(偶数要算两次);线性模型法:把时间t做自变量,把发展水平Yt做因变量,用最小二乘法得趋势直线方程。季节变动分析:季节变动得测定:按月(季)平均法;计算同月(季)平均数(消除随机影响)计算总月(季)平均数()计算季节指数()四季季节指数之和=400%平均数=100%全年指数的和=1200%平均数=100%趋势剔除法:先消除趋势变动,再计算季节指数;算出四季(或全年)的移动平均趋势T;计算(%),消除趋势变动将按月(季)重新排列,计算同月(季)平均数季节变动的调整:算出(消除季节
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建设工程合同模板购销合同
- 临时铺面合同模板
- 国企承包农田合同模板
- 小区疫情防控消杀合同模板
- 政府工程施工合同模板
- 农业工具转让合同模板
- 中标合同和项目合同模板
- 油轮航次租船合同模板
- 工厂做饭阿姨合同模板
- 政府水毁合同模板
- 公司电梯安全总监、电梯安全员岗位职责
- 物业保洁员劳务合同2篇
- 国有土地上房屋装修备案申请表
- 二年级上册音乐课件《小红帽》(人音版)
- 2023年中级经济师考试真题及答案
- 重庆建筑工程资料全套表格年
- GB/T 23221-2008烤烟栽培技术规程
- GB/T 18284-2000快速响应矩阵码
- GB/T 16900-2008图形符号表示规则总则
- 辽宁省辽南协作校2022-2023学年高二上学期期末考试语文答案 Word版含解析
- 中职英语统考复习讲课教案
评论
0/150
提交评论