应用统计学贾俊平版综合复习提纲_第1页
应用统计学贾俊平版综合复习提纲_第2页
应用统计学贾俊平版综合复习提纲_第3页
应用统计学贾俊平版综合复习提纲_第4页
应用统计学贾俊平版综合复习提纲_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

zYYiYzYYiYnk总体均值的置信区间(正态总体,数率xixi1xix1xnifiiffiffnnxi1mi2nxx2nxxfifmVrfi1nkiiii2s2xixnnks2i1sniiii1nx)21fn1fi2)s2tiki1nSST(yi1r1rxix离散xix离散ixsFt1Ytk1Ytk2kkYiYiYYt1Y0Yxz2xnz2stnpz2p(1p)2pznnN22212(z(z2)22E容量容量n(z2)2(12Enn0/xs/0t0n00)xnz2加权平均指数销售Iqyi)22n20销权p0q0Ip2计标准误差seYt线性关系检验量SSR1SSEn2?F~F(n2)MSA=SSA/k-1SSR1SSEn2?ti~t(ti~t(n2)相关系数trn2~t(n2)i n nYnn率GAGA(Yi)mnYi1ii比预测误差n2.描述统计:研究数据收集处理汇总图表描述概括与分析等统计方测ninn2Fi2MSEn1Yt)1Yt)2t1ti1上收集到的数据,这类数据按时间顺序13.总体:包含所研究的全部个体(数据)的集合。。。24.调查数据:通过调查方法获得的数据25.实验数据:通过实验方法获得的数据26.概率抽样:随机抽样,遵循随机原则进行的抽样,总体中每个单位27.非概率抽样:不随机,根据研究目的对数据的要求,采用某种方式。28.简单随机抽样:从包括总体的N个单位的抽样框中随机,一个个抽可缺.分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然.整群抽样:总体中若干单位合并为组,群,抽样时直接抽取群,然.系统抽样:总体中所有单位按顺序排列,在规定范围内随机抽取一。.多阶段抽样:首先抽取群,再进一步抽样,从选中的群中抽取出若.判段抽样:研究人员根据经验,判断研究对象的了解,有目的选择.自愿样本:被调查者自愿参加,成为样本中一分子,向调查人员提.配额抽样:将总体中所有单位按一定的标志分若干类,然后每类采42.抽样误差:由于抽样的随机性引起的样本结果与总体真值之的误43.非抽样误差:相对抽样误差而言,除抽样误差之外的,由于其它原44.抽样框误差:统计推论的错误是由于抽样框不完善造成的47.比例:一个样本(或总体)中各个部分的数据占全部数据比值。48.比率:一个样本(或总体)中各不同类别数据之间的比值。到的频数。.数据分组:根据统计研究需要,将原始数据按某种标准化分成不同2.组距是一个组的上限与下限的差55.组中值=下限值+上限值/2上下限的中间值56.直方图:用矩形的宽度和高度(即面积)来表示频数分布的图形。58.箱线图:由一组数据的最大值、最小值、中位数和两个四分位数559.集中趋势:指一组数据向某一中心值靠拢的程度,反映一组数据中63.平均数:又称均值,是全部数据的算术平均值64.简单平均数:未经分组数据计算的平均数称为简单平均数。根据分65.几何平均数:是n个变量值乘积的n次方根。常用于比例数据的平66.异众比率:指非众数组的频数占总频数的比例.69.平均差:也称平均绝对离差,它是各变量值与其平均数离差的绝对72.标准分数:也称标准化值或z分数,某个数据与其平均数的离差74.偏态:对数据分布对称性的测度。测度偏态的统计量偏态系数。75.偏态系数:对数据分布不对称性的度量值。76.峰态:对数据分布平峰或尖峰程度的测度,测度峰态的统计量则是77.峰态系数:对数据分布峰态的度量值。的事79.必然事件:在同一组条件下,每次试验一定出现的事件。80.不可能事件:在同一组条件下,每次试验一定不出现的事件。81.基本事件:如果一个事件不能分解成两个或更多个事件,则这个事83.主观概率:对一些无法重复的试验,确定其结果的概率只能根据经84.条件概率:当某事件B已发生,求事件A发生的概率,称为事件B下事件A发生的条件概率。88.连续型随机变量:可以取一个或多个区间中任何值的随机变量。89.期望值、数学期望:随机变量的平均取值,各可能值与对应概率乘全积分为196.渐近分布:当n比较大时,用极限分布作为抽样分布的一种近似,.估计量:用来估计总体参数的统计量的名称计误差组成计。概率通常记为。。果计算得到的,并据以对原假设和备统计量由就越充分。双侧P<0.025单侧p<0.05拒绝原假设。指备择假设具有特定的方向性,并含指备择假设没有特定的方向性,并含有符号“”的假设检验。观察值分布称为条件分布,每个具体总体的不同类别中分别抽取,研究目量之间是否存在联系的问题,两组或联,就称为独立。这类问题的。水平或处理131.总平方和:反映全部数据误差大小的平方和,记为SST。自变量效应;n-k平方和,记为SSA。自变量效应或因子效应;k-1137.双因素方差分析:方差分析中涉及两个分类型自变量时,称为~划140.完全随机化设计:将k种处理随机地指派给试验单元的设计。水平则将试验单元划分为若干同质组,区145.函数关系:设两变量x,y,变量y随x一起变化,并完全依赖于x,当变量x取某数值时,y依确定关系取相应的值,则称y是x的函数,记为y=f(x).析方法149.回归模型:描述因变量y如何依赖于自变量x和误差项的方程。150.回归方程:描述因变量y的期望值如何依赖于自变量x的方程。151.估计的回归方程:用样本统计量代替回归方程中的未知参数,根据iyi之间的离差平方和达到最小来求得之间的离差平方和达到最小来求得0和1的方法。154.回归平方和:y的总变差中由于x与y之间的线性关系引起的y的变化部分,它是可以由回归直线来解释的yi变差部分。xyy变差的作用,是不能由回归直线解释的yi的变差部分。2156.判定系数:回归平方和占总平方和的比例,记为R.估计量的标准误差:均方残差(MSE)的平方根,用se来表示。实际意义反映了用估计的回归方程预测因变量y时的预测误差的大测越准确,从另一个角度求出y的平均值的一个估计值E(y0)。求出y的一个个别值的估计值0。之差,用e表示。163.标准化残差:残差除以它的标准差后得到的数值用Ze表示。164.异常值:在散点图中,如果某一个点与其它点所呈现的趋势不相吻合烈的影响,那么该观测值或这些观测值就是~元回归中,回归平方和占总平方和的比例。171.多重共线性:当回归模型中两个或两个以上的变量彼此相关时,则称回归模型中存在~察值之比减1后的结果,用%表示。观察值与前一时期观察值之比减1,说明现象观察值之比减1,说明称环比发展速度)的几何平均数减1后结果。184.增长1%绝对值:增长率每增长一个百分点而增加的绝对数量。185.简单平均法预测:根据过去已有的t期观察值通过简单平均来预测该方法使得第t+1期的预测值等于t期的实际观察值与第t期指变值率逐渐降低,最终以K为增长极限。数。。销售量固定在报告期,不同时期的指。原信息重新加工整理,使之成为我们进行统计分析可以使用的数据,则我们把它们称为间接来源的数据。,本低,专业要求不很高。概率抽样依据随机原则的抽样框,设计好的调查问卷,调查过程的质量通过浏览数据发现一要的交叉表重不漏直方图用面积表示各组频数的多少,矩形的高度率,宽度则表示各组的组距,高宽均有意义。其续性,直方图的各矩形通常是连续排列,而条形后条形图主要用于展示分类数据,直方图主要用于环形图中空洞,样本或总体中每一部分用环中的一位数Me是数据中间位置上值,平均数是全部数据的算术平均。左偏XMe<Mo数据量较多时才有意义,数据量少时的,利用了全部数据信息,应用广泛,数据呈对称或接近对称分布时3时选择平均数作为集中趋势代表值,其主要缺点经验法则:一组数据对称分布时,约有68%的数据在平均数1个标准差切比雪夫不等式:不对称75%2个标准差89%3个944个1-1/k2能性相等,则某一事件A发生概率为该事件所包含的基本事件数m与样本空间中所包含的基本事件数n的比值。则比值m/n称为事件A发生的频率。随着n的增大,该频率围绕某一常数p上下波动,且波动的幅度逐渐减小,趋于稳定,这个频率的稳定值分布为二项分布。试验包含了n个相同的试验;每试验只有两个可能结果成或败;出现成或败的概率对每一次试验相同,且成败和为1;试验数,即试验结果对应一个离散型随机变量,具有上述特征的n次重复独立试验为n重贝努力试验。曲线相对x=μ对称,在x=μ处最大值f(μ)=1/2σ(3)曲线陡缓独立性和互斥性的关系:互斥事件一定是相互依赖(不独立)的,但相斥的。不互斥事件可能是独立的,也可能是不验样本量为n的样本,当n充分大时,样本均值X的抽样分布近似服从均区间是随机包含真值,有5次找到的区间不包真值。评价估计量的标准:无偏有效一致性正态分布2两随机样本独立地分别抽自两总体。H0和备择假设H12确定适当的检验统计量3确定显著性水平α和临界值及拒绝域4根据样本数据计算检验统计本对总体进行某种推断,然而推断是样本统计量估计总体参数的方法,总体在参数假设检验中,则是先对μ的值提出。。方;3.将平方(f0-fe)2结果除以fe;4将3的结果加总。有所不同,如果在各类别中分别进行,属于拟合未分类,抽取样本后根据研究内容分类形成列联表假设的内容有差异,似~通常假设各类,而独立性检验中,原假设则假设两个变计算期望频数时,在拟合优度检验中利用原假频数乘以期望概率,直接得到期望频数,如果变量的分类是独立的,因而两个水平的联合概列联表,相互独立时c=0,不可能大于1,最大值依赖于列联表的行数误差分解:总误差(SST)=组内误差(SSE)+组间误差(SSA)H1:u1,u2…不全相等两比烦销,增大犯I类错误的概率,降低置信水平。方差分析是同时考虑1)计算各样总平方和组本均值2)计算全部观测值的总均值3)计算各误差平方和间平方和组内平方和4)计算统计量3.统计决策4.方差分析表5.方差x取某个值时,变量y的取值可能有几个,这种关系不确定的变量显然用函数关系进行描述,但变量之间存在一定的规律。相关与回归分度如何,样本所反映的变量之间关系能否代表总体~?r|=1y取值完全依赖于x,两者函数关系,r=0,y取值与x无关,两者不存在线性相关关系(2)对称性rxy=ryx(3)r大小与xy原点及尺度无关(4)仅是线性关系度量(5)xy线性关系的度量但非因果关系高0.8中0.5低0.3不察样本相关系数的可靠性,就是显著性检验。ρ较大正值r左偏,ρ接近0,样本量n很大,才能认为r接近正态分布的随机变量。tr回归分析的内容:~t(n2)r3进行决策|~t(n2) (1)从一组样本数据出发,确定出变量之间的数学关影响显著不显著。(3)利用所求重复抽样中,x取值固定非随机的。(3)误差项是期望0的随机变量误差项服从正态分布随机变量且独立,即~N(0,σ2)最小二乘法的原理:距离各观测点最近的一条直线,用它来代表x与y最小二乘法拟合直线的性质:(1)使离差平方和达到最小(2)可以知β1估计量的抽样分布(3)在某些条件下β0,β1的最小二乘估计量同其它相比,抽样分布具有较小的标准差。总平方和(SST)=回归平2判定系数R=SSR/SST:计算A对B回归的判定系数R2%可以由A与B之间的线性差系来解释。2线性相关检验的目的:检验自变量x与因变量y之间的线性关系是否显显著(2)计算统计量 (1)提出假设H0:β1=0两个变量之间的关系不F=MSR/MSE(3)作出决策F>Fa拒绝。说明线性关系检验自变量对因变量的影响是否显著。β

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论