大二上学期统计法统计学复习提纲_第1页
大二上学期统计法统计学复习提纲_第2页
大二上学期统计法统计学复习提纲_第3页
大二上学期统计法统计学复习提纲_第4页
大二上学期统计法统计学复习提纲_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1考试的题目类型1.填空题(1分×10空)2.单项选择题(2分×10题)3.多项选择题(2分×5题)判断题(2分×5题)计算题(4题共40分)论述题(10分×1题)2第一章导论3统计学是什么?数据类型?收集、处理、分析、解释数据并从数据中得出结论的科学计量尺度:分类、顺序、数值型收集方法:观测、实验时间状况:截面、时间序列、面板统计分析方法有?描述统计方法(数据收集、处理、汇总、图表描述、概括与分析)推断统计方法(研究如何利用样本数据来推断总体特征)(包括参数估计和假设检验两个组成部分)4第二章数据的收集数据的来源直接来源的方式?调查数据的步骤?抽样的方法?概率抽样方法包括?调查或实验(实验数据不考)概率抽样和非概率抽样方法(区别、优缺点)非概率抽样方法包括?先抽样再对样本数据进行搜集(简单随机抽样、系统抽样、分层抽样、整群抽样、多阶段抽样)特点:样本均是随机选取(方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样)特点:样本并非随机选取渠道?间接和直接(不考)调查数据5数据的搜集搜集数据的方法?数据的误差哪几类?自填式、面访式、电话式(不考)抽样误差:由于抽样的随机性所带来的样本结果与总体均值之间的误差。存在于概率抽样中非抽样误差:由于其他原因造成的样本观察结果与总体真值之间的差异。包括抽样框、回答、无回答、调查员、测量误差。存在于概率抽样和非概率抽样中67第三章数据的图表展示数据的表格表示对分类数据的表格表示分类数据用什么图形表示?顺序数据用什么图形表示?列联表:由两个或两个以上变量交叉分类的频数分布表累积频数分布图环形图(适用于分类和顺序数据):适合于比较两个或多个样本或总体的结构条形图:用宽度相同的条形的高度或长短来表示各类别数据的频数、比例或百分比的图形饼图:用圆形及圆内扇形的角度来表示数值大小的图形对数值型数据的表格表示数据透视表数据的图形表示8数据的图形表示可用什么图形表示数值型数据?直方图:用矩形的面积来表示频数分布的图形(需先将数据分组)茎叶图:用于显示未分组的原始数据的分布,保留了原始数据,但仅能用于小批量数据。箱线图:由一组数据的5个特征值(最大值、最小值、中位数、两个四分位数)绘制而成,它由一个箱子和两条线段组成,用于显示未分组的原始数据的分布线图:用于反映现象随时间变化的特征二维散点图:用于表示两个变量之间的关系的图形。汽泡图:用于表示三个变量之间的关系的图形。雷达图:用于表示三个以上变量之间的关系的图形。910第四章数据的概括性度量数据的集中趋势度量如何度量顺序数据的集中趋势?中位数和分位数(如何计算?)平均数:一组数据的重心,包括算术、加权和几何平均数如何度量分类数据集中趋势?众数(不一定存在,若存在,可能有多个,不受极端值影响)如何度量数值型数据的集中趋势?11数据的离散趋势度量如何度量顺序数据的离散趋势?四分位差:

Qd

=QU–QL极差:

R=max(xi)-min(xi)平均差:方差:(未分组)标准差如何度量分类数据离散趋势?异众比率:度量众数的代表程度如何度量数值型数据的离散趋势?如何度量数值型数据的相对离散程度?离散系数(变异系数):消除了数据水平高低和计量单位的影响,用于对不同组别数据离散程度的比较12数值型数据数据相对位置的度量经验法则经验法则(前提当一组数据对称分布时):68%、95%、99%切比雪夫不等式:对于任意分布形态的数据,至少有1-1/k2的数据落在平均数加减k个标准差之内。其中k是大于1的任意值,但不一定是整数。标准分数标准分:给出了一个值在一组数据中的相对位置,常用在处理不同量纲的数据切比雪夫不等式13偏态与峰态的度量如何度量偏态?偏态系数(无偏=0、左偏\负偏<0、右偏\正偏>0):表征概率分布密度曲线相对于平均值不对称程度的特征数。直观看来就是密度函数曲线尾部的相对长度。总体偏态系数公式:SK=E(X-)3/3如何度量峰态?峰态系数(常峰态=0、尖峰态>0、扁峰态<0)总体峰态系数公式:K=E(X-)4/4-31415第六章统计量及其抽样分布统计量常用的统计量?经验分布函数、样本均值、样本方差、k阶原点矩、k阶中心矩、样本变异系数、样本偏度、样本峰度、次序统计量、极差抽样分布:样本统计量的分布渐进分布:n趋向于无穷大时,统计量的极限分布近似分布:利用计算机随机模拟获得的统计量的近似分布定义?统计量:样本的函数,不依赖任何未知参数抽样分布?由正态分布导出的分布?2、t分布、F分布(掌握定义和差表)16样本比例的抽样分布?当样本容量n充分大(np>5且nq>5)时,样本比例p的抽样分布渐进服从样本均值的抽样分布?中心极限定理:从均值为,方差为2(有限)的一个任意分布(有可能非正态分布)的总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布样本均值之差的抽样分布?样本比例之差的抽样分布?17两个样本方差比的抽样分布?样本方差的抽样分布?1819第七章参数估计参数估计什么是点估计?无偏性有效性一致性估计方法?点估计和区间估计用什么标准评价点估计值的优劣?什么是区间估计?置信区间:通过样本构造总体参数的一个估计区间,该区间具有一定的置信度。(掌握对置信区间置信度的正确含义)20总体均值的置信区间?如何求参数的置信区间?关键是构造随机变量(统计量)(满足:分布已知、包含要求置信区间的参数、统计量中其它量已知)总体比例的置信区间?总体方差2的置信区间?统计量:统计量:统计量:21总体均值1-2的置信区间?(非匹配样本)总体均值1-2的置信区间?统计量:总体均值1-2的置信区间?(匹配样本)统计量:总体方差比12/22的置信区间?22统计量:统计量:样本量的确定给定估计误差,如何求满足该估计误差的样本容量?什么是估计误差?置信区间中以样本均值为中心左右跨越的部分。掌握均值和比例样本容量的计算。(注意:在计算比例的样本容量中,若没有给出样本比例,则样本比例取0.5)2324第八章假设检验假设检验类错误和类错误的定义及关系?错误是拒真错误,错误是纳伪错误步骤?1.提出假设(H0,H1)2.确定适当的检验统计量(确定是哪侧检验)3.规定显著性水平4.计算检验统计量的值并作出统计决策p值的定义及如何利用p值作出统计决策?P值:是当原假设为真时却被拒绝的真实的概率;当p>则接受原假设;p<则拒绝原假设;25检验总体均值?参数检验所使用的检验统计量检验总体比例?检验总体方差2?统计量:统计量:统计量:26检验总体均值1-2?(非匹配样本)检验总体均值1-2?统计量:检验总体均值1-2?(匹配样本)统计量:检验总体方差比12/22?统计量:统计量:2728第九章列联分析分类变量分析什么是列联表?列联表:由两个或两个以上变量进行交叉分类的频数分布表2检验列联分析的方法?2检验解决的问题?变量的拟合优度问题分类变量的独立性问题(关键掌握:如何求fe,2检验为右侧检验)列联相关系数的定义及取值含义?列联相关系数:对品质数据相关程度的度量相关系数、C相关系数、V相关系数取值越大,相关性越强2930第十章方差分析方差分析根据分类自变量的个数可分为?单因素方差分析双因素方差分析多因素方差分析1.所有总体满足正态分布2.所有总体的方差相同3.观测值相互独立什么是方差分析?方差分析:通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。通过分析数据的误差达到判断总体均值是否相等的目的。方差分析的基本假定?31单因素方差分析误差分析?SSA(组间平方和):随机误差和系统误差(df:k-1)SSE(组内平方和):随机误差(df:n-k)SST(总平方和):=SSA+SSE(df:n-1)步骤?给定假设H0:分类变量对数值型变量没有影响H1:分类变量对数值型变量有影响2.检验统计量F=MSA/MSE~F(k-1,n-k)

(采用右侧检验)3.作出决策什么是多重比较?多重比较检验哪些总体均值之间存在差异LSD法思想?检验

H0:i=j;H1:ij统计量:决策:,拒绝H0

,接受H032无重复双因素方差分析方差分析步骤SSR(行平方和):包括随机误差和行系统误差SSC(列平方和):包括随机误差和列系统误差SSE(组内平方和):包括随机误差SST(总平方和):=SSR+SSC+SSE误差分析?给定假设

对行变量

对列变量2.检验统计量F=MSR/MSE~F(k-1,(k-1)(r-1))F=MSC/MSE~F(r-1,(k-1)(r-1))

(采用右侧检验)3.作出决策33可重复双因素方差分析方差分析步骤SSR(行平方和):包括随机误差和行系统误差SSC(列平方和):包括随机误差和列系统误差SSRC(交互作用平方和):包括随机误差和行列交互

作用的系统误差SSE(组内平方和):包括随机误差SST(总平方和):=SSR+SSC+SSRC+SSE误差分析?给定假设

对行变量

对列变量

对行列的交互作用2.检验统计量F=MSR/MSE~F(k-1,kr(m-1))F=MSC/MSE~F(r-1,kr(m-1))F=MSRC/MSE~F((k-1)(r-1),kr(m-1))

(采用右侧检验)3.作出决策34关系的强度单因素方差分析的R2定义?分类变量对数值型变量的影响程度R2(或R)定义?无重复双因素方差分析的R2定义?可重复双因素方差分析的R2定义?R2[0,1],R2越大自变量对因变量的影响越大R2的取值范围和性质?35练习1(1)下面哪种抽样方式属于概率抽样()A.整群抽样B.滚雪球抽样C.方便抽样D.配额抽样(2)某班学生的平均成绩是75分,标准差是5分,如果已知该班学生的考试分数是非对称分布,可以判断成绩在65~85之间的学生至少占(

)90%;B.95%:

;C.75%;D.99%;(3)为估计某地区老年人的比例,要求边际误差不超过0.03,置信水平为90%,抽取的最少样本量为(

)A.751B.752C.589D.590ACB(4)设总体均值为40,方差为9,则100个样本的均值服从或近似服从的分布为(

A.N(40,9)B.N(0.4,9)

C.N(0.4,0.09)

D.N(40,0.09)(5)为估计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论