版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、下限公式:她北+京xd;上限公式:如河-二一xd,其中,l为众数所在组2+%统计学各章计算题公式及解题方法第四章数据的概括性度量1.组距式数值型数据众数的计算:确定众数组后代入公式计算:下限,u为众数所在组上限,人为众数所在组次数与前一组次数之差,%为众数所在组次数与后一组次数之差,d为众数所在组组距nfln2 .中位数位置的确定:未分组数据为;组距分组数据为一12(二”卜n为奇数3 .未分组数据中位数计算公式:二理/、匕(q+工和),II为偶数4 .单变量数列的中位数:先计算各组的累积次数(或累积频率)一根据位置公式确定中位数所在的组一对照累积次数(或累积频率)确定中位数(该公式假定中位数组
2、的频数在该组内均匀分布)5 .组距式数列的中位数计算公式:6.7.8.9.10.11.下限公式:叫二十?fxd;上限公式:二!/所在组的频数,为中位数所在组前一组的累积频数,累积频数四分位数位置的确定:未分组数据:简单均值:加权均值:中值几何均值四分位差异众比率fmxd,其中,加为中位数s帝+1为中位数所在组后一组的下四分位数:Ql学,“彳;组距分组数据:上酚图:。产子史木叶.B龙A-ftflH_工凯孙(用于计算平均发展速度)(用于衡量中位数的代表性)(用于衡量众数的代表性)下四分位数;(?工=:上酚圜:?u=t4,其中,瓦,瓦皿为为各组组:量=H二口*)丑=、口;=:上:12 .极差:未分组
3、数据:R二血。1(注)一拒觊(动;组距分组数据R三最高组上限-最低组下限13 .平均差(离散程度):未分组数据:二迫则;组距分组数据:此之直也也14 .总体方差:未分组数据:/二壁上土分组数据:/二坛也如界并坪A-口跖阳i-曲15 .总体标准差:未分组数据:y,,:;分组数据:;16 .样本方差:未分组数据:sL=垣3;分组数据:式二n2f!l胃771-117 .样本标准差:未分组数据:乳-1二/;分组数据:571T二J上-T|限一118 .标准分数:I;=一1SS19.离散系数:内二-7第七章参数估计1.的估计值:置信水平aa290%0.10.051.65495%0.050.0251.969
4、9%0.010.0052.582.不同情况下总体均值的区间估计:总体分布样本量(T已知(ttH正态分布大样本(n30)(TI+Zn-一2VnSX+Zn-一彳诉小样本(n30)gD统计量已知了一如1=匚X了一如2-拒绝域团5/v-0Z2,ffP值决策P拒绝H口2.总体均值检验(/未知,小样本,总体正态分布)假设双侧检验左侧检验右侧检验假设形式“:U=蜘H:U*如比:JlgD统计量CT已知曾一曲2zz“诉殳/百拒绝域id1)tt,a(n-1)P值决策PU拒绝H0注:1已知的拒绝域同大样本3.一个总体比例的检验(两类结果,总体服从二项分布,可用正态分布近似)(其中所为假设的总体比例)假设双侧检验左侧
5、检验右侧检验假设形式%n=oHj;口Hdinir0为:nuD统计量p一峋2=.师(1-丽)Qn拒绝域kl5P值决策PMet,拒绝H口4.总体方差的检验(7,检验)假设双侧检验左侧检验右侧检验假设形式WD:d一礁Ha!O2工琥%:oo8-i0。)若统计量(n-l)s2*崂拒绝域1代)总式靠一。产这山式盘一1)11屋.叫5-1)1P值决策PGC,拒绝H口5.Z统计量的参考数值CE0.10.050.01双侧检验士1.65士1.96士2.58单侧检验1.282.652.33第九章列联分析1.期望频数的分布(假定行变量和列变量是独立的)一个实际频数Gj的期望频数叼,是总频数的个数乘以该实际频数G落入第i
6、行和第j列的概率,即:匕;=小,)14)二2.统计量(用于检验列联表中变量间拟合优度和独立性;用于测定两个分类变量之间的相关程度十二乙咛叱,自由度为(rT)(cT),后为列联表中第i行第j列的实际频数,与;为列联表中第i行第j列的期望频数1)检验多个比例是否相等检验的步骤提出假设H):n=窕=n;H:ni,北,兀不全相等;计算检验的统计量;进行决策:根据显著性水平a和自由度(r-1)(c-1)查出临界值父;,若/:姨,拒绝H0;若胃噂,不拒绝H02)利用样本数据检验总体比例是否等于某个数值检验的步骤提出假设H:JU=,J12=,;H:原假设的等式中至少有一个不成立;计算检验的统计量;进行决:根
7、据显著性水平a和自由度(r-1)(c-1)查出临界值2c2;若/姨,拒绝H0;若胃,不拒绝修3) 检验列联表中的行变量与列变量之间是否独立检验的步骤提出假设行变量与列变量独立;H:行变量与列变量不独立;计算检验的统计量;进行决策:根据显著性水平口和自由度(r-1)(c-1)查出临界值已若胃孝拒绝若/,不拒绝H3 .中相关系数:测度2M2列联表中数据相关程度;对于2M2列联表,中系数的值在01之间W=其中,n为实际频数总个数,即样本容量4 .列联相关系数(C系数)用于测度大于2父2列联表中数据的相关程度二其中C的取值范围是0CFk则拒绝原假设H口,表明均值之间的差异是显著的,所检验的因素对观察值
8、有显著影响iii.若FF小则不拒绝原假设H,不能认为所检验的因素对观察值有显著影响3)单因素方差分析表的结构:方差分析基导源55(平方和)就(自由度)W5(均方JFCF值)F-value值)FcrittF称界值)名目间(EISSSAM5ASSA(-|上-IF-钻出如出蛆内(深差)SSExr1ep3JrtJn-k其中,口为至都我则值的个就,k为因素水平(体)的个数总计SST=SSA+SSEnrk一一2 .方差分析中的多重比较(步骤):采用Fisher提出的最小显著差异方法,简写为LSD1)提出假设:跖:依二W(第个总体的均值等于第才个总体的均值)张:的工内(第.个总体的均值不等于第个总体的均值)
9、2)计算检验统计量:用一号3) 计算LSD:LSD二九+4) 决策:若I取一句|alsd,则拒绝耳;若昆一到LSD,则不拒绝可3 .双因素方差分析:1)无交互作用的双因素方差分析表结构:方差力折差异源5S设辟平方和At自由席tits玲FFigF-alae唯FeratF临界值行SSJ?113一M5RFMSE蛤出给出列SSCr-1洽出给出jlQti一r-1遑差SSE(if-liKlr-l(i-ljXfr-lj其中,%为行因耒水平小数,水平个数F为利因素总计55T=S5R+SSC+SSEfcr-12)有交互作用的双因素方差分析表结构:4.力差分析差异源SS甲方和df自由度MS的有FF值F=value
10、F值FtritF临畀值样本(行)SSR4-1K1_由R一MSE给出给出列r-1SSCMSC=-r-1_二一H5E给出给出交互费七MSRC-55RCM3贪t给出给出(c-55E0二-M5E内邰联差)总计所=+SSG-SSRC-55EArrlm-1)元一1具中,m为行笠里中带一个水平件革)的行救关系强度测量:变量间关系的强度用自变量平方和(SSA)及残差平方和(SSE)占总平方和(SST)的比例大小来反映,根据标平方根R进行判断组间平方和)一陶(总平方和)第十一章一元线性回归1 .样本的相关系数:E(x-r)y-y)鞭盯-Emy小(#一/工-势*/产d黑户也*(Zyp2 .相关系数的显著性检验步骤
11、:1)提出假设:H口:p=0;pH。2) 计算检验统计量:t二上|、上-zt(n-2)3)确定口并决策:匕,拒绝H口;不拒绝从3 23. 一元回归模型:产儿+SM+E4. 一元线性回归方程形式:Eg=口+员,其中瓦,是直线方程在y轴上的截距,是当=0时,y的期望值;及是直线的斜率,称为回归系数,表示当J每变动一个单位时y的平均变动值5. 一元线性回归中,估计的回归方程:f二瓦+6口,其中房是估计的回归直线在y轴上的截距,良是直线的斜率,它表示对于一个给定的j的值,f是y的估计值,表示当I每变动一个单位时y的平均变动值6.7.8.9.根据最小二乘法求以及肉的公式:|熊蜜=.璋一U#】误差平方和之
12、间的关系:能以一了尸与乙色一歹+第5一自尸,即:S(国平方和)=SSR(回归平方和)+SSE(残差平方和判定系数(回归平方和占离差平方和的比例):R二坦二争星二1一争生”估计标准误差(实际观察值与回归估计值离差平方和的均方根):10 .线性关系的显著性检验:1)提出假设:/;Pi=o,线性关系不显著;瓦:氏*0,有线性关系2)计算检验统计量:二1二二二一:3)确定显著性水平Q,并根据分子自由度1和分母自由度n-2找出临界值匕4)决策:若?元,拒绝%F5指颤;HI不拒绝为12 .置信区间估计:E(%)在1-a置信水平下的置信区间:备土片2仇2)为其中,Sy为估计标准误差,(n2)为八四的自由度1
13、3 .预测区间估计:弟在1-a置信水平下的预测区间:14 .回归分析表的结构:MultipleRRSquare相关系数R划定系数胪AdjustedRSquare调整的判定系数标难误差Sy妮则值nSUMMARYOUTPUT回归统计特别地,卢=含方差分析dfS3MSFSiinificanceF回回分析1SSRMSR=学打SR=斯Pf6-用于决策残差n-2SSESSEXSE=二n-2总计n-1SSTCoefficients标隹误差tStatP-valueLo*er95期Upper95%Intercept线距%修计里P值毂距95W的置信医商XVariable1房,斜率咽土统计里唯斜率95%的置信区间1
14、5 .几点说明:1)判定系数测度了回归直线对观测数据的拟合程度,若所有观测点都落在直线上,残差平方和SSE=QR:=1,拟合是完全的2)在一元线性回归中,相关系数r实际上是判定系数不的平方根3)相关系数r与回归系数良是同号的第十三章时间序列预测和分析1 .环比增长率:报告期增长率与前一期水平之比减1:G士A,n)2 .定基增长率:报告期水平与某一固定时期水平之比减1R=4-1=2,A,n),其中,无表示用于对比的固定基期的观察值3 .平均增长率:序列中各逐期环比值(也称环比发展速度)的几何平均数减1后的结果(描述现象在整个观察期内平均增长变化的程度)3令A唔-TQ诔示平腐长强n为附岫个数1)当
15、时间序列中的观察值出现0或负数时,不宜计算增长率2)在有些情况下,不宜单纯就增长率论增长率,要注意增长率与绝对水平的结合分析4 .时间序列预测的步骤:1)确定时间序列所包含的成分,也就是确定时间序列的类型2)找出适合此类时间序列的预测方法3)对可能的预测方法进行评估,以确定最佳预测方案4)利用最佳预测方案进行预测5 .均方误差:通过平方消去正负号后计算的平均误差,用MSEfl示MSE”弋一句,其中X为观测胤E为预测值6 .简单平均法:根据过去已有的t期观察值来预测下一期数值。设时间序列已有的其观察值为L%“%,则t+i期的预测值耳柩为:t之广物+匕+a+%)=;JXt=i有了t+的实际值,则预
16、测误差为:如二电1一3t+2期的预测值为:1九13=由&+巳+A+七+Q加由L11IIJL7 .简单移动平均法:将最近k期的数据加以平均,作为下一期的预测值设移动间隔为k(1kt),则t期的移动平均值为:p_%后,+七+1+A+*+%t+1期的预测值为:F+1+y6-好皆+八+匕t+匕预测误差用均方误差表示:8 .指数平滑法(一次):以一段时期的预测值与观察值的线性组合作为t+1的预测值,其预测模型为:冗依二。匕+(1心豆,其中口为平滑系数(0口1,增长率随着时间t的增加而增加,若b0,b0,awo,00,0aw1,0bw12)求解系数方法:i. 将其改写为对数形式:lg?c=lgf+(lga)bcii. 仿照修正指数曲线的常数确定方法,求出:g&、IgH、b;取lg13和IgK的反对数求得。和K令=温明,=既”明,&=国型皿rt-=i-。=(勖则有=一工)品*肉-嗤5第十四章指数1 .简单综合指数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年简化版无财产离婚合同书范例一
- 版分包合同协议
- 上海房产交易合同经典文本
- 抵押房屋的借款合同样本
- 配电箱设备采购合同
- 燃料油买卖合同范本
- 外债借款合同格式
- 别墅建设承包合同
- 弱电安装招标文件样本
- 范本日租房协议合同文本
- 2024年广东珠海水务环境控股集团有限公司招聘笔试参考题库含答案解析
- 2024版国开电大专科《ECEL在财务中的应用》在线形考(形考作业一至四)试题及答案
- 英国文学史及选读试题及答案
- 新国际政治学概论(第三版)-教学课件-陈岳-109503国际政治学概论(第三版)
- 知识产权维权授权书
- 焊接工艺优化与提高焊接效率
- 整理收纳师职业规划
- 工商管理就业去向分析报告
- 2024年度医院心胸外科护士长述职报告课件
- (期末押题最后一卷)期末综合测试预测卷-2023-2024学年六年级上学期科学高频易错期末提高必刷卷(苏教版)
- 博鳌机场控制区证件培训试题 C
评论
0/150
提交评论