基础统计复习文件汇编_第1页
基础统计复习文件汇编_第2页
基础统计复习文件汇编_第3页
基础统计复习文件汇编_第4页
基础统计复习文件汇编_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 基础统计复习资料概论统计学中的常用差不多概念总体X 有X1,X2,X3,XN个单元 随机抽取n个组成样本单元:x1,x2,x3,xn则: N总体容量 n样本容量 统计资料整理一、数据的分组、整理写出最大值Xmax、最小值Xmin求出极差d = Xmax Xmin分组,算出组距、组中值据样本的单元数,求出分组数的经验值为:样本单元数40-5050-100100-200200-500500分组数6-87-109-1212-1717-20上限:每一组数据中最大的变量值下限:每一组数据中最小的变量值组距 = 极差分组数 = 上限 下限组中值 = ( 上限 + 下限 ) 2计算频数和频率频数 = 各组

2、分配的统计单元数频率 = 各组单元数占总体单元数的比重 = 频数 各单元数之和(n)作频率分布图例题例:设以不重复抽样方式从1600块面积为0.4公顷的林地所组成的总体中等概地抽取50块林地组成样本,样本各单元的蓄积量值为:1.5010.34.34.1711.18.5011.8.58.811.812.5312.32.78.73.5.17.4105.411.31.6010.75.4.77.64.97.611.24.2.5.32.9605.73.16.77.79.62.94.216.65.84.66.4试进行数据整理解:1. Xmax = 16.6 Xmin = 0 2. 求出d = 16.6 0

3、 = 16.6 3. 分组,计算组距、组中值 分为10组,组距 = 16.6 10 = 1.66 1.7 4.计算频数 ( f i )、频率分组组中值划正(上限排外)频数 f i频率0 1.70.85正正一110.221.7 3.42.55正50.13.4 5.14.25正70.145.1 6.85.95正70.146.8 8.57.65正50.18.5 10.29.35正50.110.2 11.911.05正70.1411.9 13.612.7520.0413.6 15.314.450015.3 17.016.15一10.02合计5014. 作频率分布图静态分析指标一、平均指标的计算算术平均

4、数X = ( x1 + x2 + x3 + +xn ) n = ( x i ) n加权平均数X = ( x1f1 + x2f2 +x3f3 + +xnfn ) n = ( x i fi ) ( fi ) 众数 = 总体中出现次数最多或最普遍的标志值中位数 Me当n 为偶数时:中位数 = ( Xn/2 + Xn/2+1 ) 2当 n为奇数时: 中位数 = X(n+1)/2二、标志变异指标的计算极差 d = Xmax Xmin总体方差 2 = ( Xi X )2 n = ( Xi2 ) n X2样本方差 S2 = ( Xi X )2 ( n 1 )总体标准差= 2样本标准差 S = S2离散系数(

5、变异系数)V = X三、例题测量10株苗木高度(单位:cm),得下列数据:52.7,50,55.4,61.2,55.4,49.5,50,55.4,55.4,61.2求这10株苗木的算术平均数、众数、中位数、极差、方差、标准差和变异系数。解:把数据整理为:数据52.75055.461.249.5出现次数(频数)12421则:算术平均数 = ( 52.7150255.4461.2249.51 ) 10 = 54.62 (cm)众数 = 55.4中位数 = ( X5 X6 )2 = ( 55.449.5 ) 2 = 52.45极差 = 61.2 49.5 = 11.7方差 = 16.1616标准差

6、= 4.0201变异系数 = 4.0201 54.62 = 0.0736设有以下在胸径标志的样本分组资料,试计算其平均胸径、胸径方差、标准差、极差、中位数、变异系数。胸径分组0-11-22-33-44-55-66-77-88-99-10株数311118231613852100组中值0.51.52.53.54.55.56.57.58.59.5解:平均胸径 = ( 0.531.512.5113.5184.5235.5166.5137.588.559.52 ) 100 = 4.91方差 = 3.7219 标准差 = 1.9292极差 = 9 中位数 = 4.5 变异系数 = 0.3929抽样推断抽样

7、推断包括了随机抽样、统计可能和假设检验三方面的内容。一、有关概率论的知识事件随机事件:在相同条件下每次试验可能出现,可能不出现的事件。必定事件:每次试验中必定出现的事件。不可能事件:每次试验中不可能出现的事件。概率在大量重复试验中,事件A发生的频率稳定地在固定常数p附近摆动,则称p为事件A的概率,表示为P(A) = p 。不可能事件的概率为0,必定事件的概率为1。随机变量的数学期望与方差随机变量的数学期望E ( X ) = 随机变量以概率为权数的加权平均数 = X随机变量的方差D ( X ) =2正态分布(常态分布)随机变量X在其平均值附近的概率分配较多,而远离平均值的概率分配专门少的最常见的

8、分布规律。记为:X N ( , 2 ),其概率密度分布为:f (X)= EXP ( X X )2 ( 22)(2)E ( X ) = , D ( X ) =2标准正态分布当E ( X ) = 0 , D ( X ) =1时的正态分布,记为:N(0,1)二、常用统计量的无偏可能、渐近无偏可能无偏可能:样本某统计量的数学期望等于其可能的总体参数,则那个可能统计量就叫做该总体参数的无偏可能。样本平均数是总体平均数的无偏可能,即E(x)= X。样本方差是总体方差的渐近无偏可能,即E(S2)= 2。三、可能值的误差限和可靠性若统计量X为未知参数x的可能,则:绝对误差 = | Xx |相对误差= X可能精

9、度A = 1可靠性1,其中为危险率四、求点可能(定值可能)与区间可能的步骤点可能:求出平均数X、标准差S 计算绝对误差 下结论:以1的可靠性求出平均值为X,绝对误差为区间可能:求出平均数X、标准差S 计算绝对误差,置信区间X, X 下结论:以1的可靠性求出可能值为X,绝对误差为,置信区间为X, X五、总体平均数的抽样可能条件:正态:总体均服从(或近似服从)正态分布独立:总体是相互独立的等方差:各总体方差相等方法:重复抽样不重复抽样大样本(n50或2已知)求平均数X、标准差S计算绝对误差,置信区间 = uS(n-1)3. 结论:以1的可靠性求出可能值为X,绝对误差为,置信区间为X, X1. 求平

10、均数X、标准差S2. 计算绝对误差,置信区间 = uS(N n)/N(n-1)3. 结论:以1的可靠性求出可能值为X,绝对误差为,置信区间为X, X小样本(n50或未知1. 求平均数X、标准差S2. 计算绝对误差,置信区间 = tS(n-1)3. 结论:以1的可靠性求出可能值为X,绝对误差为,置信区间为X, X注:S 2 = 样本方差 = (n-1)2n (重复抽样情况下) = N (n-1) 2n (N-1) (不重复抽样情况下)2 = 总体方差u = 查附表2:标准正态概率双侧临界值表。如=0.05时,u0.5 = 1.96;=0.1时,u0.01 = 1.64t = 查附表3:t 分布临

11、界值表。如=0.05,n = 5时, t0.05(5-1)= t0.05(4)= 2.776例1:用重复抽样方法测得30株马尾松人工林的胸径数据如下:13.611.210.28.59137.18.214.511.78.75.110.511.510.911.110.212.67.210.59.49.78.712.210.21210.810.39.512.5试以0.95的置信度求林分平均胸径所在范围解:1. 求平均数X、标准差SX = 10.35 S = 2.012. 查附表3得t0.05(30-1)= t0.05(29)= 2.045 3. 计算绝对误差,置信区间 = tS(n-1) = 2.0

12、452.0129 = 0.76X = 9.59 X = 11.12 4. 下结论:以0.95的可靠性求出可能值为10.35,绝对误差为0.76,置信区间为9.59,11.12六、总体频率的抽样可能重复抽样不重复抽样大样本(n50)求频率pp = 样本具有某特点的单元数样本总单元数 = m n查附表2得u求绝对误差限、置信区间 = up(1-p)n4. 下结论:以1的可靠性求出总体频率的可能值为p,绝对误差为,置信区间为p, p1. 求频率pp = 具有某特点的单元数总单元数 = m n2. 查附表2得u3. 求绝对误差限、置信区间 = up(1-p)(N-n)n(N-1)4. 下结论:以1的可

13、靠性求出总体频率的可能值为p,绝对误差为,置信区间为p, p例:为可能某针阔混交林中针叶林地面积所占百分比,用重复抽样方式抽取了100个点进行观看。观看结果有68个点为针叶林。试以0.95的可靠性可能该混交林中针叶林面积所占百分比的置信区间解:1.求频率pp = 68100 = 0.68 1p = 0.322.查附表2得u0.05 = 1.963. 求绝对误差限、置信区间 = u0.050.680.32100 = 0.09 p= 0.59, p= 0.774. 下结论:以0.95的可靠性求出总体频率的可能值为0.68,绝对误差为0.09,置信区间为0.59,0.77第八章 显著性检验(统计假设

14、检验)总体平均数的显著性检验重复抽样不重复抽样大样本(n50或2已知)假设:H0:=0,即总体平均值无显著差异H1:0,即总体平均值有显著差异计算统计量U =(X )n = (X )(n-1)S3. 查附表2得u下结论:若|U| u 则拒绝H0,即总体平均值有显著差异若|U|u 则同意H0,即总体平均值无显著差异1. 假设:H0:=0,即总体平均值无显著差异H1:0,总体平均值有显著差异2. 计算统计量U =(X )N(n-1) (N-n) = (X )N(n-1)S(N-n)查附表2得u下结论:若|U| u 则拒绝H0,即总体平均值有显著差异若|U|u 则同意H0,即总体平均值无显著差异小样

15、本(n50假设:H0:=0,即总体平均值无显著差异H1:0,即总体平均值有显著差异计算统计量T = (X )(n-1)S查附表3得t(n-1)下结论:若|T| t(n-1) 则拒绝H0,即总体平均值有显著差异若|T| t(n-1) 则同意H0,即总体平均值无显著差异注:X = 计算出来的样本平均数 = 题目给出的总体平均数 = 题目给出的总体标准差 S = 计算出来的样本标准差总体成数(频率)的显著性检验大样本:n50或2已知1. 假设:H0:p = p0,即总体频率无显著差异 H1:总体频率有显著差异2. 计算统计量U = ( p p0 ) n p0 (1- p0 ) = (m np0) n

16、p0 (1- p0)其中:m = 具有某特点的样本个数 n = 样本总容量 p0 = 题目给出的总体成数(频率) p = mn查附表2得u下结论:若|U| u 则总体频率有显著差异 若|U|u 则总体频率无显著差异两总体平均数的显著性检验1. 假设:H0:1 = 2,即两总体平均数无显著差异 H1:两总体平均数有显著差异2. 计算统计量大样本: U = ( X1 X2 ) (1/n11/n2)= ( X1 X2 ) (n1n22) (n1S12n2S22)(1/n11/n2)小样本: T = ( X1 X2 ) (n1n22) (n1S12n2S22)(1/n11/n2)其中:X1、X2分不为

17、两个样本的平均数 n1、n2 分不是两个样本的容量S1、S2分不是两个样本的标准差3. 查附表2或3得u或t(n1n22)4. 下结论:大样本: 若|U| u 则两总体平均数有显著差异 若|U|u 则两总体平均数无显著差异小样本: 若|T| t(n1n22) 则两总体平均值有显著差异若|T| t(n1n22) 则两总体平均值无显著差异两总体频率(成数)的显著性检验1. 假设:H0:p1 = p2,即两总体频率无显著差异 H1:两总体频率有显著差异2. 计算统计量U = ( p1 p2) P (1-P )(1/n11/n2) 其中:p1、p2分不为两样本的频率 n1、n2分不为两样本的容量m1、

18、m2分不为两样本具有某种特性的个数p1 = m1n1 p2 = m2n2 P = (m1m2) (n1n2)3. 查附表2得u4. 下结论:若|U| u 则两总体频率有显著差异 若|U|u 则两总体频率无显著差异两个总体方差的显著性检验1. 假设:H0:两个总体方差无显著差异 H1:两个总体方差有显著差异2. 计算统计量F = n1S12(n21)n2S22(n11)其中:n1、n2分不是抽自两个正态总体的样本容量 S12、S22分不是两个样本的方差,且S12S223. 查附表5 (F分布临界值表)得F (n11, n21)4. 下结论:若F F (n11, n21) 则两个总体的方差有显著差

19、异若F F (n11, n21) 则两个总体的方差无显著差异例题:例1:已知某炼铁厂的铁水含量在正常情况下有正态分布N (4.55,0.1082)。现在测了五炉铁水,其含碳量分不为:4.28,4.4,4.42,4.35,4.37。问:若标准差不改变,总体平均值有无变化? (=0.05)解:1.假设: H0:总体平均值无显著差异 H1:总体平均值有显著差异2.计算统计量X = 4.364 = 4.55 2 = 0.1082U = (4.3644.55)50.108 = -3.85103.查附表2得u0.05 = 1.964.下结论:由于|U| 1.96 ,因此总体平均值有显著差异。例2:某厂生产

20、乐器用合金弦线,其抗拉强度服从均值为10560(公斤/厘米2)的正态分布。现从一批产品中抽取10根,测得其抗拉强度为:10512,10623,10668,10554,10776,10707,10557,10581,10666,10670。问:这批产品的抗拉强度有无显著变化?(=0.05)解:1.假设:H0:总体平均值无显著差异 H1:总体平均值有显著差异2.计算统计量X =10631.4公斤/厘米2 = 10560公斤/厘米2 S = 76.8404公斤/厘米2T = (10631.410560)(101)76.8404 = 2.78763. 查附表3得t0.05(101)= 2.2624.下

21、结论:由于|T| 2.262 ,因此总体平均值有显著差异,即这批产品的抗拉强度有显著变化。例3:林场与4个治理区订合同,造林成活率达到85%时认为达到要求,然后把4个治理区造的林,用重复抽样方式分不各调查200株,其中第一治理区成活180株;第二治理区成活185株;第三治理区成活168株;第四治理区成活170株。这4个治理区造林成活率是否达标?(=0.05)解:1.假设:H0:总体频率无显著差异 2.计算统计量p1 = 180200 =0.9 p2 = 185200 =0.925 p3 = 168200 =0.84 p4 = 170200 =0.85U1 = (0.90.85)200(0.85

22、0.15) = 1.9803U2 = (0.9250.85)200(0.850.15) = 2.9704U3 = (0.840.85)200(0.850.15) = -0.3961U4 = (0.850.85)200(0.850.15) = 03. 查附表2得u0.05 = 1.964.下结论:由于| U1| 1.96,| U2| 1.96,| U3|1.96,| U4|1.96 ,因此,只有第一、二治理区造林成活率达到要求。例4:两台机床加工同一种圆筒,抽样测量产品内径,结果如下:第一台机床:n1 = 100, X1 = 33.75, S1 = 0.1第二台机床:n2 = 100, X2 =

23、 34.15, S2 = 0.15试检验两台机床所加工圆筒内径均值有无显著差异(=0.05)解:1.假设:H0:两台机床所加工圆筒内径无显著差异2.计算统计量U = (33.7534.15)(1001002)(1000.121000.152)(1/1001/100) = -22.07683. 查附表2得u0.05 = 1.964.下结论:由于| U | 1.96 ,因此两台机床所加工圆筒内径有显著差异。例5:为了可能两个工厂所生产的产品质量,取出样品n1 = 200和n2 = 300件产品,在这两个样品中,分不出现m1 = 20和m2 = 15件废品。在显著水平0.05下,检验关于两个工厂生产

24、废品率相等的零假设:H0:p1 = p2, 备择假设H1:p1 p2解:1.假设:H0:p1 = p2 H1:p1 p22.计算统计量p1 = 20200 = 0.1 p2 = 15300 = 0.05 P = (2015)(200300) = 0.07 1P = 0.93U = (0.10.05)0.070.93(1/2001/300) = 2.14673. 查附表2得u0.05 = 1.964.下结论:由于| U | 1.96 ,因此两个工厂生产的废品率有显著差异。例6:依照抽自正态总体X1和X2的容量n1 = 9和n2 = 6的两个独立样本,求得样本方差S12 = 14.4和S22 =

25、20.5,在显著水平0.1下,检验关于总体方差相等的零假设H0:12 =22解:1.假设:H0:12 =22 H1:12 22 2.计算统计量S12S22F = 620.58914.45 = 1.51853. 查附表5得F0.05 (5,8) = 3.694.下结论:由于| F | 3.69 ,因此,在显著水平0.1下,两总体方差相等。第九章 相关与回归一、一元线性回归方程的建立x = 自变量 y = 因变量X = (xi )n Y = (yi )n Lxx = (xi 2 ) (xi )2n = nSx2Lyy = (yi2 ) (yi )2n = n Sy2 Lxy = xi yi (xi )(yi )n一元线性回归方程为:y = a b x其中:b = Lxy Lxx a = Y b X二、样本相关系数样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论