基础统计复习资料_第1页
基础统计复习资料_第2页
基础统计复习资料_第3页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基础统计复习资料第一章 概论第三节 统计学中的常用基本概念总体X 有X,X,X个单元1 2 3 Nn个组成样本单元x,x,x,x1 2 3 n则:总体容量 样本容量第三章 统计资料整理一、数据的分组、整理写出最大X 、最小Xmaxd=Xmax

Xmin

min分组,算出组距、组中值据样本的单元数,求出分组数的经验值为:样本单元数分组数

40-506-8

50-1007-10

100-2009-12

200-50012-17

>50017-20上限:每一组数据中最大的变量值下限:每一组数据中最小的变量值组距=极差÷分组数=上限-下限组中值=(上限+下限)÷2计算频数和频率频数=各组分配的统计单元数频率=各组单元数占总体单元数的比频数÷各单元数之和)16000.40块林地组成样本,样本各单元的蓄积量值为:1.57.512.37.404.9.33.14.2011.18.82.71010.77.62.96.716.610.38.511.88.75.45.411.267.75.84.3012.53.511.3.74.209.64.64.111.83.11.67.6.55.72.96.4试进行数据整理解:1.Xmax

=16.6 X =0min2.求出d=16.6-0=16.6分组,计算组距、组中值分为10组,组距= 16.6÷10=1.66≈1.7计算频数(fi、频率分组组中值划正(上限排外)频数fi频率0–1.70.85正正一110.221.7–3.42.55正50.13.4–5.14.25正┬70.145.1–6.85.95正┬70.146.8–8.57.65正50.18.5–10.29.35正50.110.2–11.911.05正┬70.1411.9–13.612.75┬20.0413.6–15.314.450015.3–17.016.15一10.02合计5014.作频率分布图频率0.250.20.150.1频率0.050-0.0505101520频数频数151050频数值8中0组52249567391111第四章静态分析指标一、平均指标的计算X=(

+x+x+…+x

)÷n=(

)÷n1X=(xf11

2+x2

3+xf33

n+…+xfnn

i)÷n=(fii

) ÷()i众数=总体中出现次数最多或最普遍的标志值中位数Me当n为偶数时:中位= (Xn/2

+Xn/2+1

)÷2当n为奇数时:中位数=X(n+1)/2二、标志变异指标的计算d=Xmax

Xmin总体方差σ2= [∑(Xi样本方差= [∑(Xi

-X]÷n=(∑X2)÷n-i-X)2]÷(n-1)总体标准差=√σ2样本标准差S离散系数(变异系数V=σ三、例题110株苗木高度(单位c,得下列数据:求这10株苗木的算术平均数、众数、中位数、极差、方差、标准差和变异系数。解:把数据整理为:数据出现次数(频数)

52.7 501 2

55.44

61.22

49.51(52.555.61.49.1÷10=54.6c)55.4中位数=(X5

X)2=(55.49.5)2=52.456极差=61.2-49.5=11.7方差=16.1616标准差=4.0201变异系数=4.0201÷54.62=0.0736变异系数。胸径分组0-11-22-33-44-55-66-77-88-99-10∑株数311118231613852100组中值0.51.52.53.54.55.56.57.58.59.5(×8+8.5×5+9.5×2)÷100=4.91方差=3.7219 标准差=1.9292极差=9 中位数=4.5 变异系数=第七章抽样推断抽样推断包括了随机抽样、统计估计和假设检验三方面的内容。一、有关概率论的知识事件随机事件:在相同条件下每次试验可能出现,可能不出现的事件。必然事件:每次试验中必然出现的事件。不可能事件:每次试验中不可能出现的事件。概率在大量重复试验中,事A发生的频率稳定地在固定常pp为事件A的概率,表示为P(A)=p。不可能事件的概率。随机变量的数学期望与方差随机变量的数学期E(XD(X)σ2正态分布(常态分布)XX~N( ,σ2fEXP[X-X÷()E(X)=μ ,D(X)σ2标准正态分布当E(X)=0,D(X)1的正态分布,记为二、常用统计量的无偏估计、渐近无偏估计的无偏估计。。=σ三、估计值的误差限和可靠性Xx绝对误差Δ=||相对误差Δ'=Δ÷X估计精度A=1-Δ'可靠性1-α,其中α为危险率四、求点估计(定值估计)与区间估计的步骤点估计:求出平均、标准S 计算绝对误差Δ 下结论:的可靠性求出平均值绝对误差为Δ区间估计:求出平均标准S 计算绝对误差置信区,] 下结论以的靠性求出估计值绝对误差为置信区间,]五、总体平均数的抽样估计条件:正态:总体均服从(或近似服从)独立:总体是相互独立的等方差:各总体方差相等方法:大样本σ2已知)

重复抽样S计算绝对误差

不重复抽样S计算绝对误差Δ=uα

Δ=uα

×S×√[(N–n)/N]÷结论:以的可靠性求出估计值为X,绝对误差为Δ,置信区间为[X-Δ,X+Δ]小样本或σ未知 1. 求平均、标准S计算绝对误差

√(n-1)结论:以的可靠性求出估计值为Δ=tα

×S÷√(n-1)3. 的可靠性求出估计值注2=样本方差=重复抽样情况)= [N××σ×(不重复抽样情况2=总体方差u =α=0.0uα 0.5

=1.9α=0.1u0.01

=1.64t =查附t分布临界值表。如=0.0n=,t 5-=t =2.776α 0.05 0.05例3013.611.210.28.59137.18.214.511.78.75.110.511.510.911.110.212.67.210.59.49.78.712.210.21210.810.39.512.5试以0.95的置信度求林分平均胸径所在范围解:1.求平均数X、标准差SX=10.35 S=2.012.查附3得t

(29)=2.0450.053.计算绝对误差

0.05Δ=tα

÷(n-1)=2.042.0÷29=0.76=9.59 =11.124.0.95的可靠性求出估计值六、总体频率的抽样估计大样本

重复抽样p

不重复抽样pp=样本具有某特点的单元数÷p=具有某特点的单元数÷总单样本总单元数=m÷n2得uα求绝对误差限

元数=m÷n2得uα求绝对误差限、置信区间Δ=uα

Δ =uα

×√[p×(1-p)×(N-n)下结论:以的可靠性对误差为,

÷n÷(N-1)]的可靠性求Δ,p+Δ]100个点进行观察68个点为针叶林。试0.95的可靠性估计该混交林中针叶林面积所占百分比的置信区间pp==0.68 =0.322得u0.05

=1.96求绝对误差限、置信区间Δ=u ×[0.60.3100]=0.09 -Δ=0.59,+Δ=0.770.050.95[0.59,0.77]第八章显著性检验(统计假设检验)一、总体平均数μ的显著性检验大样本(n≥50或σ2已知)

重复抽样假设:

不重复抽样假设:H:μ=μ

,即总体平均值无显H:μ=μ

,即总体平均值无显0 0著差异H:μ≠μ

0 0著差异,即总体平均值有显H:μ≠μ

,总体平均值有显著1 0 1 0著差异 差异计算统计量U=(X-μ)×√n÷σ=-μ

计算统计量UX-μ×[N(n-1]σ÷√(N-n)=(X-μ)×2得uα

[N(n-1]÷√N-)下结论:

2得uα若|U|>uα

H0

下结论:平均值有显著差异若|U|<u则接受H,即总体

若|U|>uα

则拒绝H,即总体0平均值有显著差异α 0平均值无显著差异

若|U|<uα

则接受H,即总体0平均值无显著差异小样本1.假设:H:μ=μ0

,即总体平均值无显著差异0H:μ≠μ1

,即总体平均值有显著差异0计算统计量T=-μ3得tα

(n-1)下结论:|T|α|T|α

(n-1)则拒绝H,即总体平均值有显著差异0(n-1)则接受H,即总体平均值无显著差异0注=计算出来的样本平均数 μ =题目给出的总体平均数σ=题目给出的总体标准差 S=计算出来的样本标准二体成数(频率)的显著性检验大样本:n≥50或σ2已知假设:H=p,即总体频率无显著差异 H:总体频率有显著差异0 0 1计算统计量U=(p-p)×√n÷√[p(1-p)]=(m-n×p)÷√[n×p(1-p)]0 0 0 0 0 0其中=具有某特点的样本个数 n=样本总容量p=题目给出的总体成数(频率) p=02uα若|U|>uα

则总体频率有显著差异 α

则总体频率无显著差异三、两总体平均数的显著性检验假设:H:μ =μ,即两总体平均数无显著差异 H:两总体平均数有显著差0 1 2 1异计算统计量大样本: U=(X-X)÷σ)1 2 1 2=(X-X)×√(n+n-2)÷√[(nS2+nS2)×(1/n+1/n)]1 2 1 2 11 22 1 2小样本: T=(X-X)(nSS1 2 1 2 11 22 1 2

分别为两个样本的平均数 nn分别是两个样本的容量1S

2 1 2分别是两个样本的标准差1 223得u或t(n下结论:

α α 1 2大样本:若|U|>uα

则两总体平均数有显著差异 α

则两总体平均数无显著差异小样本:若|T|(n则两总体平均值有显著差异α 1 2|T|(n则两总体平均值无显著差异α 1 2四、两总体频率(成数)的显著性检验假设:H=p,即两总体频率无显著差异 H:两总体频率有显著差异0 1 2 1计算统计量U=(p-p)÷√[P(1-P)(1/n+1/n)]1 2 1 2其中p分别为两样本的频率 n

分别为两样本的容量1 2 1 2m、m分别为两样本具有某种特性的个数1 2p=m÷n

p=m÷n

P=(m+m)÷(n+n)1 1 1

2 2 2

1 2 1 22uα若|U|>uα

则两总体频率有显著差异 α

则两总体频率无显著差异五、两个总体方差的显著性检验假设:H:两个总体方差无显著差异 H:两个总体方差有显著差异0 1计算统计量F=n×S2×(n-1)÷n÷S2÷(n-1)1 1 2 2 2 1其中:n、n分别是抽自两个正态总体的样本容量1 2SS2分别是两个样本的方差,S21 2 1 2查附5(F分布临界值得F (nn下结论:

α 1 2若F(nn则两个总体的方差有显著差异α 1 2若F(nn则两个总体的方差无显著差异α 1 2六、例题:例已知某炼铁厂的铁水含量在正常情况下有正态N(4.55,0.10现在测了五炉铁水其含量分别为4.24.4.44.34.3问若标准差不改变总体平均值有无变化? (α=0.05)解:1.假设:H:总体平均值无显著差异 H:总体平均值有显著差异0 1计算统计量X=4.364 μ=4.55 σ2=U=(4.364.55×0.108=-3.85102得u0.05

=1.96下结论:由于|U|>1.96,所以总体平均值有显著差异。例:某厂生产乐器用合金弦线,其抗拉强度服从均156(厘米)10051106210661055107710701055,105810661067。问:这批产品的抗拉强度有无显著变化?=.0)解:1.假设:H:总体平均值无显著差异 H:总体平均值有显著差异0 12.计算统计量X公厘米2 μ=公厘米2 S=公厘米2T=(10631.4-10560)×√(10-1)÷76.8404=2.78763.查附3得t 2.2624.下结论:

0..05由于|T|>2.262,所以总体平均值有显著差异,即这批产品的抗拉强度有显著变化。例44个管理区造的林,用重复抽样方式分别各调200180185区168株;第四管理区成1704个管理区造林成活率是否达标?0.0)解:1.假设:H:总体频率无显著差异0计算统计量p==0.9 p1

==0.925 p3

==0.84 p=4170÷200=0.85U=(0.9-0.85)×√200÷√(0.85×0.15)=1.98031U=(0.920.85×20÷(0.80.15)=2.97042U=(0.84-0.85)×√200÷√(0.85×0.15)=-0.39613U=(0.85-0.85)×√200÷√(0.85×0.15)=042得u0.05

=1.96下结论:由于|U|>1.96,|U|>1.96,|U|<1.96,|U|<1.96,所以,只有第一、二管理区1 2 3 4造林成活率达到要求。例n=100,X=33.75,S=0.11 1 1n=100,X=34.15,S=0.152 2 200)解:1.假设:H:两台机床所加工圆筒内径无显著差异0计算统计量U=(33.734.15×(10102÷[(100.100.11/101/10]=-22.07682得u0.05

=1.96下结论:由于|U|>1.96,所以两台机床所加工圆筒内径有显著差异。例n1

=和n2

=300件产品,在这两个样品中,分别出现m1

=20和m2

=15件废品。在显著水平0.05下,检验关于两个工厂生产废品率相等的零假设:H:p=p,备择假设H:p≠p0 1 2 1 1 2解假设=p H≠p0 1 计算统计量

1 1 2p1=0.93

==0.1 p2

==0.05 P==0.07 U=(0.1-0.05)÷√[0.07×0.93×(1/200+1/300)]=2.14672得u0.05

=1.96下结论:由于|U|>1.96,所以两个工厂生产的废品率有显著差异。例X1

和X的容量n2

=9和n2

=62=14.41和S2=0.1

2=σ22

2

2 H

0 1 22≠σ20 1 22.计算统计量∵S2<S2

1 1 21 2∴F=6×20.5×8÷9÷14.4÷5=1.51853.查附5得F (5,8)=3.694.下结论:

0.05由于|F|>3.69,所以,在显著水平0.1下,两总体方差相等。第九章相关与回归一、一元线性回归方程的建立x=自变量 y=因变量X=Y=

=2)- =i i xx i iS2xL = 2)-=n×S2 Lxy=y-

)÷nyy i i y i i i i一元线性回归方程为y=a+bx其中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论