版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
应用多元统计抽样方法与抽样分布北京师范大学教育学部胡咏梅教育学部本科生课程抽样方法-简单随机抽样-等距抽样-分层抽样-整群抽样抽样分布t分布、X
分布和F分布样本容量的确定contents□1.简单随机抽样□
简单随机抽样是指在抽样过程中,每一个个体都有同等的、相互独立
的被选机会的抽样方法。□
常用的简单随机抽样方法有随机数字表法和抽签法。一
、抽样方法北京师范大学教育学部□
随机数字表法□
随机数字表是根据随机化原则所制成的由随机数排列起来的数字表
(见附表2)。表中0—9这10个数字在表上任一位置上出现的概率都是相等的。1.简单随机抽样北京师范大学教育学部开始剪
切
复制▼粘贴格式刷剪贴板附表2
[兼容模式]-Excel页面布局
公式
数据
审阅
视
图
开发工具
Acrobat
百度网盘
告诉我您想要做什么
…京师范大学教育学自动换行合并后居中
对齐方式插入
删除
单元格宋体常规B
I
U字体条件格式
套用单元格样式表格格式▼样式P11×
fxABCDEFGHIJKLMN0PQR附表2
万
个
随
机
数
字表00~0405~0910~1415~1920~2425~2930~3435~3940~4445~4900887586660533843436236277425517095604188085126607550135661428321624077410206862665659698862411315249187022633503771641153813340721067879596608419178886386036082674718565272950891975136952521572237063377343970495044998961376331764939706098714692710393416521297890583764476940614342741383389769469300998641964115083100627998425626540210056816684874408400831241989618805110782686323237462514510859272801780588147565493776379120818386138621098804197187707275771418811336950344037130921717131412270768165584401918708421238720303634208141510184468305231842086341188786070084642056574399365411611660277517747398664237016016232673433620550036594111712514209677954309874567896779638688694906202196551091813270456262673159911499650944024922372996949315118041914130941772514103000676884363565935782475610814151852021159238262518177525316363852448400259288572031079016922161625150809493267723290155699559389270445009065700223170934214528647277140384156340833561335670105490746824183814879001035097942439625733151881186230996823289625192368919997723821524780205580904880494548836932279926Sheet2
Sheet3
+部就绪00
0数字文件%9□
例6-1:某年级有学生150人,为了抽查该年级学生的体育达标情况.现需要抽取一个容量为15的样本。问该样本如何获得?随机数
字表法北京师范大学教育学部□
先将总体中的每一个个体都编上号码,然后把号码写在签上,将签充分混合后,从中随机抽取n个签,则与签上号码相对应的n个个体就组成了
一个样本容量为n
的样本。抽
签北京师范大学教育学部法□
网
站(
www.rand)
可以产生随机数字(有放回的简单随机抽样与不放回的简单随机抽样)。利用抽
样软件北京师范大学教育学部Randomizer
Boxandgenerate
your
own
number
sets.To
generate
random
numbers,enter
your
choices
below(using
integer
valuesonly):How
many
sets
of
numbers
do
you
want
togenerate?How
do
you
wish
to
view
your
random
Place
Markers
Off
numbers?HelpRandomizeNow!SiteOverviewRandomize
Now三
Research
Randomizer
Form
v4.0-Windows
Internet
Explorerhttp://www.randomizer.org/form.htmBing文件(F)编辑(E)查看(V)收藏夹(A)工具(T)帮助(H)X
选择Gmall:来自Google的
…
e
http-www.edujournal.c.建议网站▼网页快讯库▼How
many
numbers
per
set?10HelpNumber
range(e.g.,1-50):From:1To:100HelpDo
you
wish
each
number
in
a
set
toremainunique?YesHelpDo
you
wish
to
sort
the
numbers
that
No
are
generated?HelpUsethe
Randomizerformto
instantlQuickTutorialSeesomeexamplesofhow
ResearchRandomizercanbe
usedfor
randomRelated
LinksVisitlinkson
random
sampling,randomassignment,andresearch
methodsAbout
Research
RandomizerLean
moreabout
ResearchA
已完毕,但网页上有错误。
Internet|保护模式:启用
+100%Research
RandomizerFormv4.0命
▼5
▼
口▼页面(P)▼
安全(S)▼工具(0)▼
②▼Randomizerandreadour
User
Policy.samplingandrandom
assignment.generaterandom
numbers.Addthis
tool
to
yourwebsite☆收藏来
咨2023-3-5Help2完成
Internet
保|护模式:启用2023-3-5Research
RandomizerResults2
Sets
of
10
Unique
Numbers
Per
Set
Range:From1
to100
--UnsortedJobStatus:FinishedSet
#1:82,58,2,39,21,80,13,65,51,35Set
#2:61,50,83,58,79,71,16,5,98,18Results
-Research
Randomizer-Windows
Intermet
Explorer
0about:blank收藏夹建
议网站▼e网页快讯库▼口▼页面(P)▼
安全(S)▼工具(0)▼②▼
k
能选择Gmail:来自Google的….e
http--Www.edujournal.c
…EARCIDOMIZER文件(F)编辑(E)
查看(V)
收藏夹(A)
工具(T)
帮
助(H)Print
当
DownloadinExce
图
Close区100%X
转
换
选择
★
收藏夹
☆Gmail:来自Google
的…e
http-www.edujournal.c
建
议
网站▼网页快讯库▼Research
Randomizer
Form
v4.0
合▼▼口▼页面(P)▼安全(S)▼
工具(0)▼Howmanynumbersperset?10HelpNumberrange(e.g.,1-50):From:1To:100HelpQuick
TutorialRelated
LinksResearch
Randomizer
Form
v4.0-Windows
Internet
Explorerhttp://www.randomizer.org/form.htm文件(F)编辑(E)
查看(V)收藏夹(A)工具(T)帮助(H)Internet|
保护模式:启用
+100%Togeneraterandom
numbers,enter
your
choicesinteger
values
only):Howmany
sets
of
numbers
do
you
want
to
generate?Do
you
wish
to
sort
the
numbers
that
Yes:Least
to
Greatest▼are
generated?HelpRandomizer
BoxAddthis
tool
to
yourwebsiteandgenerateyour
ownnumber
sets.Do
you
wish
each
number
in
a
set
to
remain
unique?No▼HelpHow
do
you
wish
to
view
your
random
Place
Markers
Off
numbers?HelpVisitlinksonrandom
sampling.randomassignment,andresearch
methods.About
Research
RandomizerSeesomeexamplesofhow
Research
Randomizercanbe
usedfor
random
samplingandrandom
assignment.Usethe
Randomizerformtoinstantly
generaterandom
numbers.Learnmore
about
ResearchRandomizerandreadour
User
Policy.Randomize
Now!
RandomizeNow
below
(using2023-3-52
Helpng=(T)
(H)选择收藏夹
Gmail:
来自Google
的
…
journal.C--
建议网站一网页快讯库一▼页面(P)▼
安全(S)▼工具(0)▼②▼k能术EAR(DPrint当Download
in
Excel图
Close区MIZERResearch
RandomizerResults2
Sets
of
10
Non-unique
Numbers
Per
SetRange:From1to
100--Sortedfrom
LeasttoGreatestJobStatus:FinishedSet#1:5,11,26,43,68,69,90,90,94,94Set#2:15,21,28,32,40,48,54,64,68,91Results-Research
Randomizer
-Windows
Internet
Exploreraboutblank完成
Internet|
保护模式:启用
+100%文件(F
编辑(E)
查看(V)
收藏夹(A)
工具
帮助可2023-3-5□
现有某校四年级某班50名学生的英语能力水平测验成绩,请利用SPSS
软
件进行简单随机抽样,随机抽取10名学生的成绩样本。□
数据文件:6-1.savSPSS
软
件应用北京师范大学教育学部学生编号数学英语Output--◎Eilter
out
unselected
casesOCopy
selectedcases
to
a
new
datasetDataset
name:ODelete
unselected
cases□
单击Data-Selectc名——英语,选O
All
casesO
If
condition
is
satisfiedIf◎Random
sample
of
cases+TTnSelectCasesSelect-SPSS
软件应用点击欲抽样的变量RangeOUse
fiter
variable:7
_
工
+XCurrent
Status:Do
notfiltercasesO旦ased
on
time
or
case
rangeResetasteOKSample.学教eCancelHelp让-1SPSS软件应用
北京师范大学教育学部□
点击Sample,
出现Select
Cases:Random
Sample对话框。在抽取比例栏中
填上相应的值,此题抽取总体20%的样本,则在Approximately%of
allcases
中填上20。当然,也可以选择从前面n个案例中精确选择m个被试,
需要在Exactly
m
cases
from
the
first
n
cases
中填上相应数据。tSelect
Cases:Random
SampleSampleSize◎
Approximately
po
%of
all
cases◎Exactly
cases
from
the
first
casesContinue
Cancel
Help□
先把总体所包含的个体(设共有N
个)编上号码1—N,再根据样本容量n求得抽样间距k:k=N/n
。
然后,随机确定一个起点a(1≤a≤k),
起点确
定后,从起点开始每隔k个个体抽选一个个体,这样抽取的号码序列也
就确定了。即由号码a,a+k,a+2k,...,a+(n-1)k组成的容量为n的样本。2.等距抽样北京师范大学教育学部□例6-2:为了解某校初一年级学生数学学习情况,拟从200名学生中抽取
20人的成绩来考察。问如何得到这样的样本?oN=200,n=20,k=200/20=10,先按学生入学时的登记号将学生成绩编号,
假如这时随机确定的起点为003,则抽选号码依次是:003,013,023,.,183,1932.等距抽样
北京师范大学教育学部□
等距抽样对总体的代表性不如每种样本组合都有相等的、相互独立的被
选机会的简单随机样本。□
在备有档案记录或登记表的条件下,使用等距抽样比较方便。等距抽
样VS
简单随机抽样北京师范大学教育学部□
分层抽样方法是按照总体已有的某些特征,将总体分成几个不同的部分,
每一部分称为一个层,在每一层中实行简单随机抽样的方法。□分层总的原则:层内个体间的变异要小,而层与层之间的变异要尽可能
地大。北京师范大学教育学部3.分层抽样□例6-3:要从某校2000名大学一年级学生中,抽出一个容量为100的样
本,研究高考英语成绩与升入大学后的英语成绩的关系。□
先按高考英语分数把这2000名学生分为优、良、中、差四层,然后在
各层中都随机抽取100/2000=0.05即5%的学生,合起来就是一个容量为
100的样本了。分层抽样示例
北京师范大学教育学部分层抽样示例
北京师范大学教育学部□例6-4:某中学有学生3000人,要通过抽查20%的学生来了解学生视力
情况。已知该校6个年级学生人数的分布情况是:初一年级600人,初
二年级580人,初三年级560人,高一年级440人,高二年级420人,高
三年级400人。□
首先按年级将总体分成6层,然后在各层(年级)内均按20%的比例随
机抽样。因此从各层中随机抽取的人数依次为:120,116,112,88,
84,80。□
在样本中各层人数的比例与总体中各层人数的比例是相同的,□
600:580:560:440:420:400=120:116:112:88:84:80。北京师范大学教育学部分层抽样示例□分层抽样使样本与总体具有相同的整体结构,即各层所占的比例完全相同,从而控制了抽样误差,保证了样本具有较高的代表性,所以分层抽
样是最常用的一种抽样方法。3.分层抽样北京师范大学教育学部□
整群抽样是从总体中按自然群体整个地随机抽取若干群体,由这些群体的全部个体组成样本的抽样方法。2005年国民体质抽样调查采用分层整群抽样方法,采集了200多万个人的数据。4.
整群
抽样北京师范大学教育学部□整群抽样的优点在于实施便利,易于组织,省时省力,因而它适合于大
规模的调查研究。□
如果各群体之间的变异较小,而每一群体内个体的变异较大(最好能基
本上反映总体内部的变异情况)。此时,每一群体就可以看作总体的一
个缩影,适宜采用整群抽样。4.整群抽样北京师范大学教育学部□
简单可行、节省人力物力而且所得样本应对总体的代表抽样方
法的选取原则北京师范大学教育学部□
为了全面研究我国各地公立中小学教育投入和产出关系,我们将分别构建东、中、西部的城市、农村的学校教育投入与产出关系模型。因
此,本课题的抽样需要兼顾地区差别、城乡差别和学段差别,同时根据分层抽样方法需要考虑到各类学校抽样比例应与其总体比例基本相同。调查单位为学校,样本量的确定是考虑到拟采用的定量分析方法对最低样本量的要求以及我们的人力和时间有限等因素后确定的。关于我国中小学教育投入与产出关系的研究—抽样方案北京师范大学教育学部学校公立小学公立初中地点东部江
苏城市3620农村2312广东城市4025农村3021中部安
徽城市4016农村3822湖
北城市3423农村2015西部青
海城市4028农村4222四川城市4025农村3220关于我国中小学教育投入与产出关系的研究—抽样方案从总体中抽取n个个体,得到n个随机变量x,,x₂,…,xn。我们所说的抽样,一般是指随机抽样,即要求x,,x₂,…,xn
相互独立,并且与总体X
具有相同的分布。这样的样本称为简单随机样本,简称为随机样本。
x₁,x₂,…,x,被称作来自总体X
的一个样本容量为n的样本。二、抽样分布北京师范大学教育学部机变量。样本函数f(x,,x₂
,…,x
)中若不含有未知的参数,则称之为一个统计量。统计量的概率分布被称为抽样分布。北京师范大学教育学部n表示随机变量时,它的函数f(x₁,x₂,
…
,
xn)也是一个随二、抽样分布当x₁,x₂,…,x设X~N(0,1),x₁,X₂,.,xn是来自总体X
的样本,则为n的x²分布,记作
x²~x²(n)x²
分布临界值表(见附表3)2X分布称服从自由度北京师范大学教育学部2X分布北京师范大学教育学部例6-5:若α=0.05,自由度df=5,查分布的单侧检验值表(附表3)可知:
p(x²>11.1)=0.05,即xoos(5)=11.1。例6-6:若取α=0.01,自由度df=5,则P(x²>15.1)=0.01,即xo.0(5)=15.1。x²分
布
表
黏
北京师范大学教育学部北京师范大学教育学部35
40
k(;n)in=1n=4n=10x²分布的特点0.200.150.100.055
10
15
20
25
30分布密度函数图
1
:X
2n=20·x²分布是一个正偏态的分布。n越大,曲线越趋于对称(由中心极限定理知,它趋于正态分布);n
越小,曲线越不对称。·若X₁,X₂,...,Xm相互独立,且X~x(n;),i=1,2,..,m,
则X=
X₁+X₂+...+Xm~x²(n),其中n=n₁+n₂+..+nm。·设X~x²(n),则E(X)=n,D(X)=2n。x²分布的特点
黏北京师范大学教育学部·X₁,X₂,.,Xm是从总体N(μ,σ²)中抽出的随机样本,易知(X-
μ
)/σ~
N(0,1),i=1,2,..,n
。
因此,服从自由度为n的x²
分布。服从自由度为n-1的x²分布其中
为样本方差。
·X
和S2相互独立。x²分布的特点
北京师范大学教育学部
北京师范大学教育学部设X~N(0,1),Y~x²(n),
且
X
与Y
相互独立,则随机变量
所服从的分布称为自由度为n的t分布,记作t~t(n)。·t分布临界值表(附表4)P{|t>ta₁2(n)}=α县(m)t
分布北京师范大学教育学部口
29e0例6-7:已知α=0.05,自由度df=10,
试确定临界值。解:查t值表就可以得到临界值例6-8:已知随机变量X~t(10),
问
P{|t|>0.879}
和
P{t<0.879}
的概率分别
为多少?北京师范大学教育学部t分布表解:根据df=10,查t分布表得与数值0.879对应的α=0.4,即P{|t>0.879}=0.4。由此,可得:P{t>0.879}+P{t<-0.879}=0.4,又因为t分布图形具有对称性,故P{t>0.879}=P{t<-0.879}=a/2=0.2,P{t<0.879}=1-P{t>0.879}=1-a/2=1-0.2=0.8t分布表
北京师范大学教育学部
北京师范大学教育学部是X的一个容量为n的随机样本。X有
关t分布的两个重要结论(1)若总体X~N(μ,o²),x₁,x₂,.,x,和S²分别表示样本平均值和样本方差,则~t(n-1)(6.7)(2)设有两个总体X
和Y,X~N(μ,o₁²),Y~N(μ₂,o₂²),且X
和Y
相互独立。已知X₁,X₂,..,
Xn是来自总体X
的随机样本,y,y₂
,.,Vn₂
是来自总体Y
的随机样本。两个样本的平均值和方差分别是X,S₁及
Y
,S₂,则+n₂-2)
(6.8)有关t分布的两个重要结论北京师范大学教育学部有关t分布的两个重要结论特别地,当n₁=n₂=n时,北京师范大学教育学部(6.9)设有两个总体X,Y,
已知X
并且X
与Y
相互独立,则称随机变量
所服从的分布为第一自由度为n,
第二自由度为n,的F分布,并记作F~F(n₁,n₂)。·F
分布临界值表(附表5、6)北京师范大学教育学部F分布F分布P{F>F(n₁,n₂)}=a点
北京师范大学教育学部有关F分布的两个重要结论·(1)设X~x²(n₁),Y~x²(n₂),
且
X与Y相互独立,令
,
则北京师范大学教育学部有关F分布的两个重要结论
北京师范大学教育学部(2)设有两个总体X
和Y,
已
知X~N(μ,σ²),Y~N(μ₂,o₂²)
,且X
与Y
相互独立。x₁,x₂,.,xn₁是来自总体X
的随机样本,y₁,y₂,.,yn
2是来自总体Y的随机样本,两个样本的平均值和方差分别是X,S²及
γ,S²
。
令(6.11)则F~F(n₁-1,n₂-1)。有
关F分
布的两个重要结论
北京师范大学教育学部特别地,如果确定样本容量时应考虑的因素:1.决策的重要性2.估计的精确度(样本均值的标准误
与费用的关系
S
与
√n
成反比样
本
容
量
的
确
定三
、北京师范大学教育学部n3.研究的性质(探索性的研究、结论性的研究,如升学率4.变量的个数5.数据分析的方法6.问卷的回收率7.数据的合格率三、样
本容量的确定北京师范大学教育学部□
按统计方法定量地计算样本容量按统计方法确定的是纯样本量,即去掉可能不合格的答
以后的纯量。三、样本容量的确定北京师范大学教育学部假
设
H
。:μ=X
成立,(6.13)□
按统计方法定量地计算样本容量示例1:根据允许的样本均值估计总体均值的精度来确定样本量。三、样本容量的确定北京师范大学教育学部例6-9:某校初一年级数学课进行了一年的教改试验,我们需要调查数学教改的成效,因而对教改班的学生进行了一次考试。为减小工作量,我们
仅作抽样分析。如果要使误差不超过3分,且具有95%的置信程度,则至
少应抽取多少考生的试卷?(根据以往的经验,估计该年级学生数学成绩
的标准差σ=11)。计算样
本容量北京师范大学教育学部由题意得,d=3,σ=11,a=0.05,
查正态分布表得,Ua₁2=1.96,
所以,即至少应抽取52份考卷,才能有95%的把握说误差不会超过3。计算样本容量黏
北京师范大学教育学部示例2:根据估计总体比例的精度确定样本量
北京师范大学教育学部□
依据对总体中某个比例的估计精度来确定样本量,比如老宛民选草位
总统的比例p.o
Var(p)=p(1-p).□
如p=0.5,var(p)=0.25□
如p=0.9,var(p)=0.09□
其样本量的确定可依据以下公式:(6.14)如抽样绝对误差d=0.03,α=0.05时,Ha12=1.96,p(1-p)最大取0.25(p=0.5),
则所需样本量n₀=1067.进行与前人相类似的研究时,可参考前人样本量来抽取样本。如果是地区性研究,平均样本量通常在500—1000之间较为合适;如果是全国性的研究平均样本量在1500—2500之间较为适宜。(台湾学者)
>
对于大规模的调查,可按总体的1%来抽取。根据经验确定样本容量
北京师范大学教育学部描述性的研究,样本量最少占总体的10%。如果总体较小,则样本量最少为总体的20%。相关性研究的受试至少在30人以上。因果比较研究(causal-comparativestudies)与许多实验研究,各组的人数
至少有30人。如果实验研究设计得当,有严密的实验控制,每组受试至少在15人以
上。(但是有些学者仍认为每组受试最少应有30人最为适宜。)Gay(1992)对于样本量的看法北京师范大学教育学部□
试叙述几种常用的抽样方法,并说明它们在何种情况下使用。□
什么是抽样分布?请分别大致绘出x²分布、t分布以及F分布的图形,并
阐述其特征。□
确定样本容量的影响因素有哪些?北京师范大学教育学部练习与思考参数估计:点估计与区间估计[北京师范大学教育学部胡咏梅]教育学部本科生课程教育统计学一
点估计二
区间估计三
利用Explore模块获得参数估计四
回归模型中的区间估计目录contentso
以样本统计量来估计总体参数,这种统计推断的方法称为参数估计。参
数估计可分为点估计和区间估计。o
用样本统计量的值作为总体参数的估计值,称为参数的点估计。例如,用样本的算术平均值和样本方差
分别作为总体的均值
E(X)和方差
D(X)
的估计量等。我们也可以用样本的加权平均数
aix
i(其中
,0
<
ai
<
1,
a
i
=
1
)作为E
的一个估计量;用统
计量作为D(X)的一个估计量。一、点估计(一)判断估计量优劣的标准
无偏性Λ
Λo
定义7.1
设样本x1,x2,
…,xn
的函数(不含未知参数)θ
=
θ(x1,
x2,
…
,
xn
)
是总体的未知参数θ
的一个估计量。如果ΛEθ(x1,
x2,
…
,
xn
)=
θ(7.1)为θ的无偏估计量,否则称为有偏的。一、点估计Λθ(x1,
x2,
…
,
xn
)成立,则称样本算术平均值X是总体均值EX
的一个无偏估计量。样本k阶原
点矩X
k
是总体原点矩E
Xk
的无偏估计量。样本方差S
2
也是总体方差DX
的一个无偏估计量。但是,估计量S
不是总体方差DX
的无偏估计量。用无偏性的标准来衡量S
2
和S
,我们可以认为S
2
比S
好。不过,当
n
充分大时,这两个估计量是近似相等的。而且,当n→∞时,ES
→
DX
,故我们称S
为DX
的渐近无偏估计量。因此,对于大样本,估计总体方差时,也可以用S。n2n2n2n2n2n2一、点估计
有效性ΛΛ设θ1
(x1,x2,
…,
x)
和θ2
(x1,x2,
…,
xn)
都是待估参数θ的无偏估计量,ΛΛΛΛΛ如果θ1
的方差不大于θ2
的方差,即D(
θ1
)≤D(
θ2
)
,则称估计量θ1Λ比估计量θ2
有效。一、点估计
有效性例如,取
1=x1,
Xi
,
易知
1
和
都是参数E(X)的无偏估计量。但是,由于∧D(
θ
1)
=D(X1)
=
D(X)
∧∧∧因此,D(
θ
1)>D(
θ
2)
。可见,作为待估参数E(X)的无偏估计量,
θ
2∧比θ
1
更有效。即作为总体均值的估计量,比x1要好。Xഥ一、点估计
一致性所谓一致性,是指当样本量无限增大时,估计量依概率收敛到它所估计的
总体参数。∧假设θ
n(x1,x2,
…
,xnሻ是待估参数θ的一个估计量,n为样本量。如果对任
何一个ε>0,∧n
P(|
θ
n-θ|>ε)=0
(7.2)∧成立,则称θ
n为参数θ的一致估计。例如,
是总体均值E(X)的一个一致估计是总体方差D(X)的一致估计。Xത一、点估计(二)
总体均值和总体方差的点估计例7-1:从某年级学生中随机抽取30名,测得他们的期末各科成绩的平
均分如下:82,90,78,69,65,73,77,88,80,67,58,89,75,60,76,74,93,73,89,66,95,82,83,59,64,91,87,83,63,92试对该年级学生的期末平均成绩和成绩的离散程度作出估计。一、点估计解:我们分别用样本均值X和样本方差S
2
来估计该年级学生的期末平均成绩和成绩的离散程度。
=1/30(82+90+…+92)=77.367
=124.861一、点估计区间估计方法既能告诉我们参数的真正数值在什么范围内,又能告诉我们下此结论有多大把握。对参数θ
的区间估计,
就是要确定两个统计量θ1
(x1,
x2,
…
,
xn
)
和θ2
(x1,
x2,
…
,
xn
)
,使得Λ
ΛP(θ1
≤
θ
≤
θ2
)
=1
-α
,
0<
α
<1
(7.3)我们称区间[θ1,θ2
]为参数θ
的置信度(可靠性)为
1-α的置信区间,分别是下、上置信限。
下面我们将分几种情况二、区间估计来讨论区间估计问题。称α为置信水平。Λ
Λθ1,θ2Λ
ΛΛ
Λ1.总体均值的区间估计(1)方差σ2
已知的情形
由抽样分布理论知,如果X~N(μ,σ2
),则样本均值X
~N(μ,σ2/n)。
若令
(7.4)则
u~N(0,1)
。
由正态分布的对称性,可得,P(
-
uα/
2
≤
u≤uα/
2
)
=1
-α
,
即P(
X
-
uα/
2σ/sn
≤
μ
≤
X
+
uα/
2σ/vn
)
=
1
-α
(7.5)二、区间估计如图7-1所示。所以,正态总体均值μ的置信度为1-α的置信区间为:[X
-
uα/
2σ/
·
n
,
X
+
uα/
2σ/
·
n](7.6)图
7-1正态总体均值
μ
的区间估计示意图二、区间估计uα/2-uα/2如果总体不服从正态分布,但是样本量充分大(如样本量n≥50),总体均值μ的置信度为1-α的置信区间仍然可以用式(7.6)估计。二、区间估计例7-2从某校某年级期中英语试卷中随机抽取20份试卷,其成绩分别为:80
,75
,72
,88
,65
,75
,90
,90
,61
,79,82
,78
,73
,82
,65
,70
,90
,90
,63
,77。已知该年级的期中英语成绩服从正态分布,方差σ2=52
。试求出该班
期中英语成绩均值μ的95%和99%的置信区间。二、区间估计二、区间估计o
置信区间的长短在样本量n确定的情况下与置信度1-α有关。置信度越大,
则置信区间越宽;置信度越小,则置信区间也随之缩短。o
因此,
当样本量n一定时,要想提高置信度,置信区间势必就要变宽。o
但是,置信区间过宽则会失去参数估计的实际意义。o
另外,
当置信度1-α一定时,置信区间的长短与样本量n有关,随着样本量n
的增大,置信区间有缩短的趋势。因此,在保证一定的置信度的前提下,应
适当地增大样本量以缩短置信区间。二、区间估计(2)方差
σ2
未知的情形二、区间估计(7.7)o
例7-3:某高校对大一新生进行健康体检,在体重测试中随机抽取100名学生,测得他们的平均体重为60公斤,标准差为5公斤。试用区间估计
方法求出该校学生的平均体重大约是多少?二、区间估计
(7.7)二、区间估计
(2)方差
σ2
未知的情形小样本情形(样本容量
n
<50)当正态总体方差未知,且为小样本情形时,
由抽样分布理论知,
此时
将服从自由度为
n-1
的
t
分布。因此,正态总体均值μ
的置信度为
1-α的置信区间为:[X
-
tα/
2
(n
-1)S
/
·
n
,
X
+
tα/
2
(n
-1)S
/
·
n]其中tα/
2
(n
-1)
是自由度为n
-1,显著性水平为α所对应的
t
分布的双侧检验的临界值(7.8)(7.9)例7-4
:从某高校参加大学四级英语统考的学生试卷中随机抽取20份,其成绩如下:71
,56
,67
,60
,80
,45
,73
,82
,65
,55,56
,72
,59
,63
,75
,88
,71
,64
,52
,70试对该次成绩均值
μ
作区间估计。(α=0.01)二、区间估计先计算出样本均值X和样本方差S
2
。X
=
(71
+56+
…+
70)=66.2S
2
=
201一
1
[(71
一
66.2)2
+(56一
66.2)2
+…+(70
一
66.2)2
]=10.822置信度为
1-α=0.99,自由度为
df=n-1=19,查
t
分布临界值表得,tα/
2
(n
一1)
=2.861,将之代入(5.2.6),可得X一
tα/
2
(n一1)S
/·
n
=66.2一
2.861×10.82
/
20
=59.28X+
tα/
2
(n一1)S
/
n
=66.2
+
2.861×10.82
/
20
=73.12所以,该次成绩均值
μ
的置信度为
99%的置信区间为
[59.28,73.12]。二、区间估计
解:
设此次英语成绩
X~N(μ,σ2
),其中
μ
,
σ2
均未知。
20份试
卷的成绩为一个小样本,因此,我们采用
(7.9)
式来计算置信区间。2.总体方差的估计设总体
X~
N
(μ,
σ2
)
,
μ
,
σ2
都是未知的参数,x1
,
x2
,
…,
xn
是来自正态总体
X
的随机样本。σ2
的置信度为
1-α的置信区间是:
二、区间估计图7-2总体方差的区间估计的示意图(7.11)例7-5:仍然以上题为例,试求出此次英语成绩的方差在什么范围?(α=0.05)解:由上题计算得:
1-α/2=0.975,查卡方分布表得,x12一α/
2
(19)
=8.91,
x/
2
(19)
=32.9
由((7.11))式得,
所以,
σ2
的置信度为
95%的置信区间为[67.61,
249.65]。α2二、区间估计二、区间估计
3.两个正态总体均值差数的区间估计根据总体方差是否已知以及是否属于大样本情形分三种情况来讨论两
个相互独立的正态总体均值差数的区间估计问题。(1)两个正态总体方差已知的情形设X~N(μ1
,σ),Y~N(μ2
,σ),X与
Y相互独立且σ
,σ为已知常数。x1
,
x2
,
…,
xn1
为来自总体
X
的随机样本;
y1,
y2,
…
,
yn2
为来自总体
Y
的随
机样本。
X和Y分别表示这两个样本的均值。我们需要计算两总体均
值差数
μ1
-
μ2
的置信度为
1-α的置信区间。22122212由抽样分布理论知
且X与Y相互独立。因此,
令
则u~N(0,1)
。查正态分布表可得临界值uα/
2
,故
P
(-
uα/
2
≤
u≤
uα/
2
)=
1
-α
,(7.12)即二、区间估计
所以,
μ1
-
μ2
的置信度为
1-α的置信区间是
(7.13)二、区间估计(2)两个正态总体方差未知,但属于大样本的情形在这种情形下,由于是大样本,所以,可以用样本方差S
、S
来
代替总体方差σ、σ,并且令
(7.14)u将近似服从
N(0,1)。因此,
μ1
-
μ2
的置信度为
1-α的置信区间是
((7.15)
)
22122212二、区间估计二、区间估计
例7-6:从甲、乙两校初三年级学生中分别随机抽出
120
人,测得他们的身高的平均值分别为
160.5
公分、158.90
公分,标准差
分别为
4.30
公分、3.86
公分。试对甲、乙两校初三年级学生的平均
身高的差数进行区间估计(置信度为
0.99)。解:由题意知,X=160.5,S=4.302
=18.49,Y=158.90,S=3.862=14.90,n1
=n2
=120,α=0.01,查正态分布表得,uα/
2
=
2.58。将这些
数据代入(5.2.12)式可算得甲、乙两校初三年级学生的平均身高的
差数
μ1
-
μ2
的置信度为
99%的置信区间是[0.24,
2.96]。2212二、区间估计
(3)两个正态总体的方差相等(
σ=
σ=
σ2
)
但σ2
未知,且属于小样本的情形2212总体方差,
所以,我们采用如下的统计量
来代替σ2
。可以证明统计量
服从自由度为n1
+n2
-2的
t
分布。由于n1
、
n2
均小于
50,属于小样本情形,不能再用样本方差来代替(7.16)因此,
我们可得
μ1
-
μ2
的置信度为1-α的置信区间是L
(
n1
n2
,(
n1
n2
,」|其中tα/
2
(n1
+
n2
-
2)是临界值,
可根据α的大小和自由度n1
+
n2
-
2查
t
分布表找到。
(X
-
Y)
-
tα/
2
(n1
+
n2
-
2)S
·|
+
|
,
(X
-
Y)
+
tα/
2
(n1
+
n2
-
2)SI|
+
|
|
(7.17)「
(
1
1
)
(
1
1
)
7二、区间估计o
点估计
数据文件7-1.sav,若我们采用点估计的方式估计该校所有参加阅读能力
测试的五年级学生成绩的均值和标准差。我们只需要单击主菜单上Analyze→Descriptive
Statistics→Descriptives,将变量Score放入Variable栏。三、利用Explore模块获得参数估计o
单击Options按钮,选中Mean(样本均值)、Std.deviation(样本标准差)、variance(样本方差)
等选项。o
区间估计
数据文件7-1.sav
,利用Explore过程来获得均值的置信区间。
Analyze→Descriptive
Statistics→Explore…
,打开Explore的对话框,将变
量Score放入Dependent
List栏。三、利用Explore模块获得参数估计o
对于求两个相互独立的正态总体的均值差数的置信区间,
我们可以利用
独立样本的T检验模块来进行。
先单击Analyze-Compare
Means-Independent-Samples
T
test,在打开的Independent-Samples
T
test对话框中,在Test
Variables列表框中输入变量
名,在Grouping
variable中输入分组变量名,并单击Define
Groups按钮,
打开Define
Groups
对话框,在Group
1和Group2窗口中分别输入分组
变量值,最后点击Continue
和OK按钮即可。三、利用Explore模块获得参数估计简单回归模型线性回归分析:分析一个随机变量(因变量)与若干个变量(自变量)之间线性关系的统计方法。假设因变量与自变量之间为线性关系,用线性回归模型来拟合因变量与自变量的数据,
并通过确定模型参数来得到回归方程。PRF
:
Yi
=
β1
+
β2
Xi
+
ui
(i=
1,
2…,
n)SRF:
Yi
=+Xi
+
i
=+
i回归分析的主要目的就是用SRF估计PRF.由于抽样的随机性,SRF很可能过高或过低地估计PRF。uˆYiˆuˆβ2ˆβ1ˆ四、回归模型中的区间估计比较两条样本回归线SRF1和SRF2(假定PRF是直线),问哪条样本线更好地代表“真实”的总体回归线?样本回归线与总体回归线SRF1PRFSRF2XYSRF是PRF的一个近似估计.问:怎样构造SRF能使得
尽可能“逼近”真实的系数βi呢?βiˆ要解决的问题o
根据样本回归函数尽可能准确地估计总体回归函数。o
常用的估计方法:
普通最小二乘法(Ordinary
Least
Square,OLS)
最大似然法(Maximum
Likelihood,ML)四、双变量回归模型:参数估计i
=Yi
-
=Yi
-
(
+
Xi
)OLS:
ordinaryleastsquare求解:minf(
,)
=
minΣ
=minΣ
[Yi
-
(
+
Xi
)]2β2ˆβ1ˆi2uˆβ2ˆβ1ˆβ2ˆβ1ˆYiˆuˆPRF
:
Yi
=
β1
+
β2
Xi
+
ui
(i=
1,
2…,
n)SRF:
Yi
=+
Xi
+
i
=+
iuˆYiˆuˆβ2ˆβ1ˆ普通最小二乘法
(OLS)
→得到的方程组称为正规方程组整理得:Σ
Yi
=n+
Σ
Xi
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医院秋游活动策划方案(3篇)
- 粽子直播活动策划方案(3篇)
- 林草学堂活动方案策划(3篇)
- 抢杯子活动策划方案(3篇)
- 谷雨餐厅活动策划方案(3篇)
- 陡坡管道施工方案(3篇)
- 医疗废物处置培训课件
- 2025年企业信息安全事件处理流程手册
- 创新台灯设计方案
- 2025年大学航空服务(民航服务礼仪)试题及答案
- 电力线通信技术
- 教师三笔字培训课件
- 中国医药行业中间体出口全景分析:破解政策难题深挖全球红利
- 河南省百师联盟2025-2026学年高一上12月联考英语试卷(含解析含听力原文及音频)
- 污水管道更换工程施工方案
- 租户加装充电桩免责补充合同(房东版)
- 甘肃省天水市2024-2025学年九年级上学期期末考试物理试题(含答案)
- 2025年佛山市均安镇专职消防队招聘消防员5人备考题库及1套参考答案详解
- 2026年海南卫生健康职业学院单招职业技能考试题库参考答案详解
- 法制副校长课件
- 水利安全生产六项机制实施方案
评论
0/150
提交评论