概率统计教案(9)_第1页
概率统计教案(9)_第2页
概率统计教案(9)_第3页
概率统计教案(9)_第4页
概率统计教案(9)_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、补充教材:应用统计与计算(第一、二、七章) 张弛 编著 电大科技大学出版社教学目的1、使学员掌握相关分析,一元、多元线性回归及曲线回归、因子分析等实用统计的基本概念、基本思想和计算方法,并能熟练应用它们解决教学、科研中的实际问题。2、使学员牢固掌握运用SPSS统计软件作统计分析的技能。第一章 相关分析一、相关的意义由变量相依关系的特点,变量之间的依存关系可分为两大类型:(1)确定性关系函数关系,例如圆面积 S=r2, y=ex+2等。(2)确定性关系相关关系,例如人的血压y与年龄之间的关系等。以往我们讨论过的许多数学学科,如分析几何、代数等都是研究变量之间确定性关系的,但非确定性关系在自然界和

2、我们熟知的教育领域中大量存在,例如学习成绩与智力因素或与非智力因素之间,数学成绩与物理成绩之间,性别与学习成绩之间等,都存在某种相互联系,相互制约的依存关系,这种关系不是那种严格的函数关系,而是一种非确定性的关系。相关关系和函数关系也有联系:由于观察和测量中会产生误差,函数关系往往通过相关关系表现出来,变量间相关关系非常密切时,通常又呈现出某种函数关系趋势。二、相关的种类按不同的分类标准,相关关系有多种分类1、简单相关和复相关 简单相关两个变量之间的相关关系按涉及变量的多少分 复相关一个变量与两个及以上个变量之间的相关关系2、线性相关和非线性相关 线性相关(直线相关)按变量关系的表现形态,相关

3、关系可分为 非线性相关(曲线相关)3、正相关和负相关按变量数值变化方向的总趋势,相关关系可分为正相关、负相关正相关两个变量变化方向的趋势相同(见教材P2,图1-2左)负相关两个变量变化方向的趋势相反(见教材P2,图1-2右)4、完全相关、高度相关、低度相关和不相关按两变量联系的紧密程度分,相关关系可分为完全相关、高度相关、低度相关和不相关(零相关)(解释见教材P2-P3)。三、相关分析的主要内容研究两个或两个以上变量之间是否存在相关关系,如果存在相关关系,其相关的性质和程度如何,这个过程在统计学上称为相关分析,相关分析的主要内容包括:1、确定变量之间有无相关关系存在,以及相关关系呈现的形态。2

4、、确定相关关系的密切程度。断送相关关系密切程度的主要方法是绘制散点图和计算相关系数。3、对相关系数的显著性进行统计检验。§1.2 积差相关系数及其显著性检验一、积差相关系数(又称积矩相关系数),是20世纪初英国统计学家皮尔逊(K.Pearson)提出的一种计算两个变量线性相关的系数,通常用r或rxy表示,它实际上是考察的两个变量y与x组成的二维随机向量(x、y)的样本相关系数。若对(x、y)作了n次观测,得到n对数据(1,y1),( n,yn)。则定义r为:由哥-席不等式易知 根据我们已具备的概率知识,当 时,可以认为x与y依pr为1存在完全的线性相关关系,越小,与y存在线性相关的程

5、度越小,r=0 ,可以认为与y不相关(不存在线性相关),但不相关并不等于与y相互独立,与y之间可能存在其它形式的相关关系。在0时,r0,可认为与y正相关,r0,可认为与y负相关。二、积差相关系数的计算当样本容量n不太大时,我们可用计算器计算积差相关系数,常用如下公式:例1 教本P4-P5计算rxy也可用统计软件SPSS,今后在上机实习中练习。三、积差相关系数的显著性检验设表示与y的总体相关系数,当=0时,称与y不相关,利用样本相关系数r可以检验H0: =0当(、y)为二元正态变量时,可以证明H0真时 t(n-2) (1.2-6)利用该统计量检验H0的拒绝域为C=t | t |t 这里为t(n-

6、2)分布的分位数例2 (见教材P7)例3 研究某校初三学生物理成绩y与数学成绩之间的相关关系,随机抽取10名学生的数学、物理成绩如下:数学成绩94 90 86 86 72 70 68 66 65 62物理成绩93 92 92 70 82 76 65 76 68 60试求数学、物理成绩的积差相关系数,并检验它的显著性(=0.05)解:检验H0:Pxy=0算出 拒绝H0,认为物理成绩和数学成绩之间存在显著的线性相关。§1.3 等级相关积差相关系数一般适用于连续型总体,且总体分布服从或近似服从正态分布,故两个连续变量的观察数据必须成对出现,且不宜少于30对(根据中心根限定理,大样本时,可近

7、似作取自正态总体),但在社会实践中,特别在教育和心理学方面的数据资料往往不能满足上述的条件,有些数据还是属性的测量(如测定品质的优劣、爱好程度、信念、态度等)常采用的等级评定。这时需要采用等级相关(rank correlation)的方法来研究变量之间的相关关系。一、等级相关是依据等级资料来研究变量间相关关系的相关量等级资料包括:1、等级评定资料。2、经连续变量观测资料转化得到的等级资料。研究等级相关的相关量主要有斯皮尔曼(spearman)等级相关系数和肯德尔(kandall)和谐系数。等级相关不涉及变量的分布形态和数据量的多少,对于两个连续变量的观测资料,也可转化为等级资料计算等级相关系数

8、。二、斯皮尔曼等级相关系数斯皮尔曼等级相关系数是英国心理学家、统计学家spearman根据积差相关的概念推导出来的。其计算公式为:式中spearman等级相关系数, di成对的第i对数据的等级差,n总对数例1 (教材P8) 例2 (教材P9)三、斯皮尔曼等级相关系数的显著性检验1、若n10,可用前述检验统计量(1.2-6)对H0:L=0作t检验。(例 见书P10)2、若4n30 可查相关系数临界值表,对给定的显著水平,当 |时,否定H0认为与y有显著的线性相关关系,当|时,不能拒绝H0,即认为与y无显著的等级相关关系(查的自由度df=n-2)。四、肯德尔和谐系数(补充内容)1、概念及使用条件肯

9、德尔和谐系数(the kandall coefficient of concordace)是计算多个等级变量相关程度的一种相关量。前述的spearman等级相关讨论的是两个等级变量的相关程度,用于评价时只适用于两个评分者评价N个人或N件作品,或同一个人先后两次评价N个人或N件作品,而kandall和谐系数则适用于数据资料是多列相关的等级资料,即可是k个评分者评(N)个对象,也可以是同一个人先后k次评N个对象。通过求得kandall和谐系数,可以较为客观地选择好的作品或好的评分者。2、公式与计算以下用W表示肯德尔和谐系数(1)同一评价者无相同等级评定时,W的计算公式: (1.3-2)式中:N被评

10、的对象数; K评分者人数或评分所依据的标准数;S每个被评对象所评等级之和Ri与所有这些和的平均数的离差平方和,即当评分者意见完全一致时,S取得最大值 可见,和谐系数是实际求得的S与其最大可能取值的比值,故0W1。(2)同一评价者有相同等级评定时,W的计算公式: (1.3-3)式中K、N、S的意义同(1.3-2)式,这里mi为第i个评价者的评定结果中有重复等级的个数,nij为第i个评价者的评定结果中第j个重复等级的相同等级数。对于评定结果无相同等级的评价者,Ti=0,因此只须对评定结果有相同等级的评价者计算Ti。例3 某校开展学生小论文比赛,请6位教师对入选的6篇论文评定得奖等级,结果如下表所示

11、,试计算6位教师评定结果的kandall和谐系数。 论文编号评等评分老师一二三四五六A312546B213456C321546D412635E312645F421536Ri19811312334Ri2361641219615291156解:由于每个评分老师对6篇论文的评定都无相同的等级,故用公式(1.3-2),由表中数据得:(由W=0.87表明6位老师的评定结果有较大的一致性)例4 3名专家对6篇心理学论文的评分经等级转换如下表所示,试计算专家评定结果的肯德尔和谐系数 论文等级专家ABCDEF甲142.5562.5乙231564丙1.531.545.55.5Ri4.51051417.51263

12、Ri220.2510025196306.25144791.5解:由于专家甲、丙对6篇论文有相同等级的评定,故用公式(1.3-3)计算W:T甲=23-2=6 T丙=(23-2)+(23-2)=12由W=0.85可看出专家评定结果有较大的一致性。五、肯德尔和谐系数的显著性检验1、当评分者人数(k)在3-20之间,被评者(N)在3-7之间时,可查肯德尔和谐系数(W)显著性临界值表,检验W是否达到显著性水平。若实际计算的S值大于k、N相同的表内临界值,则W达到显著水平。例如例3中,K=6 N=6,查表得检验水平分别为=0.01,=0.05的临界值各为S0.01=282.4,S0.05=221.4,均小

13、于实算的S=546,故W达到显著水平,认为6位教师对6篇论文的评定相当一致。2、当被评者n7时,则可用如下的统计量对W是否达到显著水平作检验。设H0:评价者意见不一致则:=k(N-1)W (1.3-4)对给定的水平,由= ,查的 分布表得临界值为分位数,将计算出的kandall系数W等代入(1.3-4)式计算值若则拒绝H0,认为评分者的意见显著一致。若则认为评分者的评判显著不一致。例如,在一次教学评价中,10位评价者对12项指示进行评价,已计算出W=0.65,需检验评价者的意见是否有显著的一致性(=0.01)。将k=10 N=12 W=0.65代入(1.3-4)计算得=10(12-1)

14、5;0.65=71.5查表得0.99(11)=24.73=71.5故认为10位评价者对12个指标的评价具有显著的一致性。§1.4 其它相关系数及计算一、点二列相关系数在教育调查与研究中,常碰到只含两个类别的变量,例如性别,是否独生等,我们称这类变量为(二分)“称名”变量,如用1,0分别对应“二分称名变量”的两种类型,则对“二分称名变量”的一系列观测,得到一个“二分”数列。一个连续变量的一系列观测是一个点数列。如果一个点数列中的点与一个“二分”数列中的点存在一、一对应关系,则称这两个数列为点二列。点二列相关系数就是度量连续变量与“二分”称名变量之间相关程度的一个量。其计算公式为: (1

15、.4-1)式中各字母的意义见教本P10例1 见书P10P11点二列相关是积差相关的特殊应用,所以其显著性检验的方法与积差相关系数的显著性检验一样。二、二列相关系数1、基本概念及计算当两列变量都为正态分布的连续变量,而其中一列变量由于某种原因或按某种标准,被人为地分为两类别,变成一个二分变量(如及格与不及格,正确与错误,健康与不健康),表示这样两列变量之间相关程度的量,称为二列相关系数,其计算公式为: (1.4-2)或中、,的意义同(1.4-1)式。求法是依据|p-0.5|的值,查教育统计学(扬宗义)附表1,P栏中该数值对应的Y值即是。例2 现有120人参加数学考试,其成绩为正态分布的连续变量,

16、其中对某一选择题的回答,正确的48人,不正确的72人,结果如下表所示,该问题的得分与考试总分是否相关?总分分组人数fi组中值1某一题回答1f1正确(P)错误(q)(P)(q)901008090708060705060405030402030102025142931231042958575655545352515259168625132317342190425675104044027070375845126576528010030120487231103660解:记p为回答正确的人数所占比例 则P=0.4 q为回答不正确的人数所占比例 则q=1-0.4=0.6由Py=|P-0.5|=|0.4-0

17、.5|=0.10,查表得知0.09871Py0.10257,P栏的P1=0.09871和P2=0.10257的纵线高度y1=0.38667,y2=0.38568依线性插值公式:得将以上数据代入(1.4-2)式,得2、rb显著性检验检验H。:rb无显著意义选用 当由观测数据算出U值满足|U|(临界值)时,拒绝 H0,认为rb有显著意义。本例中算出U=对=0.05,由 查标准正态分布表得 |U|1.96,故不能接受H0,认为该选择题得分与考试总分有显著相关关系。三、偏相关系数见教材P12、多系列相关1、概念多系列相关是二列相关的发展,它同样适用于两个正态变量的直线相关关系的衡量,但多系列相关处理的

18、资料,一个变量为等距或比率变量,另一个变量为按一定的标准划分为三、四个或更多的类别的顺序变量。例如:学习成绩(等距离变量)与品德(分为四等的顺序变量)的相关,便是四系列相关。2、计算公式贾斯明(Jaspen,1946)推导的多系列相关系数公式如下 (1.4-4)式中rs多系列相关系数;Pi第i类别的频数比例;第i类相对应的连续变量x的观测值平均数。St连续变量x全部观测值的标准差;yHi、yHi的意义:把正态曲线下的面积分为k部分,各部分的面积比分别为P1,P2,PK;yLi,yHi分别表示面积为Pi的部分之下、上限位置处正态曲线的高度(纵线)。例(见杨宗义主编教育统计学)P87 例9 略写3

19、、显著性检验对H0:rs无显著意义选用 (1.4-5)其中是的校正值对给定的水平,按P,查表确定临界值,若由(1.4-5)算得的t值满足则不接受H0。§1.5 相关分析在教育测量中的应用本节以相关分析在分析考试或测验试卷的质量上的应用说明相关分析在教育测量中的应用。评价一份试题合理性的质量指标主要有效度,信度、难度、区分度四项,其中效度、信度、区分度都不同程度地可用某种相关系数来衡量。一、效度效度是指用一份试题测验能够测出其所要测量的结果的有效性指标。效度可以用测试结果(考分)与被测对象在该学科上真实水平的相关系数来度量,效度的取值在-1,1之间。效度有内容效度、效标关联效度之分。1

20、、内容效度反映试卷测试内容与所要测试目标的吻合程度,是评价试卷质量的基础,一般由有经验的专家,教师作定性分析。2、效标关联效度设学生的效标测值(某次公认的标准测验的考分或几次测验的平均分)为y1,y2,yn,需作评价的测试题考分为1, 2,n,则与y的积差相关系数作效率r的度量。一般地,效度r越高,说明测验成绩接受学生的实际水平,当r0.45时,效度为适当。此外,若测验成绩与效标值几乎是同时获得,所求得的效度称为协同效度;若效标值是试题测验后一段时间才获得的,则所求的效度为预测效度。例如高考模拟题的效度就属此类。二、信度信度指测试结果的可靠或可信程度。信度不涉及测试是否正确反映评价目标,它所反

21、映的只是测试结果是否稳定和一致。信度的最大值为1,最小值为-1,一份好的试卷,要求信度达0.90以上。信度的测量方法很多,按测量方法的不同,可分为如下几类:1、再测信度试卷在一定时间间隔内对同一对象群两次测试结果的相关系数。再测信度可较好地反映试卷的稳定性,但较易受两次测试时间间隔长、短的影响,且操作麻烦。2、“等价形式”程度以“等价”的两份试卷同时施测于同一批对象群所得结果的相关系数。缺陷:拟一份与“评价试卷”等价的试卷不易做到,同时也加重被测对象的负担。3、分半信度:用试卷测试(一次)后,将其分为等值的两半(如分奇、偶数题等)分别计分,两半得分的相关系数r11称分半信度,再以S-B公式效正

22、为试卷信度,其公式如下: (1.5-1)例1 采用某试卷对5名学生(此处为计算简单计,实际中应大大超过这个人数)进行测试,结果如表1-7,试估计试卷的信度。 表1-7学生序号总分第一大题第二大题三四奇(xi)偶(yi)1 2 3 41 21234590788263425 5 5 55 5 5 55 5 5 52 5 2 43 0 0 215 1212 1314 1010 108 10202020181023151812845424432224536383120ss27116.95287.2 4 4 3.6 3.81.26 2 1.74 1.171.6 4 3.0 1.411.8 112.56

23、1.266.6 1.617.63.8815.015.25.1126.2378.8177.6348.3269.2这里第一大题共4个小题,每个小题满分为5分,第二大题共2个小题,第小题满分为15分,第三题满分为25分,第四题满分为25分。解:将试卷按奇、偶分半后,算得由(1.5-1)得整个试卷信度为4、系数信度分半法求分半信度虽然较容易,但较难保证所分的两半真正“等价”,且分半信度受分法的影响使其有差异,于是库德理查逊(Kuder-Richason)、克朗巴赫(cronbach)等人从另一角度考虑度量信度的方法以,分别表示学生真实分数、误差和总分的方差,则应有=+显然真实分数的方差在总分方差中所占的比例越大,试卷的信度越高,故信度r用下式计算较合理: (1.5-2)然而,都无从知道,只能用统计方法估计,克朗巴赫基于以上思想,提出如下的系数信度公式: (1.5-3)式中k测试题的题数 第i题考分的方差 s2测试总分的方差(公式实际上是把各试题的方差之和作 ,为修正系数)例2 利用系数公式求例1中试卷的信度解:见前面的表1-7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论