




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三节 试验数据的统计分析一、统计表和统计图在心理学试验争论中,一般都是先获得一大堆原始数据和观测材料,虽然这些数据乍看起来格外凌乱,但它们却是试验所获得的最贵重的财宝。试验做完以后的分析和立论,都将以这些数据为根底。因此,为使试验获得成功,数据的整理格外重要。在数据整理的过程中,第一步是对数据的特点和种类加以分析,绘制出简洁的统计图和统计表。统计图和统计表的一个共同优点在于一目了然,它所表示的信息简洁被人们理解和承受。有人曾赐予一个不甚恰当的比方,假设文字的信息量“1“10“100〔Ebbinghaus1850~1909〕著名的遗忘曲线就是用一个统计图概述了他试验的全貌。下面我们分别来介绍统计表和统计图的制作方法。〔一〕统计表统计表的功能和构造在心理学争论报告中免不了要用几张统计表。这是由于,统计表是对被争论的心理现象和过程的数字资料加以合理表达的形式。它在表达统计资料方面有着重要的作用,有人称之为统计的速记。设计良好的统计表使统计资料表现得充分、明显而又深刻、有力,可以避开冗长的表达。统计表由标题、横行和纵栏、数字资料等要素组成。统计表的构造一般包括如下几个工程:后挨次编列。使人一望可知表的内容。假设用语过简,可在下面附加说明,但这种状况不宜多用。横行和纵栏的内容。齐,位数要上下对齐,小数点后缺位的要补零,缺数字的项要用“—”符号表示,不能空白。性质、数据来源、附记等都可作为表注的内容,文字可长可短,参见表2-15。表2-15 29名被试康复治疗前后体重差异阈值的变化为了使统计表能对所争论的心理现象以鲜亮的数字表达,制表时应留意以下几点:内容应紧凑而富有表现力,避开过分浩大和琐碎。之间、数字和总计之间、两个总标目之间都须用线条隔开。表的上下二横线条要粗些。表中各栏,通常是依据由局部到全部的原则编列的。于标题或标目的下面。同类型的统计表的具体功能不同。下面简述几种常用统计表:简洁表:只列出调查名称、地址时序或统计指标名称的统计表。例如表2-15。组指标有三个的称为三项表,依此类推。表2-16就是一个复合表,且分类的标目有五个:间隔时间、试验数、节约百分数、节约百分数的中数、中数机误。表2-16 不同时间间隔后的记忆成绩〔Ebbinghaus,1885〕2-16〔Ebbinghaus,1885〕1,300的长短同遗忘的关系,分类统计而成。有了这个表,他就可以绘制成著名的遗忘曲线〔forgettingcurve〕〔702-6〕。〔二〕统计图为了写好试验报告,还需要利用统计图来说明心理现象的数量关系,这样就不需要作很多解释就可以让读者看懂。统计图有明显的优点,它不仅对统计资料和试验结果做出具体、明确的表达,所以统计图是分析统计资料的重要工具,也是试验报告的重要内容。通过作图,可帮助我们提醒心理规律。计图的功用、构造和种类。统计图的功用和构造统计图〔statisticalfigure〕乃是依据数字资料,应用点、线、面、位。一图知万言,一张简洁的图形,就可以把一大堆数据中有用信息概括地表现出来。X,纵坐标常用来表示事Y,除直角坐标外还有角度坐标等。统计图的构造与制图要点容,使人一见就能知道图所要显示的是何事、何物,发生于何时、何地。图号是图的序号,图题与图号一般写在图的下方。图题的字体应是图中所用文字中最大的,但也不能过大,要与整个图形的大小相称,一般与图目文字的挨次全都,从左至右书写,放在居中的位置上。的各种单位名称。在统计图的横坐标和纵坐标上都要用肯定的距离表示各种单位,这些单位称为图尺,有算术单位,亦有对数单位,百分单位等等,这要依据资料的状况加以选用,图尺分点要清楚,整个图尺大小要包括全部的数据值,假设数据值大小相差悬殊,图尺可用断尺或对数法,进展技术处理,削减图幅,增加图形效果。示不同的结果,要用不同的图形线以示区分,各种图形线的含义用文字标明,选图中或图外一适当位置表示,目的是使整个图和谐美观且醒目。注局部的文字要少,印刷字型一般要小,它可以帮助读者理解图形所示资料,提高统计图的使用价值,却又不破坏图的协调性。此外,一个图形要使用各种线条,这些线条因在图中的位置不同而有不同的名称,如图形基线〔横坐标〕、尺度线〔纵坐标〕、指导线、边框线等。下面我们分别介绍这几种图。2-6。根曲线,应用不同形式的线条〔实线、断线、点线等〕区分开来,并用文字说明。2-7趋势,同时还看到了与相对量有关确实定量的大致变动状况。条形图:以一样宽度的条形长短来比较图形指标的大小,它是比较图中最常用的图形。条依此基线为起点所绘制的条形的长度,视图示的指标数值的大小而定。因此,必需定出一个比例尺度,作为绘制条形图的依据,同时各个条形的宽度要相等,各〔组〕条形间要有相当的间隙。形图。按比例分成假设干局部,以圆心角的角度大小来表示各组成局部的数量〔如百分比〕。代表圆面积中来源的圆形图。不过一般被试来源用不着作图,作了图就有强调被试构成成分的含义。的大小。习惯上自变量〔X〕的尺度放在横轴,因变量〔Y〕的尺度放在纵轴。不管纵轴、横轴的尺度都不必从零点起。在自变量与因变量的穿插点绘一个点,我们依据点的状况可以推想两种事物的2-10。二、试验数据的初步整理料进展科学的加工整理。题。〔一〕偶然误差与系统误差波动。产生数据波动的缘由是由于有很多偶然因素影响着试验结果。1.偶然误差偶然误差〔fortuitouserror〕或机误〔chanceerror〕是指试验中无法掌握的或观测结果,使得测出的数据范围绕真值有一些上下波动。10次观测得到10个数据,记在表2-17的其次列〔栏〕。假设此物体重量的真值为a=150.6克,表2-17中第三列〔栏〕登记的是各观测值与真值之差。X1 2 iXi的偶然误差。表2-17 10次观测所得的原始数据〔采自华东师大数学系,1980〕2.系统误差有时在试验中还会消灭另一种类型的误差,它的观测值不是分散在真值的两侧,而是有方向性和系统性的。全部重复试验的观测值大局部都会比真值偏高、或者偏低,其缘由是存也要考虑试验环境如照明、温度、压力、湿度的变化对试验结果的影响,这时照明、温度、压力、湿度的变化就不能视为偶然因素了,而是系统误差因素。另外,在心理试验中,观测者本身的一些因素〔如位置、练习、疲乏、时间等〕,也能产生系统误差。排解系统误差是试验成败的关键。〔二〕集中量的集中量〔或集中量数〕〔measureofcentralten-dency〕;一为表示离中趋势〔variation〕的差异量〔measureofvariation〕。常用的集中量有平均数、中数和众数。下面我们分别进展争论。平均数一个物理量的真值是客观存在的,通常我们无法知道它的真值,而是通过测量或试验mean〕就是把一组数据加起MX:每一个度量Σ:总和n:度量的总次数假设所测原始数据较多,可以进展归组计算,则求平均数的公式为f:每组的次数中数中数〔或中位数、中点数〕〔median,简称Mdn〕Md中数是集中量数的一种,它能描述一组数据的典型状况,其特点是极少受极端数据影响。单列数据的中数的计算方法格外简洁。假设个数为奇数,则取序列为第〔n+1〕/2为中数。假设数据为偶数,则取序列为第〔n/2〕或第〔n/2+1〕这二个数的平均数为中数。例如有3,5,6,9,10,11,13,16n/2〔即第4〕的数545/2=9.5。假设数据较多,也可以进展归组计算。则求中数的公式为:L:含有中数那一组的真实下限n:度量总数i:组距f:含中数那一组里的度量数众数众数〔或密集数、通常数、范数〕〔mode,Mo〕M0个分数里次数最多的一个度量,在分组的次数安排上便是次数最多的一个组的中点。它也是一个集中量数,也可用来代表一组数据的集中趋势。4,5,6,5,7,5,3,6,55。约略的参考而已,由于众数受分组状况的不同而有所不同。在心理学上,众数和平均数的差异能反映试验的难度。假设平均数大于众数,说明大多数人的度量结果低于平均数,可见在此试验中多数被试者存在低估的状况。反之,假设平均数小于众数,说明大多数人的度量结果高于平均数,可见在此试验中多数被试存在高估的状况。在统计学上,众的指标之一,如平均数大于众数,称为正偏态〔positiveskewness〕;相反,则称为负偏态〔negativeskewness〕。集中量数。例如“去掉一个最高分,去掉一个最低分”等等,都是为了能更好地反映集中趋势。〔三〕差异量前面讲到的集中量,只描述数据的集中趋势和典型状况,它不能说明一组数据的全貌。一组数据除典型状况之外,还有变异性的特点。对于数据变异性即离中趋势进展度量的一组统计量,称之百分位差等,它们被称为低效差异量;标准差或方差被称为高效差异量。低效差异量R计算起来也格外简便,可用如下公式求得:R=U-L〔公式2-4〕R:全距案的数值计算得来的,所以随机遇变化的幅度很大。四分差〔quartiledeviation〕:50%的次数的全距的一QQ:四分差Q:第三个四分位数3Q:第一个四分位数1的准确性。可见,四分差可说明某系列数据中间局部的离散程度,并可避开两极端值的影响。关于感受性的试验,要使刺激能被某组被试中百分之九十的人清楚的感受到,那就用到第九十个百分位数了。百分位数的求法与中数一样。实际上中数本身也是一个百分位数,它是第五十个百分位数。插处理。平均差〔简称均差〕〔averagedeviation〕:一般多用符号AD离散程度通用的计算。尤其在阅读早年的心理学争论报告时,时常遇到用此度量表示离中趋势。它能告知我们一组数据里全部的各量度与平均数的差数平均是多少。其计算公式为:Ad:平均差M:平均数X:每一量数〔一种心理物理法〕就是由平均差引伸而出的。但是平均差也有欠缺之处,即它易受极端数值的影响。两个差异量。乘方后的均值,也就是离均差X平方后的平均数,它是度量数据分散程度的一个很重要的量数。方dS2SSD公式为:S:标准差Xin:总量数nn-12-8A这样公式写成:兹举一个工业心理学中的例子来说明离中趋势和平均数代表性之间的关系。设有两个生产小组1145810151718、22、30、33;乙组:10、11、12、13、14、15、16、17、18、19、20。为计算便利,这里用公2-8A812-18两组工人平均日产零件数都为15件,它们的标准差却彼此不同。标准差是描写数据围绕其算术平均值离散程度的一个很重要的数据,具有重要的理论意义和实在确定现象水平的根底上,进一步测定现象发生的节奏性或稳定程度。例如,工业生产中就可以通过离中趋势来看该企业执行打算的节奏性,变动程度很大的,就说明生产中存在着突击现象,前松后紧,时作时辍,还可以推想工作效率。标准差用途很多,常用的主要有:〔1〕表示变量频数安排的离散程度:表2-18 甲、乙生产小组工人日产零件数及其计算标准差过程〔采自中科院心理所,1980〕在前面争论过的例子中可以看到,在均数一样的状况下,标准差大,表示变量值分布得较散;〔2〕对变量频数安排作出概括性的估量:统计学觉察大多数的测量资料在数量很大时,其变量频数安排是靠中间近的比较多,离开中间远的比较少,且越远的越少,这种安排称为常态安排。常态安排是有肯定规律可循的。这就是:总体内约有68%左右的个体变量值在平均数±195%左右的个体变量值在平均数±2±3只要算出平均数和标准差之后,就可以通过一批实际样本测量资料对所要争论的总体做出概括的估量。〔3〕应用标准差计算平均数的标准误。同时它还是很多其他统计指标如正态曲线、相关系数、统计检验等的计算公式的要素。正由于如此,它在统计分析中占有极其重要的地位。目前,连普及型的电子计算器都可一揿按键就得出这个数据,并由此计算出其他统计量。计算标准误常常是显著性检验的最主要参数。标准误可用以下公式计算:根成反比。三、显著性检验〔一〕显著性检验的含义如平均数、中数、变差、差数、比值等如全域的平均数、全域的中数、全域的差数、全域的比值等等。依照成套的、有系统的方法,借助样组去对全域参数作出某些表达,叫作统计推理中的问题。所以统计假设〔statisticalhypothesis〕一般是指关于全域参数的假定。统计假设可用以下算式符号表示:H∶θ=θ。θ:全域参数θ:假设上规定的某一数值o通常打算是否拒绝假设,取决于检验样组指标与假定的全域指标差异是否显著。故统计检验两个或两个以上样本的统计量是否有显著差异。一般按三个步骤进展检验。第一步:提出假说或假定样组的平均数是从全域中取出来的。其次步:通过实际计算,求出tFx2设做出取舍的打算。〔1983〕曾对此作过精辟的分析,提出在使用显著性检验时应把握好以下四点:个水平。有人把差异显著性考验后P>0.05当做两个试验结果无差异的指标来使用。例如考察两个P>0.05,就宣布这两个试验材料难易相等,可以作为同一试验材料的复式使用。这个方法似乎中外心理学家都用过。但PP=0.95,95%的可能性是由机遇P=0.06P=0.10,那就意味着两个试验材料的差异只有6%或10%的可能性是由机遇造成的,也就是它们的差异有94%或90%的可能性是真实牢靠的。因此,显著性水平仅指差异的可能性不大。造成的可能性很小,并不能保证明验设计就肯定正确。有些作者把差异显著性考验的结果P<0.01P<0.001P<0.001,所以第一个学习方法比其次个学习方法更有效;由于P<0.01,所以记忆广度是随年龄不同而变化的等等。实际上这是对差异显著性检验的要求太多了些,超出了检验的性能。再从另一个方面来分析,假照试验条件没能能掌握好,即使是P<10-10也不能弥补试验设计的缺陷。例如有一个争论1001060合中,两个纯音的异同;要求另一组被试只推断图形的异同。结果是对纯音来说,RT>RT,而一样 不同RT<RT〔RTRT分别代表着“一样”和“不同”推断的反响时间〕。一样 不同 一样 不同原作者假设纯音是不易编码的刺激,而几何图形则是简洁编码的,并且经显著性考验证明,对异同RT>RT;而简洁编码的材料则相反,RT<RT。一样 不同 一样 不同P<0.01性、可区分性和感觉到的不同,都可以成为推断异同的反响时间有差异的缘由,为什么把这个差异只归因于可编码性呢?在这里P<0.01并不能转变试验设计中自变量混淆的状况,虽然差异格外显与否。这是显著性检验应把握好的其次点。P≤0.05,则两个结果差异显著;假设P≤0.01,则差异格外显著;如P>0.05,则差异不显著。所谓P≤0.055%。用统计学的术语来说,就是犯第一类P≤0.05P≤0.06P≤0.05,两个结果差异由机遇造成的可能性≤5%;假设P≤0.06,则两个结果差异由机遇造成的可能性≤6%P3804000.050.06P≤0.05P>0.05P≤0.05P≤0.50P≤0.05P≤0.06则是微缺乏道的,我们不能把数字过于确定化。个样原来自不同的总体,但检验却得出差异不显著的结果即犯了其次类错误〔typellerror〕。这可能由于样本所包含的例数太少或其他缘由致使误差偏大等,必要时可加大样本重复试验。固然,当所得结果没有实际意义时,则不必进展显著性检验。验还有一些前提条件,这些在特地的统计学书籍中有具体的表达。〔二〕t在心理学试验争论中,两项试验结果之差,有时是随机引起的差异,有时则是由自变量所造成〕〔population〕Xta:Xt分布〔或t安排〕〔tdistribution〕的概率密度函数的图形是对称于直线t=0的曲线。当nnt2-11t〔或子样〔sampltt〔统计量〕=0,则表示两个小样原来自同一母体。t同一个母体。t一般有以下三种状况:比较样本平均数与总体平均数差异的显著性这里我们通过一个具体的实例进展解释。16X=5512,试问患这种病的儿童与正常儿童的记忆力量有无本质区分。〔或阅历〕,某事物的平均数〔例2-9体平均数的差异的显著性。具体计算如下:t
。0.005(15)
0.01(15)
0.001(15)t<t<t0.001,故P<0.01。这说明患此病的儿童的记忆力量与正常儿童相比,在统计学0.01上有格外明显的意义。理是什么作用。依据这一假设,上讲话,看是否拒绝无效假设。比较同一批试验对象试验前、后差异是否有显著性的计算公式是:我们用一个例子来说明这一类型的具体计算过程。例如,时蓉华等对针灸的镇痛效应进展了争论然后对某一穴位进展针灸。继而再测定一次痛阈。比较同一被试者针灸前后痛阈的变化,试验获得2-19表2-19 针灸前后痛阈的变化*钾离子致痛的电流毫安数〔采自时蓉华等,1980〕依据公式2-9和2-11,获得如下具体计算:
P<0.01.05〔9〕被试者针灸后,对痛阈有显著性影响。
.01〔9〕
.01〔9〕比较二个样本的平均差异的显著性设两个母样都是常态分布,标准误差相等,各自抽取一个
和S1 2 1 2 1 2上述t值计算公式也可写为:检验二个子样是否来自母体平均数相等的常态母体的步骤亦可分为三步:第一步,先作无效假t〔t〔n+n1 2假设t值大于信度水平,则可认为两个母体平均数是有差异的。〔1988〕为争论中国人和外国人对汉字和英文在组是美国人把握英文假设检验模型〔2-20〕。依据公式〔2-12〕,可作如下计算:t=2.819,t>t,故P<0.01。这说明二组间有显著差异,即中国0.001
0.01人把握汉字假设检验模型优于外国人把握英文假设检验模型。表2-20 中、外二组被试概念形成速度比较*概念形成所需的学习单位数〔采自杨治良,1988〕〔三〕FF〔F〕〔Ftest〕是以数据的方差〔变异数〕分析为根底,故又称方差分析〔或变异数分析〕t各组分别用不同的处理法进展试验,所得到的数据是单因素的,可是在这个因素中却包含好几个水〔固定的〔非固定的。变量是否对因变量有重要影响。种应用格外广泛的变量分析方法,它乃是用试验结果的观看值与其平均值之差的平方和,来分析某A,AbaX表示第ji〔指标于是得到单因素分析的一个子样,ij容量n=ab,见表2-21:上式等号右端第一项为各组〔同一等级的数据构成一组〕i0的离差平方和,即:=
S
由两局部组成,一局部表总 误 A 总示偶然误差引起的数据波动值S,另一局部为因素取不同等级引起的数据波动值S。误 A有了上述各等式,我们就可进展F检验。为了检验因素A的不同等级对试验结果的影响是否显著,我们只要比较S和S的大小就行了。设所考察的指标的母体听从常态分布,可以证明变量:误 A这样,听从自由度n=b-1,n′=b〔a-1〕的F分布。显著性检验方法是先用表2-21的数据按A 误FAd,d=5%〔1%〕,Fd’自由度为nn
FF〔n′
〕,假设是F>F〔n′n′
d〔95%或者A 误 d A 误 A d A 误99%〕的把握断定因素AF≤F〔n′,n′〕,就不能认为因素A试验结果有显著影响。
A d A 误以上我们介绍了F检验的根本原理,下面我们就可以争论F检验的几种状况了。analysisofvariance〕F方差分析表,计算起来比较便利〔见表2-22〕。表2-22 单因素方差分析表〔采自杨纪柯,1965〕在计算平方和SS中比较简单的第一项可具体分解为:在计算自由度df中的末一项可具体分解为:总的平方之和相当于以前在未加分组的状况下所算两局部。〔1980〕为比较针刺与示意对痛阈的影响,设立四种试验处理以考察其效应〔2-23〕。依据上述有关公式,可作如下计算:ΣΧ=8.75+3.80+10.80-2.75=20.表2-23 四种试验处理对痛域的影响〔采自时蓉华等,1980〕n=48ΣΧ2=24.9+15.09+13.98+9.16=63.22Σ′x2ΣX2-C=63.22-8.84=54.38名项自由度为:“总的”项:df=n-1=47“组与组间”项:df=b-1=3:df=Σ〔ai-1〕=44有了这些,就可填方差分析表,如表2-24。2-24方差分析表
.F0
采自时蓉华等,1980〕0.05.3
40,
.01.3.40信度d=0.05,得到F>F ,按F检验法得出,试验处理对试验结果的影响是显著的。进A 0.05.3.40一步的协作t检验就可觉察各组间的差异。见表2-25。表2-25 试验各组痛域、耐痛域变化比较〔采自时蓉华等,1980〕双因素方差分析在前面其次节中,我们曾论述了多自变量的优越性。方差分析中,最常见双因素方差分析〔twofactorsanalysisofvari-ance〕。下面举实例分析双因素方差分析的具体计一组被试阅读要求问题解决的指导语,另一组被试阅读要求记忆的指导语。在每组被试中,再随机分成五种试验条件,即:100%;条件二;主试给被试的反响答案正确率为90%;80%;70%;60%。这样,问题解决组和记忆组各有被试60名,而每种试验条件各有被试12名〔见表2-26〕。表2-26 对全部被试把握概念的观测结果〔采自杨治良,1985〕依据上述有关公式,可作如下计算:n=5××12=120,ΣΧ=2420,ΣΧ2=58932SS=58932-48803.33=10128.67T-48803.3-641-7363.3=41.67SS=10128.67-(641+7363.33+4
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 创新、品牌与环保的完美结合:产品包装设计案例及分析
- 青春期孩子的家庭教育
- 胸痛的护理诊断与措施
- 紫色插画风数据分析模板
- 专题五:混合运算复习课件二年级数学下学期期末核心考点集训人教版
- 掌控课堂-同步作业人教版地理七上创优作业-综合训练 期中综合检测卷 课件版
- 外国教育史(河大)
- 数学5年级上册书课件
- 颈椎病患者的健康教育
- 汽车行业行政部工作总结
- 2025购销合同(电子产品)范文
- 青霉素的生产工艺流程专家讲座
- 12j912-2常用设备用房
- GB/T 28799.2-2020冷热水用耐热聚乙烯(PE-RT)管道系统第2部分:管材
- GB/T 20203-2006农田低压管道输水灌溉工程技术规范
- GB/T 14216-2008塑料膜和片润湿张力的测定
- 新型节能型建筑材料的发展方向论文
- 最新班组级安全培训试卷及答案
- 工程开工令模板
- 10000中国普通人名大全
- 2022更新国家开放大学电大《计算机组网技术》网络核心课形考任务三及四答案
评论
0/150
提交评论