心理统计第四章检验的适用条件也分析过程_第1页
心理统计第四章检验的适用条件也分析过程_第2页
心理统计第四章检验的适用条件也分析过程_第3页
心理统计第四章检验的适用条件也分析过程_第4页
心理统计第四章检验的适用条件也分析过程_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理统计第四章检验的适用条件也分析过程第一页,共二十三页,2022年,8月28日一、推断性统计分析的基本逻辑1.随机事件

所谓随机事件,就是事件的发生具有不确定性,或者说其发生服从于完全的机遇机制,即随机性,比如测量中各种随机因素导致的误差大小具有随机性,但在测量样本较大时,误差总平均等于0,随机误差值的频数分布为正态分布。第二页,共二十三页,2022年,8月28日

描述随机事件的有效方法就是概率和概率分布。如,对于大的总体来说,我们无法测定其中每一个体的智商,但可以根据其正态分布预测各种智商发生的概率,因为平均数及其附近的值发生概率高,远离平均数的值发生概率较低,当其与平均数的距离达到1.96个标准差以上时,其发生概率小于5%,即P<0.05,就被称为“小概率事件”。通俗地讲,小概率事件就是“不大可能”发生的事件。心理学中,通常以发生概率小于0.05或0.01为标准来界定之。第三页,共二十三页,2022年,8月28日2.推断性统计分析的逻辑基础是:抽样误差

研究一个总体,不可能对总体作完全的测量,只能采取抽样测量的方法,但样本测量的结果与总体相比总会出现偏差。我们虽然无法预见或确定每一样本所出现的偏差的大小,但却可以知道偏差越大,发生的概率越小。偏离程度达到一定值时,该样本就成为一种小概率事件了。第四页,共二十三页,2022年,8月28日

当我们对一样本进行测量,得到其平均数、标准误,那么如何判断该样本是否能代表某一总体的水平呢?我们可以先作出一个假设:先假设这一样本就来自于相应总体,那就可以按抽样误差的分布规律来评估其发生概率,如样本测量的平均值与总体平均值相比,差距较大,以至于发生的概率小于0.05,它就成了“小概率事件”,意味着这一推断的前提成立的可能性不大。结论就是:该样本来自这一总体的可能性很小,它不是该总体的代表性样本,或者就说:它与这一总体的差异显著。第五页,共二十三页,2022年,8月28日3.两个样本平均数差异性检验的逻辑

从一个总体中随机抽取n个个体组成样本,则有许多种可能的抽取结果,因此可以得到许多个样本平均数,样本平均数的大小变化又是一个随机事件,两个样本平均数的差异量也是一个随机事件。样本平均数差异量的分布中心为0,然后,差异量越大,越远离0差异,其发生的概率就越小。当差异量达到一定值时,它就也是一个小概率事件了。第六页,共二十三页,2022年,8月28日

当要检验两个样本测量得到的平均数是否存在显著差异时,可以先假定它们是来自于同一总体,应该能代表同一总体,然后以此为前提考察这两个样本平均数差异量发生的概率。如果差异量足够大,其发生概率小于0.05,我们就说其是小概率事件,成为“可能性很小”的事件,这就意味着假设前提成为“可能性很小”的,即二者来自于同一总体的“可能性很小”,进而推断:这两个样本很可能来自于两个不同总体,分别代表两个不同的总体,存在显著性差异。反之,就不能说两个样本有显著性差异了。第七页,共二十三页,2022年,8月28日二、t值和t值分布

统计学家长期的研究发现,从正态分布的总体中抽取样本时,样本平均数的分布也是一个正态分布,样本平均数的差异量的分布也是正态分布,其分布特征可以用Z分数来描述。但是,在实际计算标准分数时,需要首先知道总体的标准差,然后计算抽样分布的标准误。如果总体标准差未知,也就只能使用样本标准差作为它的估计值了,以这一估计值计算的标准误就是一个波动值了。这时,计算的“标准分数”就不再标准,因此不能使用Z分数来描述其分布特征,而是要用t分数来描述其分布特征。第八页,共二十三页,2022年,8月28日t分布是一个均值为零左右对称的丘形分布,其峰度低于标准正态分布,尾部高于标准正态分布,而且T分布的峰度变化与自由度有关。自由度越大其分布越接近于正态分布,所以在大样本检验中可以使用Z检验代替t检验。根据统计学研究,样本平均数与总体平均数的差异值符合自由度为某一确定值的T分布,自由度的确定则与样本容量有关;两个样本平均数的差异值也符合自由度为某一确定值的T分布,自由度的确定则与两个样本的容量及样本的相关关系有关。我们可以将t分布与Z分布进行对照。第九页,共二十三页,2022年,8月28日第十页,共二十三页,2022年,8月28日三、不同条件下的t值及t分布自由度的计算1.样本与总体的差异性比较

示例1:某一20人的样本,其身高平均为1.35米,标准差为0.26米,试问该样本是来自于平均身高为1.50米的总体吗?或者:给出样本所有个案的观测值,然后检验该样本是否与某一总体平均值存在显著性差异。第十一页,共二十三页,2022年,8月28日单样本t检验过程演示第十二页,共二十三页,2022年,8月28日2.独立样本间平均数的比较

独立样本平均数的比较一般出现在两种情况下:一种情况是,两个样本各来自于不同的总体,参加同样的测量,比较两个样本各自测量的平均数以判断两个样本以至两个不同总体之间是否存在某种差异性,如比较男生样本和女生样本的平均记忆力水平、场依存性分数等;另一情况是来自于同一总体的两个样本,分别在不同条件下进行同样的测量,然后比较两个样本测量的平均值的差异性,以判断不同条件对测量结果的影响。在这样的两种情况下,两个样本都是独立的,没有关联性,所以叫做独立样本t检验。第十三页,共二十三页,2022年,8月28日

独立样本平均数差异t检验,一般包括:进行样本间的方差齐性检验、计算t和df值、进行统计推断。在SPSS过程中,自动给出方差齐性和方差不齐性的两个结果,同时进行方差齐性检验。研究者根据方差齐性与否选择相应的t和df值,并进行统计推断。这一分析的SPSS操作过程如下:独立样本t检验的过程的演示第十四页,共二十三页,2022年,8月28日3.配对或相关样本间平均数的差异比较

根据某种预测成绩对被试进行配对分组得到两个样本,分别进行不同控制条件下的观测,得到的两组数据就具有一定关联性;或者一组被试参加了不同条件下的观测,得到的两组数据也具有关联性,这种测量被称为重复测量。象这样两种情况下得到的数据必然是一一对应的,可能存在相关,差异的t检验如下列操作程序。配对样本t检验过程的演示第十五页,共二十三页,2022年,8月28日t检验的实例练习某教师欲进行一项数学教学试验,以考验某种新的教学方法是否更有利于学生成绩的提高,于是从全校500名初二学生中抽取了20名学生参加实验班。结果期末数学考试成绩如下,这与全年级学生数学平均为82分相比有无显著差异?你认为其教学试验可以得到什么结论?实验班数学考试成绩为:9587808579808882758176909380908985938575根据简单反应时间对20名被试进行配对分组,然后各自参加不同条件下的汉字识别实验,记录的反应时间和正确率如下表所示,请分析实验条件的不同是否造成了被试汉字识别速度与正确性的显著差异。12345678910组1正确率.35.40.26.50.40.30.25.65.52.45反应时间522450360650450560485650510400组2正确率.50.66.35.58.40.37.28.65.68.50反应时间500430400550470655680350450380第十六页,共二十三页,2022年,8月28日3.从某学校初一(1)班和初一(2)抽取男生和女生各5名参加语数外三门课程竞赛,成绩如下表,请分析各科成绩有无班级差异和性别差异?转到1~4章综合测试题序号初一(1)班初一(2)班性别语文数学外语性别语文数学外语1女857090女8080952男809580女7575903男809075男6078654女858085男7065705女908595男7578856男889085女8076827女908593男7075808女889085男7065829男808370女75608110男759080女807580第十七页,共二十三页,2022年,8月28日阶段小结与练习一、数据文件的建立、编辑与转换1.变量确定与定义(1)必须的变量数=所有分组变量的个数+每一被试接受的观测项目数。其中分组变量包括自变量和准自变量;(2)变量尽量使用英文字母和数字组合,需要时加上标签(Label)和变量值注解;(3)变量值尽量不使用字符型变量,即使是称名变量,也尽量使用数字型变量;(4)谨记:通常情况下,数据文件的行数是与观测的个案数相同的。第十八页,共二十三页,2022年,8月28日2.产生新变量(1)利用Compute命令产生新变量;(2)利用Recode命令产生新变量:依据连续测量的变量得到分组变量或离散变量;将一分组变量的若干变量值合并得到分组数较少的分组变量;(3)利用Categorize命令进行自动分组,产生一个分组变量;(4)产生计数变量、标准分数变量、汇总变量等;(5)利用Weightcases定义加权变量(补充说明)。第十九页,共二十三页,2022年,8月28日3.数据文件的转换(1)选择个案子集(Selectcases)构成新文件;(2)利用Sortcases对个案重新进行排序;(3)利用Mergefiles可以进行文件合并;(4)利用Transpose可以对数据表中的行列进行互换。第二十页,共二十三页,2022年,8月28日二、基本的描述性统计分析1.利用Descriptive可以得到的常用描述性分析结果:平均数、数据总和、标准差、方差、标准误、全距、最大值、最小值、标准分数、偏度和峰度等;2.利用Frequencies可以得到:平均数、中位数、众数、数据总和、频数分布表、标准差、方差、标准误、全距、最大值、最小值、标准分数、偏度、峰度、百分位数、四分位数等;3.利用Explore可以得到上述描述性统计量外,还可以进行极值与奇异值的甄别、分数分布的正态性检验、分组数据的方差齐性检验等。第二十一页,共二十三页,2022年,8月28日三、常用统计图形的制作与编辑(1)常用的统计图包括:条形图(Bar)、直方图(Histogram)、线图(Line)、箱图(Boxplot)、饼图(Pie)、误差条形图(Error-bar)、散点图(scatter);(2)图形编辑内容主要包括:颜色、标题编辑、文字编辑、条形图的三维效果、线条粗细及线条型式等;(3)图形选择的依据是所要展示的信息的性质及信息量;(4)作图前要先有格式正确的数据文件,然后正确地设置各对应坐标变量的性质。第二十二页,共二十三页,2022年,8月28日四、差异性t检验1.单样本的差异性t检验(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论