外语教学中的统计方法_第1页
外语教学中的统计方法_第2页
外语教学中的统计方法_第3页
外语教学中的统计方法_第4页
外语教学中的统计方法_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

外语教学中的统计方法第一页,共四十页,2022年,8月28日为什么要学习统计方法?1.统计方法给我们一种看问题的视角、分析问题的手段,使我们可以从数量的角度,分析和认识现象的特点、规律、模式、趋势或关系。2.统计方法给我们一种精确测量的手段。例如对于“水平高”的概念,我们可以用数学计量的手段给予更精确的描述。3.可以使我们对现象的数量表现,做出更科学的判断。4.增强研究的自主性。数据收集的过程是自主的,对数据的处理和分析是原创的,得出的结论大大避免了抄袭的危险。第二页,共四十页,2022年,8月28日第一讲基本概念

1.数据类型:定类数据与定距数据

2.总体与样本

3.误差:抽样误差与非抽样误差

4.显著性与显著水平

1.不同的数据需要采用不同的统计方法;

2.人们一般研究的都是样本;

3.统计中误差无所不在;

4.显著性反映的是研究结论的确定性。第三页,共四十页,2022年,8月28日数据类型之:定类数据

定类数据是一种分类数据。它是对观测对象按不同特性分类,并统计各类出现的次数(频数)后得到的结果。例如可以按性别、班级、课程等进行分类统计。定类测量中的类没有大小之分,只有频数高低。不能在类之间进行数学运算。性别(n=50)课程(n=50)男(1)女(2)精读写作口语翻译

20

30

45

40

20

48第四页,共四十页,2022年,8月28日数据类型之:定距数据

定距数据是对测量对象按一定尺度测量后得出的数值。所用测量尺度有恒定的单位,单位之间的距离是相等的。例如对成绩、年龄等的测量通常得到的是定距数据。人们可以对定距数据进行数学运算,比较不同数值之间的大小。A班学生的期末考试成绩(n=25)66686956777457727464805868518272756384786771767566第五页,共四十页,2022年,8月28日总体

总体指具有相同特征或者性质的所有个体之和。总体可大可小。例如二语学习者是大总体,某校一年级新生则是小总体。样本样本指从总体中选取的一部分个体。由于常常不能直接研究总体,所以人们常常通过样本来推断总体。样本有随机样本和非随机样本之分。第六页,共四十页,2022年,8月28日抽样误差

抽样误差是客观存在。只要从总体中抽取样本,就会存在抽样误差。从一个总体中抽取的样本均值与总体均值之间多数存在差异。从一个总体中抽取的不同样本均值之间也多数存在差异。为了减少抽样误差,最好用随机抽取的大样本。第七页,共四十页,2022年,8月28日Mean=28Mean1=25Mean2=30第八页,共四十页,2022年,8月28日非抽样误差

非抽样误差是由于技术上原因,如测量工具不准,或是人为操作造成的误差。比较典型的非抽样误差是考试分数合计错误,或者是数据录入失误。避免非抽样误差的方法是仔细测量和认真录入与核对。第九页,共四十页,2022年,8月28日显著性

显著性的概念涉及统计分析结果的可靠性。显著性检验用于验证统计结果是自然存在的还是由偶然因素如误差造成的。显著性水平显著性水平是衡量显著性的标准。在社会科学和应用语言学研究中,通常设定的显著水平为p=0.05。大于0.05的统计结果,通常说无显著差异,或无显著相关。等于/小于0.05的统计结果,通常说有显著差异,或显著相关。第十页,共四十页,2022年,8月28日描述统计平均值、标准差、交互表、频数表第十一页,共四十页,2022年,8月28日平均值:所有个值之和除以个值的数目。

总体均值用μ表示,样本均值用

表示。第十二页,共四十页,2022年,8月28日70个学生的四级平均成绩第十三页,共四十页,2022年,8月28日标准差:是数据内部差异的一种量度。标准差越大,内部差异也越大。

例:两个班期末考试平均分相等,甲班的标准差为5分,乙班的标准差为10分,说明乙班的内部差异大于甲班。第十四页,共四十页,2022年,8月28日70个学生四级成绩的标准差第十五页,共四十页,2022年,8月28日EmpiricalRule1经验法则1正态分布的数据

-1σ

μ+1σ大约68%的数值在均值的一个标准差范围内第十六页,共四十页,2022年,8月28日EmpiricalRule2正态分布的数据

-2σ

μ+2σ大约95%的数值在均值的2个标准差范围内。第十七页,共四十页,2022年,8月28日EmpiricalRule3正态分布的数据-3σ

μ+3σ几乎全部(99.7%)数值在3个标准差范围内。第十八页,共四十页,2022年,8月28日大学英语四级考试成绩分布均值:500标准差:70

430500570大约68%的四级考试分数在430到570之间。第十九页,共四十页,2022年,8月28日大学英语四级考试成绩分布2

360500640大约95%的考试分数在360到640之间。第二十页,共四十页,2022年,8月28日英语四级考试成绩分布

290500710几乎全部(99.7%)数值在290到710之间。第二十一页,共四十页,2022年,8月28日交互表

交互表是对定类数据的一种归纳和表现形式。交互表根据行数和列数,分别有2x2表,2x3表,或者jxk表。焦虑成绩正常不正常及格

60

7不及格

4

30第二十二页,共四十页,2022年,8月28日频数表

一种频数表是简单罗列数据中每个数值出现的次数;另一种频数表是按一定的区间,分组统计和罗列数值出现的次数。数值频数数值频数

5556585960626523451089

70758186899091

131075321数值区间频数

55-5960-6970-7980-8990-99

142723153第二十三页,共四十页,2022年,8月28日推断统计

推断统计主要根据概率理论,利用各种分布模型,进行组之间、变量之间的差异或相关的显著性检验。推断统计主要回答的问题是:1)不同组或不同变量的均值之间存在的差异是否显著?2)两个变量之间的相关关系是否显著?第二十四页,共四十页,2022年,8月28日常用的差异检验方法

1)独立样本的t检验

2)成对样本的t检验

3)一元方差分析

4)卡方检验一般情况下:1)如果数据是定距数据,根据数据情况,分别采用前三种方法;2)如果数据是定类数据,采用卡方检验的方法。第二十五页,共四十页,2022年,8月28日独立样本t检验(independentsamplet-test)

独立样本t检验用于检验同一个变量下的两组数值之间是否存在显著差异。应用的研究问题:1)一次考试中的两个班的成绩是否存在显著性差异?2)一次考试中的男女生的成绩是否存在显著性差异?第二十六页,共四十页,2022年,8月28日独立样本t检验要看计算出的t值和对应的sig.值,或者说显著性水平。如果sig.值大于0.05,两组之间没有显著差异,如果sig.值小于0.05,两组之间存在显著差异。在报告时,要报告t值和sig.值。例:独立样本t检验的结果显示,多媒体教学实验班和常规教学班(对照班)的英语水平不存在显著性差异(t=1.11,p>0.05)。也就是说,多媒体教学并没有带来比常规教学更好的教学效果。第二十七页,共四十页,2022年,8月28日成对样本的t检验(pairedsamplet-test)

成对样本的t检验用于检验就同一个变量对同一组对象两次收集的数据之间是否存在显著差异。应用的研究问题:1)某年级学生进校时英语水平和现在英语水平之间是否存在显著差异?2)某级学生经过一年的学习后,学习动机是否发生了改变?第二十八页,共四十页,2022年,8月28日成对样本t检验也看计算出的t值和对应的sig.值,或者说显著性水平。如果sig.值大于0.05,成对样本没有显著差异,如果sig.值小于0.05,样本之间存在显著差异。在报告时,要报告t值和sig.值。例:成对样本t检验的结果显示,某年级新生进校后经过一段时间的学习,成绩有了显著提高,第二次考试成绩显著高于进校时的成绩(t=3.12,p<0.05)。第二十九页,共四十页,2022年,8月28日方差检验(F检验)(F-test)

方差检验用于检验一个变量下的三组之间是否存在显著性差异。例1:研究问题:三种词汇学习方法的效果是否有显著差异?方法1:有意学习方法2:附带学习方法3:附带学习+有意注意例2:研究问题:三种词汇教学方法的效果是否有显著差异?方法1:词表法方法2:阅读法方法3:写作法第三十页,共四十页,2022年,8月28日方差分析要看计算出的F值和对应的sig.值,或者说显著性水平。如果sig.值大于0.05,说明各组间没有显著差异,如果sig.值小于0.05,至少两组之间存在显著差异。在报告时,要报告F值和sig.值。例:研究问题:三种不同的词汇学习方法对词汇学习是否有不同的效果?对词汇考试数据的方差分析显示,三种方法对词汇学习有不同的效果(F=12,p<0.05)。第三十一页,共四十页,2022年,8月28日方差分析的后检验(posthoctest)如果要检验哪两组之间存在显著性差异,可以1)每两组之间做独立样本的t检验;2)做方差分析的后检验,看那两组之间存在差异。第三十二页,共四十页,2022年,8月28日相关分析(correlationtest)

相关分析考察两个变量之间是否存在一定的关系;如果是,这种关系有多强;而且要检验这种关系是否具有显著性。例如:1)学习者二语词汇水平与阅读理解水平的关系?2)学习者二语词块知识与二语水平的关系?3)学习者二语学习动机与二语水平之间的关系?第三十三页,共四十页,2022年,8月28日相关分析要看计算出的r值和对应的sig.值。如果sig.值大于0.05,说明变量之间没有显著相关;如果sig.值小于0.05,说明变量之间存在显著相关。在报告时,要报告r值和sig.值。例:经过统计,我们发现搭配能力与语言能力中度相关。其中,搭配能力与阅读能力相关系数为.47,显著性达到p<.001;搭配能力与写作能力的相关系数为.514,显著性达到p<.001;搭配能力与听力的相关系数为.443,显著性也达到p<.001;搭配能力成绩与三项成绩总和的相关系数为.545,显著性达到p<.001。(黄强,2002)第三十四页,共四十页,2022年,8月28日卡方检验

卡方检验应用于定类数据。

1)对单向(单行、单列)分类数据的分析;

2)对多向(多行、多列)分类数据的分析。单向分类数据多向分类数据成绩优良中及格不及格合计人数

571315646教龄因素看法5年以上1-5年教学环境

67

35学习者因素

19

49第三十五页,共四十页,2022年,8月28日卡方检验用于单向分类数据的检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论