lecture 5 基本统计概念_第1页
lecture 5 基本统计概念_第2页
lecture 5 基本统计概念_第3页
lecture 5 基本统计概念_第4页
lecture 5 基本统计概念_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、教育研究方法教育研究方法基本统计概念基本统计概念 Basic S136179603911授课内容:基本统计概念授课内容:基本统计概念 + 讨论讨论1. 正态分布正态分布 (normal distribution) 2. 方差方差 (variance)、标准差)、标准差 (standard error) 3. Z 分数分数 (Z- score)4. 偏态(偏态(skewed ) 5.5. 参数(参数(parameter)与统计量(与统计量(statistic) 6. 描述性统计描述性统计 (descriptive statistics) )-7. 零相关零相关 (zero correlation

2、)8. 正相关正相关 (positive correlation)9. 标准分数(标准分数(standard score) 或或 Z 分数分数 (Z- score)10. 第一类型错误第一类型错误 (Type I error)11. 第二类型错误第二类型错误 (Type II error)2统计概念的重要性:授课计划统计概念的重要性:授课计划 前几周:概况、主要研究方法前几周:概况、主要研究方法 本周和下周:基本统计概念、数据分析本周和下周:基本统计概念、数据分析 最后几周:教育实验设计、案例评述、报告最后几周:教育实验设计、案例评述、报告- 承上启下承上启下 完整、深入学习的基础完整、深入学

3、习的基础 有一定难度有一定难度3基本统计概念:正态分布基本统计概念:正态分布 正态分布正态分布 (normal distribution),又名),又名 高斯分布(高斯分布(Gaussian distribution), 统计学最重要的基础概念,运用最广泛的分布。统计学最重要的基础概念,运用最广泛的分布。 抽样和抽样统计抽样和抽样统计 Z 分数、分数、Z 检验、方差分析、回归分析等检验、方差分析、回归分析等 近似描述很多现象的统计规律:近似描述很多现象的统计规律: “中间大,两头小中间大,两头小”(大样本)(大样本) 人们的身高、体重、考试成绩、智商人们的身高、体重、考试成绩、智商 各种各样的

4、测量误差各种各样的测量误差 运用:估计频数分布、制定参考值范围、质量控制运用:估计频数分布、制定参考值范围、质量控制4562006年四川省普通高考文科语文年四川省普通高考文科语文789正态分布曲线正态分布曲线 正态分布由两个参数决定:正态分布由两个参数决定: 平均值和方差平均值和方差 N(, 2 ) 其概率密度函数曲线其概率密度函数曲线f(x)的特点:的特点: 对称性:平均值为对称线对称性:平均值为对称线 以横轴为渐近线以横轴为渐近线 方差越小,分布越集中在均值附近,图形越陡峭方差越小,分布越集中在均值附近,图形越陡峭 拐点拐点/反弯点(反弯点(inflection point)在离平均值的距

5、离在离平均值的距离 为一个标准差的地方为一个标准差的地方 10方差、标准差方差、标准差 方差(方差(variance):): 对随机变量离散性质的反映和度量对随机变量离散性质的反映和度量 每一个体每一个体(观测值观测值)偏离总体平均值的程度偏离总体平均值的程度 方差的计算:方差的计算: 各数据与平均数的差的平方的平均值各数据与平均数的差的平方的平均值 标准差标准差 standard deviation (SD): 方差的平方根方差的平方根1112方差越小,方差越小, 图形图形 越陡峭越陡峭13正态分布:钟形曲线,不是抛物线正态分布:钟形曲线,不是抛物线14标准正态分布标准正态分布1516(教材

6、(教材p.348) ):正态分布函数曲线正态分布函数曲线下下 68.3%的的面积面积在平在平均均值左右的值左右的1个标准差(个标准差( ) )范围范围內內 95.4%的的面积面积在平在平均均值左右的值左右的2个标准差个标准差(2(2 ) )范范围围內內 99.74%的的面积面积在平在平均均值左右的值左右的 3个标准差个标准差(3(3 ) )范围范围內內- “68-95-99.7法则法则”或或“经验法则经验法则” 99.994%的的面积面积在平在平均均值左右的值左右的4个标准差个标准差(4(4 ) )范围范围內內17“小概率事件小概率事件” 通常指发生的概率小于通常指发生的概率小于5%的事件(的

7、事件(2 之外)之外) 在一次试验中该事件是几乎不可能发生的。在一次试验中该事件是几乎不可能发生的。 我们也有我们也有5%的犯错误的可能:的犯错误的可能: 例如:假设检验的第一类型错误例如:假设检验的第一类型错误 18标准正态分布标准正态分布 (Standard normal distribution) 什么是标准正态分布?什么是标准正态分布? = 0 ,2 = 1,即,即 N(0,1) Z分数公式分数公式 z=(x-)/ 原始分原始分数数和和总体总体平均值平均值之之间间的距的距离离,以,以标准标准差差为单位计算。为单位计算。 反映个体在团体中相对位置反映个体在团体中相对位置19Z 转换 -3

8、 -2 -1 0 1 2 3 20问题:三门功课中,乙同学哪门问题:三门功课中,乙同学哪门功课的排名最好?甲同学呢?功课的排名最好?甲同学呢?科目科目学生甲学生甲 学生乙学生乙 班级平均班级平均数学数学728880物理物理444242化学化学77627421计算标准分数计算标准分数科目科目 学生学生甲甲学生学生乙乙班级班级平均平均班级班级标准标准差差学生学生甲标甲标准分准分学生学生乙标乙标准分准分数学数学 7288808物理物理 4442422化学化学 776274622计算标准分数计算标准分数科目科目 学生学生甲甲学生学生乙乙班级班级平均平均班级班级标准标准差差学生学生甲标甲标准分准分学生学

9、生乙标乙标准分准分数学数学 7288808- 11物理物理 444242210化学化学 77627460.5- 223练习:刘小兰哪门成绩比较好?练习:刘小兰哪门成绩比较好? 上学期期末考试,语文全班平均分上学期期末考试,语文全班平均分为为73分,方差为分,方差为9分,刘小兰得了分,刘小兰得了78分;数学全班平均分为分;数学全班平均分为80分,方分,方差为差为4分,刘小兰得了分,刘小兰得了83分。分。 Z(语文语文)=(78-73)/3=1.67 Z(数学数学)=(83-80)/2=1.50 小兰语文的班级排名比数学好小兰语文的班级排名比数学好24练习练习 某市抽样调查,考生的英语成绩(按百分

10、某市抽样调查,考生的英语成绩(按百分制计算,近似正态分布),平均成绩为制计算,近似正态分布),平均成绩为72 分,分,96分以上的考生占考生总数的分以上的考生占考生总数的2.3%,试求考生的英语成绩在试求考生的英语成绩在60分到分到84分之间的分之间的概率概率. (大致估算)(大致估算) 2 近似近似 = (96 -72) = 24 约约 为为 12 60 84 之间有之间有68.3% 的学生的学生 / 概率概率252627标准分数的其他形式标准分数的其他形式 T分数分数 T = 10 * Z + 50 (1939年,美国麦柯尔提出)年,美国麦柯尔提出) 美国大学入学考试分数(如美国大学入学考

11、试分数(如SAT) CEEB = 100 * Z + 500 美国韦克斯勒美国韦克斯勒(Wechsler)智力测验的智商智力测验的智商 分量表智商:分量表智商:DIQ = 3 * Z + 10 总量表智商:总量表智商:DIQ = 15 * Z + 100 美国斯坦福美国斯坦福-比纳智力比纳智力(Stanford-Binet)测验的智商测验的智商 DIQ = 15 * Z + 100 (2003年以前年以前: DIQ=16*Z + 100) 2829思考思考高考成绩为何要转化为标准分?高考成绩为何要转化为标准分?标准分与原始分各有何优劣之标准分与原始分各有何优劣之处?处?30高考标准分数高考标准

12、分数 原始分制度的主要缺点:原始分制度的主要缺点:(教育测量学的观点)(教育测量学的观点) 不能反映不能反映考生成绩在团体中的位置考生成绩在团体中的位置 (尤其对选拔性考试而言)(尤其对选拔性考试而言) 各科成绩各科成绩不能直接比较不能直接比较 (命题(命题难度难度不同,试卷的不同,试卷的区分度区分度也不同)也不同) 各科原始分相加不合理各科原始分相加不合理 (难度不一;每科实际平均分在总分中比例与预(难度不一;每科实际平均分在总分中比例与预期不同)期不同)31高考标准分数高考标准分数 报告报告标准分、百分等级标准分、百分等级: 各科,总分(改称综合分)各科,总分(改称综合分) 各科各科标准分

13、标准分及及百分等级百分等级获得方法:获得方法: 1.该科原始分在全省考生属类别团体(如理工类、文史该科原始分在全省考生属类别团体(如理工类、文史类)中排序类)中排序 2.每一个原始分以下的考生占团体考生总数的百分比每一个原始分以下的考生占团体考生总数的百分比 -百分等级百分等级 3.由每个原始分的百分等级查由每个原始分的百分等级查正态分布表正态分布表,找出对应的,找出对应的正态分数正态分数 4.按正态分数给出标准分:按正态分数给出标准分: 标准分标准分 = 500 + 100正态分数正态分数 标准分在分之间标准分在分之间 32高考标准分数高考标准分数 综合分的标准分和百分等级综合分的标准分和百

14、分等级: 把考生各科的标准分标准分相加 按其和的大小从高到低排序 确定其百分等级、标准分 【例】高考成绩(标准分制度)通知单(理工类) 考号 姓名 成绩 综合分 语文 数学 外语 物理 化学 * * 标准分 566 600 650 485 553 562 百分等级 74.584.1 93.3 44 70.2 73.2 33标准分的缺点?标准分的缺点? 标准分标准分2000年前很热门年前很热门 1988年开始,陆续实行于广东、海南、河南、陕西、广西、山东、福建 广东广东 (1988年年- 2006年)年) 海南海南 云南(云南(2011年年 - )34标准分的缺点标准分的缺点 一旦出现改分错误,

15、纠正很麻烦一旦出现改分错误,纠正很麻烦 不利于偏科的同学不利于偏科的同学 考生投机选科目报考考生投机选科目报考 对于有些对于有些 3+X考生不利考生不利 广东成绩较好的学生报文科的更多广东成绩较好的学生报文科的更多 只知道排名,不知道具体答卷情况只知道排名,不知道具体答卷情况35偏态(偏态(skewed) ) 分布分布 负偏态分布(左偏)负偏态分布(左偏) 长尾向左延伸,分布较多于右侧长尾向左延伸,分布较多于右侧 e.g. 容易的考试的学生成绩 正偏态分布(右偏)正偏态分布(右偏) 长尾向右侧延伸,分布较多于左侧长尾向右侧延伸,分布较多于左侧 e.g. 收入、难度大的考试的学生成绩3637sk

16、ew is -0.43(251 trading days) 38描述性统计描述性统计 (descriptive statistics) ) mode (众数)(众数)具有最大频率的随机变量的取值具有最大频率的随机变量的取值 average (平均数)(平均数) median (中数)(中数)累积概率累积概率50%时对应的观测值时对应的观测值 在正态分布中,在正态分布中,mode=median=expectation 描述性统计描述性统计 (descriptive statistics) 推论性统计推论性统计 (inferential statistics) 39总体、个体、样本总体、个体、样本

17、 研究举例:研究举例: 受过良好早期教育儿童的智商是受过良好早期教育儿童的智商是否高于一般水平否高于一般水平 总体:总体: 缩小范围缩小范围 总体:总体:“中国大城市现年中国大城市现年6-9岁岁的儿童的儿童” 个体个体: 构成总体的每个基本单元构成总体的每个基本单元 样本:从总体中抽取出的一部分个体,目的样本:从总体中抽取出的一部分个体,目的在于为我们所实验或观察,以达到在于为我们所实验或观察,以达到“从局部从局部推断总体推断总体”。40参数参数(parameters)和统计量和统计量(statistics) 参数参数 总体总体, 希腊字母表示希腊字母表示 例如:江西成年男子的真实的平均身高例

18、如:江西成年男子的真实的平均身高 吉安市成人收入的中数吉安市成人收入的中数(median) 统计量统计量 statistic 样本样本 例如:江西随机抽样例如:江西随机抽样1000名成年男子的平均身高;名成年男子的平均身高; 随机抽样随机抽样1000个吉安市成人的收入的中数个吉安市成人的收入的中数 统计的目的统计的目的: 用样本统计量去估计或推测总体参数的大小。用样本统计量去估计或推测总体参数的大小。 平均数:平均数: 样本平均数(用样本平均数(用X表示)表示) 总体平均数(用总体平均数(用表示)表示) 方差:方差: 样本方差(用样本方差(用S2表示)表示) 总体方差(用总体方差(用2表示)表

19、示) 公式的区别: 样本样本方差 vs. 总体总体方差 分母:(n-1) vs. N41 抽样误差抽样误差 (Sampling error) 抽样误差抽样误差 ( sampling error)vs. 样本偏差样本偏差 (sampling bias) 中心极限定理(中心极限定理( Central Limit Theorem ):概率论第二大定理 当样本当样本n足够大时,样本的平均值呈正态分布。足够大时,样本的平均值呈正态分布。 标准误(标准误(Standard Error) :Standard Deviation of sample mean = 标准差标准差/ 根号根号n 4243概率论第一

20、大定理概率论第一大定理 大数定理(大数定理( the law of large numbers) 在试验不变的条件下,重复试验多次,随在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。机事件的频率近似于它的概率。44变量变量 variable 变量:总体的一个特征(属性)的数量化变量:总体的一个特征(属性)的数量化对应着一个对应着一个 变量变量 总体特征往住有多个,一个总体可以对应总体特征往住有多个,一个总体可以对应多个随机变量多个随机变量 因变量因变量 自变量自变量45变量(变量(variable)的数值类型)的数值类型 分类变量(分类变量( Categorical Varia

21、ble or Nominal Variable ) 例如:例如:“性别性别”、“民族民族”、“考试及格与否考试及格与否” dummy variable 顺序变量顺序变量 ( Ordinal Variable ) 例如:例如:“喜好程度喜好程度”、“文化程度文化程度” 数值型变量(数值型变量(Quantitative Variable or Interval Variable) 例如:分数,年龄,工资,智商例如:分数,年龄,工资,智商46H0为真为真H0为假为假接受接受H0决策正确决策正确(信赖水准(信赖水准)概率为(概率为(1- )第第II类型错误类型错误概率为(概率为()拒绝拒绝H0第第I类

22、型错误类型错误(显著水准显著水准)概率为(概率为()决策正确决策正确(检定力(检定力)概率为(概率为(1-)47第一类型错误(第一类型错误(Type I error) 例:在发电厂附近长大对儿童的智力的影响例:在发电厂附近长大对儿童的智力的影响 H0: 发电厂对儿童智商没有影响发电厂对儿童智商没有影响,即即=100 H1: 不等于不等于100。 韦克斯勒韦克斯勒(Wechsler) DIQ = 15 * Z + 100斯坦福斯坦福-比纳智力比纳智力(Stanford-Binet) DIQ = 16 * Z + 100 Type I error:假如事实是电厂对智商的没有影响,而该研究的结论假如

23、事实是电厂对智商的没有影响,而该研究的结论是推翻是推翻H0。 设定设定 (level of significance) 1. =0.01的意义的意义 2. 把把 =0.01 改设为改设为 =0.05,第一类型错误的概率是,第一类型错误的概率是增加了还是减少了?增加了还是减少了?48第二类型错误(第二类型错误(Type II error) 当当H0为假时,接受为假时,接受H0. 假如事实是生活在电厂对儿童的智力有影假如事实是生活在电厂对儿童的智力有影响,而该研究的结论是不推翻响,而该研究的结论是不推翻H0。49第一类型错误(第一类型错误(false positive) 类似类似“crying w

24、olf” - “false alam” “狼来了狼来了” - “错误的警报错误的警报” H0: 没有狼没有狼- “未能报警未能报警”(failing to raise an alarm)第二类型错误(第二类型错误(false negative)50第一、二类型错误的危害第一、二类型错误的危害 H0:产品是合格的:产品是合格的 NASA在挑选电子配件是应该着重避免哪类错误?在挑选电子配件是应该着重避免哪类错误?NASA(The National Aeronautics and Space Administration ) 避免第二类型错误避免第二类型错误 H0:嫌疑人是无罪的:嫌疑人是无罪的 在

25、法庭上应更注意避免哪类错误?在法庭上应更注意避免哪类错误? 避免第一类型错误避免第一类型错误 (注重人权)(注重人权)51第一、二类型错误的危害第一、二类型错误的危害 医学上医学上 H0:被测是健康的:被测是健康的 H0:被测无艾滋等血液传染病:被测无艾滋等血液传染病 献血者献血者 vs. 待确诊的人待确诊的人 H0:被测无乳腺癌:被测无乳腺癌 全球,美国出错率高全球,美国出错率高 荷兰等最低荷兰等最低 :审查两次,:审查两次, 设定的更低设定的更低 52第一、二类型错误的危害第一、二类型错误的危害 2012/ 5/17 纽约时报纽约时报医学报告(前列腺癌)医学报告(前列腺癌) H0:被测是健

26、康的:被测是健康的 (无前列腺癌的隐患或病(无前列腺癌的隐患或病症)症) 至多至多1/3000 获救;获救; 1/3000 致死,致死,43/1000 人人 (1/23)受严重损害受严重损害 教育上教育上 H0:学生智力正常:学生智力正常 53第一、第二类型错误的避免第一、第二类型错误的避免 n(样本数)不变,(样本数)不变, 跷跷板的关系跷跷板的关系 两类错误都减小两类错误都减小 n 增大增大 判断题:判断题:“抽样统计时,样本越大越好。抽样统计时,样本越大越好。”54Null Hypothesis (H0) is trueAlternative Hypothesis (H1) is tru

27、eAccept Null HypothesisRight decision(level of confidence)概率为(概率为(1- )Wrong decisionType II ErrorFalse Negative概率为(概率为()Reject Null HypothesisWrong decisionType I ErrorFalse Positive(level of significance)概率为(概率为()Right decision(Power)概率为(概率为(1-)55Alternative hypothesis 备择假设备择假设 方向性(方向性(directional)

28、/单侧(单侧(one-tailed) 非方向性(非方向性(nondirectional)/双侧(双侧(two- tailed)56维生素维生素B6的额外摄入是否对少儿智的额外摄入是否对少儿智力的发育有显著影响力的发育有显著影响(1)该研究的备择假设)该研究的备择假设H1(alternative hypothesis)是是“维生素维生素B6的摄入对少儿智力发的摄入对少儿智力发育有显著影响育有显著影响”。(2)该研究要验证的假设是非方向性假设)该研究要验证的假设是非方向性假设(non-directional hypothesis)。)。(3)该研究的自变量)该研究的自变量(independent

29、variable)是是“是否额外摄入维生素是否额外摄入维生素B6”,因变量,因变量(dependent variable)是是“儿童的智力发育儿童的智力发育”。57练习:教室门的最低高度?练习:教室门的最低高度?学生的平均身高为学生的平均身高为175厘米,厘米, 方差为方差为36平平方厘米,教室门的高度应不低于方厘米,教室门的高度应不低于99%的的学生的身高。学生的身高。 解答:解答:z=(x-175)/6 = 2.33 ( 查表:单侧值)查表:单侧值) x= 175+14.0 x=189 (厘米)厘米) 车门最低为车门最低为189厘米厘米58参考值范围参考值范围(%)单侧单侧双侧双侧800.

30、841.28901.281.65951.651.96992.332.585960 抽样误差抽样误差 (Sampling error) 抽样误差抽样误差 ( sampling error)vs. 样本偏差样本偏差 (sampling bias) 中心极限定理(中心极限定理( Central Limit Theorem ):概率论第二大定理 当样本当样本n足够大时,样本的平均值呈正态分布。足够大时,样本的平均值呈正态分布。 标准误(标准误(Standard Error) :Standard Deviation of sample mean = 标准差标准差/ 根号根号n 61平均值的平均值的Z 检验检验62Z检验(检验(Z test):举例):举例 假设在江西某地区假设在江西某地区, 三年级语文成绩的平均分是三年级语文成绩的平均分是100,标准,标准差是差是12。该地区有一所学校有。该地区有一所学校有55名三年级学生,他们的名三年级学生,他们的平均分是平均分是96。问该小学的平均分是否显著地低于该地区。问该小学的平均分是否显著地低于该地区的平均值?的平均值?( =0.05)-随机在该地区挑随机在该地

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论