版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第 PAGE25 页 共 NUMPAGES25 页现代心理与教育统计学知识点心理统计学 第一章概述 描述统计 定义:研究如何把心理与教育科学实验或调查得来的大量数据科学的科学的加以整理 概 括和表述 作用:使杂乱无章的数字更好的显示出事物的某些特征,有助于说明问题的实质。具体内容:1数据分组:采用图与表的形式。2计算数据的特征值:集中量数(平均数 中数)离散量数(方差)3计算量事物间的相关关系:积差相关(2列 3列 多列)推断统计 定义:主要研究如何利用局部数据(样本数据)所提供的信息,依据数理统计提供的理 论和方法,推论总体情形。作用:用样本推论总体。具体内容:1如何对假设进行检验。2如何对
2、总体参数特征值进行估计。3各种非参数的统计方法。心理与教育统计基础概念 数据类型 一 从数据来来划分 1计数数据:计算个数或次数而获得的数据。(都是离散数据)2测量数据:借助一定测量工具或测量标准而获得的数据。(连续数据)二根据数据所反映的测量水平 1称名数据(分类)定义:指用数字代表事物或数字对事物进行分类的数据。特点:数字只是事物的符号,而没有任何数量意义。统计方法:百分数 次数 众数 列联相关 卡方检验等。(非参检验)2顺序数据(分类 排序)定义:指代事物类别,能够表明不同食物的大小 等级或事物具有的某种特征的程度的数 据。(年级)特点:没有相等单位没有绝对零点。不表示事物特征的真正数量
3、。统计方法:中位数 百分位数 等级相关 肯德尔和谐系数以及常规的非参数检验方法。3等距数据(分类 排序 加减(相等单位)(真正应用最广泛的数据)定义:不仅能够指代物体的类别 等级,而且具有相等的单位的数据。(成绩 温度)特点:真正的数量,能进行加减运算,没有绝对零点 ,不能进行乘除计算。统计方法:平均数 标准差 积差相关 Z检验 t检验 F检验等。4比率数据(分类 排序 加减法 乘除法(绝对零点)定义:表明量的大小,也具有相等单位,同时具有绝对零点。(身高反应时)特点:真正的数字,有绝对零点,可以进行加减乘除运算。在统计中处理的数据大多是顺序数据和等距数据。三 按照数据是否具有连续性 离散数据
4、 连续数据 变量观测值随机变量 变量:指心理与教育实验观察调查种想要获得的数据。数据获得前用“_”表示,即为一 个可以取不同熟知的物体的属性或事件,其数值具有不确定性,因而称为变量。观测值:是研究中确定的某一变量的取值。随机变量:表示随机现象各种结果的变量称为随机变量 三 总体 样本 个体 总体 :具有某种共同特质的一类事物。(欲研究的研究范围)样本 :构成总体的每个基本单元。个体:从总体重抽取的部分个体组成的群体。样本容量超过30为大样本反之为小样本。四 次数比率频率与概率 次数:某一事件在某一类别中的数目。比率:(比例 百分数)两个数相比。频率:(相对次数)某一事件发生的次数被总的事件数目
5、出。常用比例 百分数表示。概率:用符号P表示,指某一事件在无限观测中所能预料的相对出现的次数。五统计量和参数 1参数:(总体参数)描述一个总体情况的统计指标用希腊字母表示。(小写)(大写 表示运算符)总体平均数 总体标准差 总体相关系数 总体回归系数 2统计量:(特征值 样本统计量)描述一组数据的情况。样本统计量用英文表示 样本平均数 样本标准差 样本相关系数 样本回归系数 小结 描述统计 心理与教育统计学内容 推论统计 实验设计 计数数据 测量数据 数据类型 称名数据 顺序数据 等距数据 比率数据 离散数据 计数数据 变量 观测值 随机变量 心理与教育统计基础概念 总体 样本 个体 次数 频
6、数 概率 参数 统计量 练习题 1等距量表的特点是()A 无绝对零点,无相同单位。B 无绝对零点,有相同单位。C 有绝对零点,无相同单位。D 有绝对零点,有相同单位。2下列量表中具有绝对零点的是()A 称名量表 B 顺序量表 C 等距量表 D 比率量表 3教师的职称和薪水这两个变量的数据类型分别属于()A 命名数据 等比数据 B 等距数据 等比数据 C 顺序数据 等距数据 D 顺序数据 等比数据 4下列数据类型属于比率数据的是()A 智商分数 B 反应时 C 年纪 D 数学成绩 练习题思路解析 1 B 见第一页 2 D 见第一页 3 D 职称:讲师 副教授 教授 这三个职称能排序,但不能做加减
7、法。(顺序数据)薪水:_ y z 能排序能做加减法,也具有绝对零点(没工资)能做乘除法。(比率数据)4 B 智商分数:加减法可做不能做乘除(智商测量表测量出来人为规定零)(等距数据)反应时:有绝对零点(比率数据)年级:只能大小排序(顺序数据)数学成绩:人为规定零点(等距数据)第二章统计图表(重要但不怎么考)(图表的特点)第一节 数据的初步整理(将数据制成统计图表的第一步)一 数据排序 排序就是按照某种标准,对收集到的杂乱无章的数据按照一定的顺序标准进行 排列。数据排序是正理数据最简单的方法。二 统计分组 统计分组只根据被研究对象的特征,将所得到的数据划分到各个分组中去。数据的取舍原则:三个标准
8、差原则 三 统计表 统计表:用来表达统计指标与被说明的事物间关系的表格。特点:简洁 清晰 准确 表中数据易于比较分析p 。三线表 四 统计图 统计图:用来表达统计指标与被说明事物之间数量关系的图形,是统计数据资料的可 视化显示方式。第二节 次数分布表(最重要的一类统计表)(皮尔逊 次数分布表 次数分布图)一 简单次数分布表(既可用于计数数据的整理,又可用于测量数据的整理)简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统 计表。特点:对数据资料的来没有过多要求,编制过程简单,应用广泛。二 分组次数分布表 当数据的取值过多时,不适合每个值记录一个频次。把所有数据先划分为
9、若干个分组区间,然后将数据按其数值大小划归相应组内,分别计 算各个组别中的数据个数,再用列表的形式呈现出来,就构成了分组次数分布表。制作过程:1 求全距(离散量度)全距=最大值-最小值(离散 2 决定组数 组数 (N为数据个数,K取近似整数)(经验公式)3 决定组距(任意一组的起点和终点之间的距离)组距是一个组的上限与下限之差 组距=全距/组数 4 列出分组区间(组限)(一个组起点值与终点值之间的距离)组上限:一个组的终止点 组下限:一个组的起始点 表示方法:表述组限:10-19 20-29 30-39 精确组限:9.5-19.499 19.5-29.499 29.5-39.499 分组次数分
10、布表的意义与缺点 意义:显示数据的分布状况,集中状况。假设:各区间的数据均匀分布,并用各组的组中值代表各原始数据。缺点:由于假设所造成的误差为归组效应。三 相对次数分布表 1 含义:相对次数是指各组次数f对数据总个数N的比值,用符号f/N表示。所有相对次数之和 f/N等于1. 2 制作:将分组次数分布表的各组次数转化为相对次数,用f/N或f/N100%作标 志来表示次数就制成了相对次数分布表。四 累加次数分布表 1 实际累加次数 把各组次数f由下而上或由上而下依次累加的和,用符号cf表示。2 相对累加次数 把各组的相对次数p由上而下或由下而上依次累加的和,累加之和为1. 五 双列次数分布表(相
11、关次数分布表)1 含义:对有联系的两列变量用一个表来表示次数分布。(体重与血压;智力与成 绩)2 制作:先按照分组次数表的编制方法,分别列出各变量的分组区间,登记时,每 次同一对变量同时登记在相应的格内。第三节 次数分布图 一 直方图(又称等距直方图,用于等距变量)用一系列宽度相等、高度不一的矩形表示数据分布的统计图。以矩形的面积表示连续性 随机变量次数分布的图形。一般用纵轴表示数据的频数,用数轴表示数据的等距分组点,也就是各组分组区间的 上限和下限,有时也使用组中值。二 次数多边图(变化趋势)一种线形图,凡是等距分组的可以用直方图表示的数据,都可以用次数多边图表示。绘制时,横坐标是用各分组区
12、间组中值表示的连续变量,纵坐标是数据的次数。以每个 分组区间的组中值为横坐标,一个组的次数为纵坐标标点,连接各点,就成为一条折线。三 累加次数分布图 在累加次数分布表的基础上绘制的,有直方图式和曲线式两种,最为常用的是累加曲线 图。累加次数分布曲线 横轴:原始分数 百分位数 纵轴:等级排名 百分等级 正偏态分布:小端的数据特别多,大端的数据不是很多,比较分散,表现在曲线就是上肢 长于下肢。(分数分布在低端)负偏态分布:大端的数据比较多,小端的数据不是很多,但比较分散,表现在曲线就是下 肢长于上肢。(分数分布在高端)正态分布 :中端的数据最多,两端的数据少,平均两侧的数据个数差不多,表现在曲线
13、是上肢和下肢长度相当。(中数众数平均数三合一、曲线上拐点50%)第四节 其他类型的统计图表 一 条形图 表示的是离散型数据资料,宜用宽度相同的条形长短或高低来表示统计数据的大小或变 动情况的统计图。一个是分类轴(横轴),表示类别,描述的是计数的数据。(离散数据(类别)一个是数量轴(纵轴),表示大小多少,描述的是计量数据。(连续数据(测量数据)条形图与直方图的本质区别(选择 简答 多选)条形图与直方图的本质区别 条形图 直观图 数据类型 离散数据(分类)连续数据(分组区间)数据表示方式 直条的长度 面积 坐标轴(横轴)分类轴 刻度值 直观状态 有间隔 没有间隔 二 圆形图(饼图)以整个圆的面积带
14、鞭被研究对相的总体,按照组成部分占总体的比重大小,把圆面积分 成若干扇形,用来表示某一现象的部分对总体的比例关系。适用于离散性的数据。三 线形图 1 用来表示连续性资料,是以起伏的线条来说明事物因时间、条件推移而变迁的趋势。(考点)2 表示的是两边两之间的函数关系或描述某种现象的发展趋势,或一种现象随着另一种 现象变化发展的情形。3 通常用横轴表示自变量,用纵轴表示因变量。四 散点图 1 用相同大小的圆点的多少或疏密表示统计资料数量的大小以及变化趋势等。2 还可以表示相关程度。(正相关、负相关、无相关、可能相关)练习题 1 某考生最高分为81分,在下列次数分布表中,能直接判断有多少考生得分比他
15、低的 是()A 简单次数分布表 B 分组次数分布表 C 累加次数分布表 D 相对次数分布表 2 运用相对累加次数分布曲线,可以快速计算出原始分数相对应的统计量是()A 百分等级 B Z分数 C T分数 D 频次 3 适用于描述某种心里属性在时间上的变化趋势的统计分析p 图()A 茎叶图 B箱形图 C 散点图 D 线形图 4 用于描述两个变量之间相关关系的统计图()A 直方图 B 线形图 C 条形图 D 散点图 答案及解析 1 C 见第5页 2 A 3 D 见第7页 4 D 前两章 没什么特别重要的知识但不要放松必拿分数。第三章集中量数(2-3选择)数据的集中趋势就是指数据分布中大连数据朝向某个
16、方向集中的程度,用于描述数据集中程度的统计量。第一节 算书平均数 一 概念及计算公式 1概念 算术平均数,是所有观测值(或变量)的总和除以总数所得得商。符号:或 2计算公式 公式一 (平均数的定义公式)公式二 (平均数的估算公式)AM 估算值 例题 现有一组实验观测数据,25 27 28 27 25 29 30 34 32 33.计算他们的平均数。解法一:根据题意已知N=10,根据公式:解法二:先设定一个估计平均数AM=27,求_=_i-A的值。_i 25 27 28 27 25 29 30 34 32 _ -2 0 1 0 -2 2 3 7 5 先估计 平均值为27(预估计)(大的数据用估计
17、法好算 有利于简化 计算过程)二 平均数的特点 1 一组变量值的和等于变量的个数与平均数的乘积, 2 一组变量值的离均差之和等于零,(说明了平均数是一组数据的重心 最能表达一 组数据的集中趋势)3 在一组变量中,每个变量值加上或减去、乘以或除以常数c,所得的平均数等于 原平均数加上或减去、乘以或除以常数c。三 平均数的意义 1平均数是应用最普遍的一种集中量数。2 是真值渐进、最佳的估计值。(概率分布中心极限定理)(真值=总体平均数)3 当观测次数无限增加时,算术平均数趋近于真值。(样本平均数量趋近于总体平均数)(观测次数较少时 样本统计量是总体参数的无偏估计)四 平均数的优缺点(选择题的重要内
18、容)1 优点:反应灵敏;计算严密;计算简单;内容容易理解;适合进一步代数运算、 较少受抽样变动的影响。2 缺点:容易受极端数据的影响;如果出现模糊不清的数据,无法使用。第二节 中数与众数 一 中数 中数又称中位数,间称中数用Md表示,是按一定顺序排列的一组数中央位置的数值。中数是一种位置量数。中数的计算(主要考中数的计算方式)1 中数附近无重复数时 若数据个数(N)奇数时,中数则为(N+1)/2位置的那个数。若数据个数(N)偶数时,中数则为居于中间两个数的平均数 2 中数附近有重复数时(难点 没考过 考很正常)采用画图法(王老师开创)例:求11 11 11 11 13 13 13 17 17
19、分析p :N=9 中间位置为5,第5个数为13。但数据中有3个13,意味着3个13占 了一个单位。(统计学上把13看为一个区间,三个13共享这个区间,把区 间划分为三段, 12.5+1/6 第一小段的组中值 二 众数 1 含义:众数(mode)是指一群数据中出现次数最多的那个数,不只有一个,用表 示。2计算方法:(1)直接观察法 未分组数据次数最多的数值 次数分布表次数最多一组的组中值 (2) 公式计算法 皮尔逊经验公式:(牢记)三 平均数 中数 众数三者间的关系(出小了计算形式为主的选择题 出大了简答题)1 正态分布 2 偏态分布 左偏分布=负偏态 右偏分布=正偏态(比较三数大小直接画图即可
20、直观看出)第三节 其他集中数(往往没怎么考过)(统计中基本不考)一 加权平均数 是观测数据()与相应的权数(W)乘积的和除以总权数 所得的商。用符号表示。权数是指各变量在构成总体重的相对重要性,权数的大小,由观测者依据一定的理论 或经验而定。每个数对总体的贡献不一样 权重不一样 二 几何平均数 三 调和平均数:先将各个数据取倒数平均,然后再取倒数,表述符号为,主要用于 描述速度方面的集中趋势。练习题 1 现有一列数据,4 4 5 3 5 5 2。这列数据的平均数、众数和全距依次是()A 4 4 2 B 4 5 3 C 5 4 4 D 5 5 1 2 有一组数据 3 6 2 7 32 4 8 要
21、描述这组苏剧的特征,受极端数据之影响的统计 量是()A 平均数 B 中数 C 四分位数 D 众数 3 数据2 5 9 11 8 9 10 13 10 24的中位数是()4 一组数据的分布曲线称双峰状态,据此可以推测改组数据中可能有两个()A 中数 B 众数 C 平均数 D 几何平均数 5 要比较几个不同性质的测验分数,比较恰当的是比较()A 原始分数 B 众数 C 百分等级 D 平均数 6 测验总分呈负偏态分布说明测验难度()A 偏难 B 偏易 C 适中 7 甲乙两图表示数据分布形态分别是()8 描述甲乙靓图特征的集中量数中,数据最大的分别是()答案及解析 1 B 选择题 用省时间的方式哪个好
22、算先算那个 2 A 见第 3 9.5 4 B 5 C 百分等级是原始分数在所在团体中的位置 位置量数 6 B 7 正偏态 负偏态 框架小结 算术平均数 (定义公式 特点)集中量数 中数(特点 计算方法)众数 (计算 特点)三者之间的关系(正态 偏态)众数 最具代表性的最具优势的 中数 当个别数据偏大或偏小时用中数比较合适 平均数 第四章 差异量数 表示一组数据的差异情况或离散程度的量数;反应数据的分布的离中趋势;描述事物差 异性的表现。差异量越小,平均数的代表性越好。差异量越大,平均数的代表性越差。第一节 全距与百分位差(容易受极端数据影响 不怎么用)一 全距(没用)定义:一列数据中最大数与最
23、小数之差 特点:不可靠不灵敏 二 百分位差 (一)百分位数(原始分数)-百分等级 量尺上的一个点,在此点以下包括数据分布中全部数据个数的一定百分比,符 号为。百分位数为90 (90为原始分数)在90分以下的包含了整个数据的75% (二)百分位差 三 四分位差 1 四分位数可视为百分位数的特例,用来表示 。2 把数据分成四等份,所以称为四分位数。(第一个四分位,) (第二个四分位,) (第三个四分位,) 3 四分位差是百分位差的特例:实质:反映了中间50%数据的离散程度。四分位差越小中间50%数据越集中 四分位差越大中间50%数据越离散 四 百分等级 (表示)1 含义:指某个数据在整个数据中所处
24、的百分位置。2 作用:可以表示任何一个分数在该团体中的相对位置。第二节 平均差/方差与标准差(有单位不能比较不同事物的离散程度)一 平均差 1 含义:原始数据与平均数绝对离差的平均值。2 符号:平均差 离均差 3 特点:较好反映了数据分布的离散程度;平均差是绝对值,使用受到了限制;(绝对值不容易进一步代数运算)属于低效的差异量数。二 方差与标准差 1 含义:(1) 方差:离均差平方的算数平均数,表示一列数据平均差距的平方。符号:样本方差 总体方差 (定义公式)(2)标准差:方差的算数平方根,表示一列数据的平均差距。符号:样本标准差 总体标准差 计算过程 1 先计算平均数 2 求离均差的平方和
25、3 代入方差和标准差的公式 完整表述一列数据:2 方差、标准差的性质和意义 (1)性质 每一个观测值加一个常数标准差不变。每一个观测值乘一个常数,新数据标准差为原标准差乘此常数。(2)意义 表述数据离散程度的最好指标。第三节 标准差的应用 一 变异系数()(相对离散程度 没有单位 可以比较不同类型数据的离散程度)一组数据的标准差与其相应的均值之比。适应范围:(1)不同质的数据 (2)同质但是差距大 二 标准分数(没有单位有正负)(线性变换 变换完了保持相对位置)(一)概念和公式 标准分数:又称分数,是以标准差为单位的一种量数。表示的是一个原始分 数在团体中所处的相对位置。计算公式: 原始数据 原始数据的平均数 原始数据的标准差 用将转换为 (二)性质:1 分数是一个相对量,以平均数为参照点,以标准差为单位。2 一组原始数据的分数分布:平均数为0,标准差为1。3 分数的均值为0。因为所以 因为 所以 因为所以 所以 即一组原始数据的分数分布:平均数为0,标准差为1 (三)标准分数的应用 1 观测值在数据分布中相对位置的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度个人住宅抵押担保与家庭应急响应服务合同3篇
- 二零二五年度江苏二手车买卖交易风险防控合同
- 二零二五年度新能源设备安装调试合同3篇
- 二零二五年度房产代理销售合作协议书(含合作期限)3篇
- 二零二五年度拆迁项目进度监管居间服务协议书模板
- 2024版装饰材料销售与购买协议3篇
- 2025年度物业管理交接信息共享协议书3篇
- 二零二五年度物流行业安全生产及环境保护管理协议3篇
- 2024年配偶赡养义务协议
- 二零二五年度废钢产业链上下游合作协议
- 血细胞分析报告规范化指南2020
- ISO 56001-2024《创新管理体系-要求》专业解读与应用实践指导材料之7:“5领导作用-5.1领导作用和承诺”(雷泽佳编制-2025B0)
- 2024年快速消费品物流配送合同6篇
- 广东省茂名市2024届高三上学期第一次综合测试(一模)历史 含解析
- 神经重症气管切开患者气道功能康复与管理学习与临床应用
- 第5章 一元一次方程大单元整体设计 北师大版(2024)数学七年级上册教学课件
- 人教版高一地理必修一期末试卷
- 辽宁省锦州市(2024年-2025年小学六年级语文)部编版期末考试(上学期)试卷及答案
- GB/T 29498-2024木门窗通用技术要求
- 《职业院校与本科高校对口贯通分段培养协议书》
- 0-3岁婴幼儿营养与健康知到智慧树期末考试答案题库2024年秋杭州师范大学
评论
0/150
提交评论