版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 2015诺贝尔医学奖得主-屠呦呦n什么是心理统计学什么是心理统计学n为什么要学心理统计学为什么要学心理统计学n如何学习心理统计学如何学习心理统计学n了解国家、社会现状:了解国家、社会现状: 个人生活:买房个人生活:买房or等待等待部分网上数据资源部分网上数据资源2022-6-2611一、什么是统计学一、什么是统计学1、概念: 关于数据的科学2、内容、内容包括数据的包括数据的收集、分类收集、分类汇总、分析汇总、分析和解释。和解释。2022-6-2612统计研究的过程收集数据收集数据整理数据整理数据解释数据解释数据分析数据分析数据2022-6-2613 1、心理统计学的性质和地位1) 是方法论、
2、工具课:数据的生产者 数据的使用者 2)对心理现象进行准确描述3) 决策的依据存在于国民经济和生活的方方面面你工作和生活中不可或缺的研究工具、必备的知识二、为什么学习心理统计学二、为什么学习心理统计学2、科学研究需要心理统计学、科学研究需要心理统计学n行为学研究行为学研究n脑电波研究脑电波研究n磁共振研究磁共振研究n近红外成像研究近红外成像研究颅内记录研究颅内记录研究统计学是一种思想方法统计学是一种思想方法n从用从用事实事实说话说话n到用到用概率概率说话说话三、怎么学习心理统计学三、怎么学习心理统计学统计学是一门工具统计学是一门工具“统计万能论统计万能论”“统计无用论统计无用论”统计学的发展历
3、程统计学的发展历程n统计学的统计学的是概率论是概率论与正态分布曲线方程的产生。与正态分布曲线方程的产生。n一般认为理论统计学的发展一般认为理论统计学的发展经历了两个阶段:经历了两个阶段:阶段和阶段和阶段。阶段。描述统计阶段描述统计阶段n描述统计学产生于描述统计学产生于20世纪年代之前,在描述统计世纪年代之前,在描述统计方面做出重要贡献的是英国的优生学家方面做出重要贡献的是英国的优生学家(FGalton)和统计学家和统计学家(Kpearson)。推论统计阶段推论统计阶段n 推论统计的先驱是英国统计学家推论统计的先驱是英国统计学家(WGosset ),对推断统计做出重要贡献的是对推断统计做出重要贡
4、献的是英国统计学家英国统计学家(RAFisher) 。n二次世界大战以后,各种非参数二次世界大战以后,各种非参数统计方法、小样本理论都得到发统计方法、小样本理论都得到发展和完善,同时多元统计的理论展和完善,同时多元统计的理论和方法也得到了广泛的应用,统和方法也得到了广泛的应用,统计学形成了许多分支应用学科。计学形成了许多分支应用学科。统计在心理研究中的应用统计在心理研究中的应用n心理与教育统计作为数理统计的一门应心理与教育统计作为数理统计的一门应用学科,是随着数理统计的发展而发展用学科,是随着数理统计的发展而发展的。的。n最初应用统计方法于教育与心理方面研最初应用统计方法于教育与心理方面研究的
5、是究的是。n对教育统计做出重要贡献的是心理学家对教育统计做出重要贡献的是心理学家(Ch.E.Spearman)。 n随着科学研究中心的转移,心理统计随着科学研究中心的转移,心理统计的研究也移向美国。为心理统计学做的研究也移向美国。为心理统计学做出较大贡献的是美国教育与心理学家出较大贡献的是美国教育与心理学家(Thorndikt)、(Thurstone)和和(Cattell)。 心理统计在我国的发展与应用心理统计在我国的发展与应用n心理统计学在辛亥革命以后传到我国。当心理统计学在辛亥革命以后传到我国。当时心理与教育统计、心理与教育测量都作时心理与教育统计、心理与教育测量都作为高等、中等师范院校的
6、必修课程,有一为高等、中等师范院校的必修课程,有一大批专家、学者从事这方面的研究、讲授大批专家、学者从事这方面的研究、讲授工作,出版了不少关于心理与教育统计方工作,出版了不少关于心理与教育统计方面的译著、专著。面的译著、专著。n20世纪世纪80年代以后年代以后,心理统计学开始复苏。心理统计学开始复苏。在二十多年中,我国的心理统计学科在在二十多年中,我国的心理统计学科在教学、研究、培养人才等各方面取得了教学、研究、培养人才等各方面取得了非常丰硕的成果。非常丰硕的成果。n目前,心理统计学的教学和研究进入稳目前,心理统计学的教学和研究进入稳步快速发展时期。步快速发展时期。n张厚粲、徐建平现代心理与教
7、育统计学北京:北京师范大学出版社2004 n同等学力人员申请硕士学位心理学学科综合水平全国统一考试大纲及指南(第3版)高等教育出版社2009nFreedman等著统计学中国统计出版社nJessica M. Utts, Robert F. Heckard. Mind on Statistics (3rd Edition). Thomson Learning, Inc., 20071描述统计与推断统计2总体、个体、样本2022-6-2631描述统计(descriptive statistics)n研究数据收集、整理和描述的统计学分支 n内容n搜集数据n整理数据n展示数据n描述性分析n 目的n描述数
8、据特征n找出数据的基本规律2022-6-2632推断统计 (inferential statistics)n研究如何利用样本数据来推断总体特征的统计学分支n内容n参数估计n假设检验n目的n对总体特征作出推断2022-6-2633描述统计与推断统计的关系总体、样本和个体间的关系总体、样本和个体间的关系内容n基础知识n变量、尺度、数据n数据类型与分析方法n类别数据、顺序数据、等距数据、比例数据n数据的来源n数据的整理和统计图表n次数分布表、条形图、饼图、线图、直方图n身高n高、矮、中等个头n180cmn变量 variable:事物的某种特征,这种特征在不同个体之间有差异尺度(量表) scale:测
9、量的标准数据 data:测量的结果n对同一个研究对象,用不同的尺度进行测量,也可以得到不同的结果n变异variationn研究对象中各观察个体之间的差异n类别尺度(Nominal Scale)n顺序尺度(Ordinal Scale)n等距尺度(Interval Scale)n比例尺度(Ratio Scale)n例子n性别(男、女)、企业性质、职业、地区n检验(阴性、阳性)、血型n特性n也叫称名尺度或列名尺度n只能按照事物的某种属性对其进行平行的分类或分组n只能区分事物是同类或不同类(=和)n通常计算每一类别中各元素或个体出现的“次数”或“频率”来进行分析n例子n绩效评定:优、良、中、及格、不及
10、格n病情:轻、中、重n特性n对事物之间等级差别或顺序差别的一种测度n可以将事物分成不同的类别,还可以确定这些类别的优劣或顺序n该尺度具有“和”、“=和”的数学特性,但不能进行加、减、乘、除运算等距尺度(Interval Scale)n例子n温度n华氏 (Fahrenheit)=9/5 + 32 n特性n测量结果表现为数值,有相等的单位,但没有绝对零点n等距尺度具有类别尺度、顺序尺度的数学特性外,其结果还可以进行加、减运算比例尺度(Ratio Scale)n例子n长度、重量、收入、心率n特性n测量结果表现为数值,有相等的单位,且有绝对的零点n比例尺度具有类别尺度、顺序尺度和等距尺度的数学特性外,
11、其结果还可以进行乘、除运算n四分法n类别数据、顺序数据、等距数据、比例数据n二分法n定性数据(Qualitative Data)n类别数据、顺序数据n定量数据(Quantitative Data)n等距数据、比例数据二分四分类别定性顺序统计数据等距定量比率数学特性类别 顺序 等距 比例分类(=、)排序()间距(+、-)比值(、)n有个从未管过自己孩子的统计学家,在一个星期六下午妻子要外出买东西时,勉强答应照看一下四个年幼好动的孩子。当妻子回家时,他交给妻子一张纸条,上面写着:n“擦眼泪11次;系鞋带15次;给每个孩子吹玩具气球各5次;每个气球的平均寿命10秒钟;警告孩子不要横穿马路26次;孩子
12、坚持要穿马路26次;我还要再过这样的星期六0次。”n一般的变化方向n数值型等级(顺序)类别n偶尔n顺序数值n直接来源n调查n普查、抽样调查n观察与实验n间接来源(二手数据)n不是自己亲自调查的,是别人的数据、公开出版或报道的数据n统计年鉴;报刊、杂志、图书、广播、电视传媒中的各种数据资料4 数据的整理与呈现4.1 、次数分布表n次数分布表是对杂乱无序的次数分布表是对杂乱无序的数据进行整理的重要手段,数据进行整理的重要手段,它能使我们对样本情况有个它能使我们对样本情况有个初步的了解,为今后进一步初步的了解,为今后进一步分析和研究问题提供很大方分析和研究问题提供很大方便。便。4.1.1、简单次数分
13、布表表表2-1 80名员工对部门主管尽职程度调查结果名员工对部门主管尽职程度调查结果4.1.2、分组次数分布表表表2-2 某班学生数学成绩次数分布表某班学生数学成绩次数分布表n求全距求全距 R=Xmax-Xminn决定组距决定组距 i 和组数和组数 kn列出分组区间列出分组区间n登记次数登记次数n计算每组数据的次数计算每组数据的次数fn抄录新表抄录新表100名学生在某项测验中的成绩分数名学生在某项测验中的成绩分数76.076.077.577.582.082.090.590.581.081.085.585.571.071.080.580.592.592.577.077.088.088.081.0
14、81.076.676.667.067.083.083.084.084.084.084.062.062.079.079.072.072.089.089.078.078.078.078.080.080.078.578.576.576.575.075.079.579.586.086.081.581.575.075.084.084.090.090.080.080.086.086.084.584.568.568.571.071.086.086.081.581.579.579.580.580.573.073.093.093.083.083.072.072.068.068.071.071.087.087.0
15、78.078.066.066.083.083.087.087.082.582.579.579.580.080.082.082.081.081.086.586.583.583.571.571.583.083.091.091.096.096.075.575.589.089.087.587.569.069.074.074.070.070.077.577.575.075.079.079.079.079.080.580.574.574.577.077.082.582.572.572.573.573.573.573.576.076.088.588.585.085.089.589.578.578.576.0
16、76.074.074.098.098.073.073.094.094.079.079.080.080.075.575.583.583.582.082.065.065.074.574.580.080.070.570.5精确登记实际累加相对累加上下限次数次 数次 数96-.9795.598.5 |20.02100193-9492.5-95.5 |30.03980.9890-9189.592.5 |40.04950.9587-8886.589.5 | |80.08910.9184-8583.586.5 | | |110.11830.8381-8280.583.5 | | | |170.17720.7
17、278-7977.580.5 | | | |190.19550.5575-7674.577.5 | | |140.14360.3672-7371.574.5 | |100.1220.2269-7068.571.5 | |70.07120.1266-6765.568.5 |30.0350.0563-6462.565.5 |10.0120.0260-6159.562.5 |10.0110.01f=1001上限以下的累加次数分组区间组中值Xc次数f频数p/N4.1.3.相对次数分布表将次数分布表中各组的将次数分布表中各组的实际次数转化为相对次数,实际次数转化为相对次数,即用频数比率(即用频数比率(f
18、N)或百)或百分比(分比( )来表示次)来表示次数,就可以制成相对次数分数,就可以制成相对次数分布表。布表。%100Nf4.1.4、累加次数分布表 n表表2-3 某班学生数学成绩累加次数分布表某班学生数学成绩累加次数分布表 4.2、次数分布图n在编制次数分布表的基础上,可以绘在编制次数分布表的基础上,可以绘制次数分布图,使一组数据特征更加制次数分布图,使一组数据特征更加和和,而且还可以对数据的而且还可以对数据的和和作粗略的分析。作粗略的分析。n绘制次数分布图可以用已有的计算机绘制次数分布图可以用已有的计算机程序,如程序,如EXCEL,也可以用专门的统计,也可以用专门的统计程序。程序。4.2.1
19、、频数分布直方图n直方图直方图 ( histogram )又称为等距直方图,又称为等距直方图,是以矩形的面积表示是以矩形的面积表示随机变量次数随机变量次数分布的图形。一般用分布的图形。一般用表示数据的频数,表示数据的频数,用用表示数据的等距分组点,即各分组表示数据的等距分组点,即各分组区间的上下限。区间的上下限。n直方图是统计学中常用而且又有特殊意义直方图是统计学中常用而且又有特殊意义的一种统计图,有着重要的应用价值。的一种统计图,有着重要的应用价值。例:52个学生的数学成绩所作直方图图图2-1 52名学生数学成绩分布的频数直方图名学生数学成绩分布的频数直方图45 50 55 60 65 70
20、 75 80 85 90 95 100还可以做成下面这种形式图图2-2 52名学生数学成绩次数分布直方图名学生数学成绩次数分布直方图4.2.2、次数分布多边图n次数分布多边形图(次数分布多边形图(frequency polygon)是一种表示是一种表示随机变量次数分布的线随机变量次数分布的线形图,属于次数分布图。凡是等距分组的形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多可以用直方图表示的数据,都可用次数多边图来表示。边图来表示。n绘制方法:以各分组区间的组中值为绘制方法:以各分组区间的组中值为,以各组的频数为以各组的频数为,描点;将各描点;将各点以直线连接即构成多边
21、图形。点以直线连接即构成多边图形。图图2-3 52名学生数学成绩分布图名学生数学成绩分布图 人人 数数图图2-4 52名学生数学成绩分布图名学生数学成绩分布图人人 数数成成 绩绩n利用次数分布多边图还可以把几组资料利用次数分布多边图还可以把几组资料放在一起进行比较。放在一起进行比较。n但需要注意的是,这时必须把数据的次但需要注意的是,这时必须把数据的次数换算成数换算成。图图2-5 数据的次数分布图数据的次数分布图图图2-6 不正确的比较图不正确的比较图4.2.3、累积次数分布图n根据累积根据累积次数,可以次数,可以绘制累积次绘制累积次数分布图。数分布图。 n右图是累右图是累积次数分布积次数分布
22、直方图。直方图。 累积次数分布曲线n当数据的总数较多当数据的总数较多时,将累积次数分时,将累积次数分布图中的布图中的以以每一分组区间的每一分组区间的精精确上限确上限或精确下限或精确下限表示,表示,以以累累积次数积次数表示,则可表示,则可绘制累积次数分布绘制累积次数分布曲线,即累积曲线。曲线,即累积曲线。 图图3-8 累积次数分布曲线累积次数分布曲线累积曲线可用于判断一组数据的大致分布形态。累积曲线可用于判断一组数据的大致分布形态。图3-9 正态分布数据的累积曲线图图3-10 正偏态数据累积曲正偏态数据累积曲线线图图3-11 3-11 负偏态数据累积曲线负偏态数据累积曲线第二章第二章 统计量表统
23、计量表4.3其他类型的统计图表n1.简单表n2.分组表n3.条形图n4.圆形图n5.线形图n6.散点图第二章第二章 统计量表统计量表4.1.1 简单表n只列出名称、地点时序或统计指标名称的统计表。未做任何划分。 我国近年来国内生产总值我国近年来国内生产总值 第二章第二章 统计量表统计量表4.1.2 分组表n只有一个分类标志的统计表,也称单向表。按一个标志分组 。 2005年国内生产总值分布表年国内生产总值分布表 第二章第二章 统计量表统计量表4.1.3 条形图n用条形的长度来表式各事物间的大小与数量之间的差异。n适用资料:离散型数据资料,即计数资料。 第二章第二章 统计量表统计量表数据统计表数
24、据统计表问题问题1:根据下列数据列出统计数表根据下列数据列出统计数表4,5,6,1,2,8,4,7,9,8,1,5,6,4,2,7,9,3,4,5,8,7,6,2,4,5,8,6,5,6,8,9,8,9,6,8 2 3 1 5 5 6 3 7 4 第二章第二章 统计量表统计量表数字数字第二章第二章 统计量表统计量表制作条形统计图的步骤:制作条形统计图的步骤:1、根据图纸大小,画出两条互相垂直的射线。(注意:水平射线的、根据图纸大小,画出两条互相垂直的射线。(注意:水平射线的下方和竖直射线左边须留有一定的空白,注明直条数量和统计的下方和竖直射线左边须留有一定的空白,注明直条数量和统计的内容)内容
25、)2、在横轴上确定直条的位置。、在横轴上确定直条的位置。3、在纵轴上根据数量的多少确定单位长度。、在纵轴上根据数量的多少确定单位长度。4、根据数量的多少画出长短不同的直条。、根据数量的多少画出长短不同的直条。(注意:直条的宽窄要一致,长短要准确,条与条之间间隔要均等)(注意:直条的宽窄要一致,长短要准确,条与条之间间隔要均等)第二章第二章 统计量表统计量表作业第二章第二章 统计量表统计量表条形图和直条形图和直方图有什么方图有什么区别?区别?第二章第二章 统计量表统计量表条形图与直方图的区别n(1)描述的数据不同。 称名数据;连续性数据。n(2)表示数据多少的方式不同。n长短或高低表示数据的多少
26、和大小;用面积表示。n(3)坐标轴上标尺分点意义不同。 分类轴;刻度值。n(4)间隔 有间隔,但无意义;无任何间隙。第二章第二章 统计量表统计量表4.1.4 圆形图n显示各部分在整体中所占的比重大小,以及各部分之间的比较。第二章第二章 统计量表统计量表制作扇形统计图的步骤:制作扇形统计图的步骤:1、画一个圆。、画一个圆。2、按各组成部分所占比例算出各个扇形的圆心角度数。、按各组成部分所占比例算出各个扇形的圆心角度数。3、根据算出的各圆心角的度数画出各个扇形,并标明相、根据算出的各圆心角的度数画出各个扇形,并标明相应的百分比,各比例的名称可以注明在图上,也可以应的百分比,各比例的名称可以注明在图
27、上,也可以用图例标明。用图例标明。(注意:各扇形可以用不同颜色表示,也可以用斜线、(注意:各扇形可以用不同颜色表示,也可以用斜线、网状等不同线形表示)网状等不同线形表示)第二章第二章 统计量表统计量表4.15 线形图数字数字频数频数第二章第二章 统计量表统计量表线形图n 用一定单位长度表示一定的数量,并根据数量用一定单位长度表示一定的数量,并根据数量的多少描出各点,然后把各点用线段顺次连接的多少描出各点,然后把各点用线段顺次连接起来,形成折线,用折线的升降来表示数量之起来,形成折线,用折线的升降来表示数量之间的关系及变化趋势,这样的统计图叫作线形间的关系及变化趋势,这样的统计图叫作线形图。图。
28、n特点:特点:线形图能够清晰的反映数据的变化趋势线形图能够清晰的反映数据的变化趋势或情况。或情况。n注意:注意:线形图是把条形统计图各个长方形上边线形图是把条形统计图各个长方形上边的中点用线段连接起来得到的的中点用线段连接起来得到的第二章第二章 统计量表统计量表4.1.6散点图n如果要研究两个变量间的关系,比如身高与体重的关系,智商与学业成绩的关系。n用直角坐标系中的横轴和纵轴分别表示两个变量,将每一个被观察的个体在这两个变量上的观测值作为坐标画点即可。第二章第二章 统计量表统计量表第二章第二章 统计量表统计量表附:计算机制作统计图表在心理与教育研究中常用的基本统计程序主要有两个:SPSS和S
29、AS。其中以SPSS应用最多。SPSS是专门用于社会科学研究的统计分析工具:Statistics Package for Social ScienceSAS的开发主要是商业用途,因此功能更强大,但SPSS包含一些特殊的社会科学应用程序。 n浏览网上资料,看看浏览网上资料,看看常用的有哪些统计图。常用的有哪些统计图。n请利用书上的数据或请利用书上的数据或自己收集数据,试做自己收集数据,试做几个漂亮的统计图。几个漂亮的统计图。集中量数n学习目标学习目标n1.集中趋势各测度值的计算方法集中趋势各测度值的计算方法n2.集中趋势各测度值的特点及应用场合集中趋势各测度值的特点及应用场合n学习内容学习内容n
30、众数众数n中位数中位数n平均数平均数n 众数、中位数和平均数的比较众数、中位数和平均数的比较集中趋势(central tendency) 一一组数据向其中心值靠拢的倾向和程度组数据向其中心值靠拢的倾向和程度 测度集中趋势就是寻找数据水平的代表值或中心值测度集中趋势就是寻找数据水平的代表值或中心值 不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值众数(mode)xMdnM230n众数:一组数据中出现次数最多的数众数:一组数据中出现次数最多的数n如如2、3、5、3、4、3、6的众数为的众数为3n计算众数的皮尔逊经验法计算众数的皮尔逊经验法男性还是女性多?男性还是女性多?众数
31、(原始数据)n无众数无众数原始数据: 10 5 9 12 6 8分类数据的众数 (次数最多的那个组)解:这里的变量为解:这里的变量为“饮饮料品牌料品牌”,这是个分类,这是个分类变量,不同类型的饮料变量,不同类型的饮料就是变量值就是变量值 所调查的所调查的50人中,人中,购买可口可乐的人数最购买可口可乐的人数最多,为多,为15人,占总被调人,占总被调查人数的查人数的30%,因此众,因此众数为数为“可口可乐可口可乐”这一这一品牌,即品牌,即 Mo可口可乐可口可乐顺序数据的众数n众数的意义与应用众数的意义与应用 (1)当需要快速而粗略地寻求一组数据的代表值时(2)当一组数据出现不同质的情况时,可用众
32、数表示典型情况。如工资收入、学生成绩等常以次数最多者为代表值(3)当次数分布中有两极端的数目,除了一般用中数外,有时也用众数(4)当粗略估计次数分布的形态时,有时用平均数与众数之差,作为表示次数分布是否偏态的指标中位数(median)n按大小排序后处于中间位置上的值2、这个数可能是数据中的某一个,也可能根本不、这个数可能是数据中的某一个,也可能根本不是原有的数。是原有的数。数值型数据的中位数 (奇数个数据的算例)【例例】 9个家庭的人均月收入数据原始数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630排排 序序: 750 780 850 960 10
33、80 1250 1500 1630 2000位位 置置: 1 2 3 4 5 6 7 8 9521921n位置数值型数据的中位数 (偶数个数据的算例)n【例例】:10个家庭的人均月收入数据n排排 序序: 660 750 780 850 960 1080 1250 1500 1630 2000n位位 置置: 1 2 3 4 5 6 7 8 9 10 102021080960中位数中数为居于中间位置两个数的平均数中数为居于中间位置两个数的平均数数值型数据的中位数 (重复数据的算例)【例】【例】1、3、5、6、6、8、95.5 6 6.5 Mdn=5.75【例】【例】1、3、5、6、6、6、8、95
34、.5 6 6.5 5.83 6.17 Mdn=5.83顺序数据的中位数 (例题分析)分组数据的中位数ifFNLMdnMdnbb21其中:其中: :中数所在组的实下限:中数所在组的实下限 :中数所在组以下各组次数之和(以下累积次数):中数所在组以下各组次数之和(以下累积次数) :中数所在组的次数:中数所在组的次数 :组距:组距bLbFMdnfi例子:n*中数组的寻找方法:由下往上找,第一个大于N/2的组。n解:16217267.5469.7425dnMn中数的优缺点与应用(1)当一组观测结果中出现两个极端数目时当一组观测结果中出现两极端数目时。这种情况在心理与教育科研实验中常常出现,因为心理与教
35、育实验中的偶然因素非常复杂,有时实验中为了平衡各种误差,经常是同一种观测要在同一个被试身上反复进行多次,而只取某一个代表值作为对该被试的观测结果。这时若出现两极端的数目,又不能确定这些极端数目是否由错误观测造成,因而不能随意舍去,在这种情况下,只能用中数作为该被试的代表值,这样做,并不影响进一步的统计分析。n (2)当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值n (3)当需要快速估计一组数据的代表值时,也常用中数n中数的优缺点与应用(2)当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值区当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋
36、势的代表值。在心理与教育实验中,经常会出现个别被试不能坚持继续进行实验这一现象,有时只知个别被试的观测结果是在分布的哪一端,但具体数值不清楚,这种情况下就只能取中数而不能计算平均数。(3)当需要快速估计一组数据的代表值时,也常用中数平均数算术平均数 (arithmetic mean )nxnxxxxniin1218 .791xNx(2)分组数据的计算方法(组中值计算法)方法:把组中值看成每一分组的平均数方法:把组中值看成每一分组的平均数112211()1(47 1 52 297 6)48ciccn cnxf xNf xf xf xN 平均数的特点1、各变量值与均值的离差之和等于零0)(xxi2
37、、所有的观测值都加上常数、所有的观测值都加上常数C,则平均值也增加常数则平均值也增加常数CcxcxNi)(13、所有观测值都乘以不等于、所有观测值都乘以不等于0的常数的常数C,则平均值也增大则平均值也增大C倍倍xcxcNi)(1平均数的意义算术平均数是应用最普遍的一种集中量数。它是“真值”渐近、最佳的估计值。在科研实验中人们进行观测,是想知道被观测事物真正的值是多少,例如想研究人的反应时间,用计时器进行测量,人们是想测到真正的反应时间是多少。再如,使用某种测验,是想测量某个人或某些人的真实的能力水平到底有多么高。但是由于主客观各种随机因素的影响,如仪器的精密程度,测量方法,实验情景,人的观测力
38、及观测标准等等都不能做到尽善尽美,因此想获得真值是不大可能的,人们只能用一些集中量数作为它的估计值。平均数的优缺点算术平均数具备一个良好的集中量数应具备的一些条件:反应灵敏。观测数据中任何一个数值的或大或小的变化,甚至细微的变化,在计算平均数时,都能反应出来。确定严密。计算平均数有确定的公式,不管何人,在何种场合,只要是同一组观测数据,所计算的平均数都是相同的,不凭主观确定。简明易解。平均的概念简单明白,容易理解。较少数学抽象。计算简单。计算公式只是用简单的四则运算。符合代数方法进一步演算。不但平均数的计算过程应用代数方法,而且,还可应用平均数作进一步的数学演算。例如求离均差x,以及将要讲到的
39、求方差等等。较少受抽样变动的影响。在进行观测时,样本大小或个体的变化,对计算平均数影响很小。平均数的优缺点但是算术平均数也有一些缺点,在一定程度上限制了它的应用,这些缺点是:易受极端数据的影响。由于平均数反应灵敏,因此数据中若出现极端数据(或大或小),就要影响平均数。在心理与教育方面的实验观测中,偶然因素十分复杂,经常会出现极端数目,例如,一个重点班的50名水平相当的学生,在通过一项教育测验时,绝大多数学生得分较高,但个别人却由于身体不适或一时性情绪障碍而得到很低的分数,这时若用平均数代表全班学生的知识水平,则肯定偏低,并且不符合实际情况。若出现模糊不清的数据时,无法计算平均数,因为计算平均数
40、时需要每一个数据都加入计算。在次数分布中只要有一个数据含糊不清,都无法计算平均数。在这种情况下,一般采用中数作为该组数据的代表值,描述其集中趋势。此外,必须注意,凡不同质的数据不能计算平均数。此外,必须注意,凡不同质的数据不能计算平均数。加权平均数有些测量中所得数据,其单位权重并不相等。这时若要计算平均数,有些测量中所得数据,其单位权重并不相等。这时若要计算平均数,就不能用算术平均数,而应该使用加权平均数。就不能用算术平均数,而应该使用加权平均数。例如:高校入学考试共包括语文、政治、外语、数学、物理、化学及例如:高校入学考试共包括语文、政治、外语、数学、物理、化学及生物生物?科,而计算总分时并
41、不是各科平等,在语文、政治等科都以科,而计算总分时并不是各科平等,在语文、政治等科都以100为满分的情况下,数学定为满分的情况下,数学定120分,生物定分,生物定50分,也是考虑到各门学科的分,也是考虑到各门学科的相对重要性而进行加权的结果。相对重要性而进行加权的结果。NxNNNNxNxNxNxkkkw212211加权平均数分组数据:设一组数据为: x1 ,x2 , ,xk各组的组中值为:XC1 ,XC2 , ,XCk 相应的频数为: f1 , f2 , ,fknfXffffXfXfXxkiicikkckcc1212211iMiM185120222001nfMxkiii几何平均数(geomet
42、ric mean)n n 个变量值乘积的个变量值乘积的 n 次方根次方根n适用于对比率数据的平均适用于对比率数据的平均n主要用于计算平均增长率主要用于计算平均增长率n计算公式为计算公式为121nnngniiMxxxx112lg1lg(lglglg)niignxMxxxnn其中,其中,n:数据的个数数据的个数 X:变化的比例数据变化的比例数据在心理和教育科学研究的数据处理过程中,应用几何平均数表示集中趋势,有两种情形。1直接应用基本公式计算几何平均数。属于这种情况是:一组实验数据中有少数数据偏大或偏小,数据的分布呈偏态。这时若计算算术平均数也会出现偏大或偏小,平均数就不能很好地反映一组数据的典型
43、情况。而用几何平均数作为集中趋势的代表,就比算术平均数优越。在心理与教育实验中,有部分数据变异较大的情况经常出现,这种场合除应用中数或众数外,时常应用几何平均数。而在心理物理学的等距与等比量表实验中,只能用几何平均数。2. 应用几何平均数的变式计算。属于这种情况有:一组数据彼此间变异较大,几乎是按一定的比例关系变化。如教育经费的逐年增加数,学习、阅读的进步数,以及学生人数的增加数等等。在上述所举的几方面研究中,一般不求平均数,而是求平均增长的比率,如教育经费的平均年增长率,学校人数的年增长率,学习的平均进步率,阅读速度的平均增加率等等。这时都要用几何平均数计算平均比率,而不用算术平均数计算。n
44、 【例例】某水泥生产企业1999年的水泥产量为100万吨,2000年与1999年相比增长率为9%,2001年与2000年相比增长率为16%,2002年与2001年相比增长率为20%。求各年的年平均增长率。123109% 116% 120%114.91%ngnMxxxn 【例例】一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率 4104.5% 102.1% 125.5% 101.9%18.0787%Mg 4.5%2.1%25.5%1.9%48.5%Mg 众数、中位数和平均数的比较众数、中位
45、数、平均数的特点和应用n众数n不受极端值影响n具有不惟一性n数据分布偏斜程度较大时应用n中位数n不受极端值影响n数据分布偏斜程度较大时应用n平均数n易受极端值影响n计算方便,反应灵敏n数据对称分布或接近对称分布时应用众数、中位数和平均数的关系xMdnM230032MMdnx033MxMdnx310MxMdnx数据离散趋势数据离散趋势离散趋势离散趋势极极 差差R R平平 均均 差差A.D.A.D.标标 准准 差差S.D.()S.D.()变异系数变异系数V V在心理统计学中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。例如,在考察同一个年级中几个教学班的某科成绩时,通
46、常会遇到有些班级平均成绩相同,但整齐程度不同,如果只比较平均成绩并不能真实地反应这些班级对课程学习的全貌;我们只有对班成绩分数的离散程度也进行度量,才能做到较全面的描述。因此,我们需要采用差异量数来反映数据的总体情况,除了必须求出集中量数外,还要使用差异量数。它是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量。 标志变异指标的计算标志变异指标的计算(一)极差(全距)(一)极差(全距) R Rmaxmin RX-X即即: 1. 1. 全全距是总体中最大的观察值和最小观察值之差距是总体中最大的观察值和最小观察值之差, , 极差表明观察值在总体范围内变动的最大距离,极差表明观察值在总体范围
47、内变动的最大距离,极差大说明平均数的代表性小,极差小说明平均数极差大说明平均数的代表性小,极差小说明平均数的代表性大。的代表性大。2. 2. 全全距的特点距的特点 优优点:点: 计算方便,易于理解。计算方便,易于理解。 缺缺点:点: 只考虑数列两端数值差异,方法粗略。只考虑数列两端数值差异,方法粗略。 未分组或单项式:未分组或单项式:极差(极差(R R)= =观察值最大值观察值最大值- -观察值最小值观察值最小值组距式分组:组距式分组:极差(极差(R)=R)=末组上限末组上限- -首组下限首组下限只针对闭口只针对闭口组组 在生活中,我们常常会和极差打交在生活中,我们常常会和极差打交道班级里个子
48、最高的学生比个子最矮的学道班级里个子最高的学生比个子最矮的学生高多少?家庭中年纪最大的长辈比年纪最生高多少?家庭中年纪最大的长辈比年纪最小的孩子大多少?这些都是求极差的例子小的孩子大多少?这些都是求极差的例子 例例1.(口答)求下列各题的极差。(口答)求下列各题的极差。(1)某班个子最高的学生身高为)某班个子最高的学生身高为1.70米,个米,个子最矮的学生的身高为子最矮的学生的身高为1.38米,求该班所有米,求该班所有学生身高的极差。学生身高的极差。(2)小明家中,年纪最大的长辈的年龄是)小明家中,年纪最大的长辈的年龄是78岁,年纪最小的孩子的年龄是岁,年纪最小的孩子的年龄是9岁,求小明家岁,
49、求小明家中所有成员年龄的极差。中所有成员年龄的极差。实际问题:有两位射击运动员在一次射击测试中各射靶实际问题:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:次,每次命中的环数如下:甲:甲:乙:乙: 如果你是教练如果你是教练,你应当如何对这次射击作出评价你应当如何对这次射击作出评价?如果是一如果是一次选拔考核,你应该如何做选择?次选拔考核,你应该如何做选择?计算可得计算可得77乙甲x,x两人射击两人射击 的平均成绩是一样的的平均成绩是一样的. .那么两个人的水平就没那么两个人的水平就没有什么差异吗有什么差异吗? ?456 789 10环环数数频频率率0.10.20.3(甲甲)
50、4 5 6789 100.10.20.30.4环环数数频频率率(乙乙)甲成绩比较甲成绩比较分散分散, ,乙成乙成绩相对集中绩相对集中看来,平均数还难以看来,平均数还难以概括样本的实际状态,概括样本的实际状态,因此因此, ,我们还需要从另外的我们还需要从另外的角度来考察这两组数据角度来考察这两组数据. .甲的环数极差甲的环数极差=10-4=6=10-4=6乙的环数极差乙的环数极差=9-5=4. =9-5=4. 极差对极差对极端值非常敏感极端值非常敏感,在一定程度上表,在一定程度上表明样本数据的的明样本数据的的波动情况波动情况但极差只能反映一但极差只能反映一组数据中两个极端值之间的差异情况,对其他
51、组数据中两个极端值之间的差异情况,对其他数据的波动情况不敏感,到底是数据的波动情况不敏感,到底是A A组还是组还是B B组数组数据更加稳定呢?有必要重新找一个对整组数据据更加稳定呢?有必要重新找一个对整组数据波动情况更敏感的指标波动情况更敏感的指标 平平均差是各单位标志值与其平均数离差均差是各单位标志值与其平均数离差绝对值的算术平均数。绝对值的算术平均数。 1.1.概概念念 :(二)平均差(二)平均差 A.D.A.D.2.2.计算:计算: (二)平均差(二)平均差 A.D.A.D.例:例:有有5名被试的错觉实验数据如下,求其平均差:名被试的错觉实验数据如下,求其平均差: 根据全部标志值与平均数
52、离差而计算出来的根据全部标志值与平均数离差而计算出来的变异指标,能全面反映标志值的差异程度;变异指标,能全面反映标志值的差异程度; 计算有绝对值符号,不适合代数方法的演计算有绝对值符号,不适合代数方法的演算使其应用受到限制。算使其应用受到限制。3.3.平平均差的特点:均差的特点:方差(Variance)也称变异数、均方。作为样本统计量,常用符号S2表示,作为总体参数,常用符号2表示。它是每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的平均数。方差是度量数据分散程度的一个很重要的统计特征数。标准差(Standard deviation)即方差的平方根,常用S或SD表示。若用表示,则是指
53、总体的标准差,本章只讨论对一组数据的描述,尚未涉及总体问题,故本章方差的符号用S2,标准差的符号用S。方差、标准差方差、标准差 一、方差与标准差的计算一、方差与标准差的计算( (一一) )未分组的数据求方差与标准差基本公式是:未分组的数据求方差与标准差基本公式是:一、方差与标准差的计算一、方差与标准差的计算上述公式中,都要先求平均数,再求方差和标准差。若平均数不一定是一个整数或者有除不尽的情况,那么在计算过程中就会引入计算误差,计算就会很繁冗,此时可以直接运用原始分数计算方差与标准差 一、方差与标准差的计算一、方差与标准差的计算例例1 1:计算计算6 6、5 5、7 7、4 4、6 6、8 8
54、这一组数据的方差和标准差这一组数据的方差和标准差用平均数的方法:用平均数的方法:用原始数据方法:用原始数据方法:一、方差与标准差的计算一、方差与标准差的计算( (二二) )分组的数据求方差与标准差基本公式是:分组的数据求方差与标准差基本公式是:式中d(Xc - AM) / i,AM为估计平均数Xc为各分组区间的组中值f为各组区间的次数N=f 为总次数或各组次数和i为组距。一、方差与标准差的计算一、方差与标准差的计算具体步骤:具体步骤: 设估计平均数设估计平均数AMAM; 求求d d 用用f f乘乘d d,并计算,并计算fdfd; 用用d d与与fdfd相乘得相乘得fdfd2 2,并求,并求fd
55、fd2 2; 代入公式计算代入公式计算。 计算下面数据的平均数和方差,体会方差计算下面数据的平均数和方差,体会方差 是怎样刻画数据的波动程度的。是怎样刻画数据的波动程度的。(1)6 6 6 6 6 6 6 (2)5 5 6 6 6 7 7(3)3 3 4 6 8 9 9 (4)3 3 3 6 9 9 9解解(1)X=62S =0(2) X=6 S = (3)X=6 S = (4)X=6 S =75427442742 方差越大方差越大,说明数据的说明数据的波动越大波动越大,越不稳定越不稳定. 方差越小方差越小,说明数据的说明数据的波动越小波动越小,越稳定越稳定 方差用来衡量一批数据的波动大小方差
56、用来衡量一批数据的波动大小 (即这批数据偏离平均数的大小即这批数据偏离平均数的大小). 方差越大方差越大,说明数据的说明数据的波动越大波动越大,越不稳定越不稳定. 方差越小方差越小,说明数据的说明数据的波动越小波动越小,越稳定越稳定40164040164427441627乙乙42213919142237404125甲甲40164040164427441627乙乙42213919142237404125甲甲问问:(1)哪一种玉米长得高?哪一种玉米长得高?(2)哪种玉米的苗长得齐?哪种玉米的苗长得齐?在一次芭蕾舞比赛中,甲、乙两个芭蕾舞团都在一次芭蕾舞比赛中,甲、乙两个芭蕾舞团都表演了舞剧表演了舞
57、剧天鹅湖天鹅湖,参加表演的女演员的身高,参加表演的女演员的身高(单位:单位:cm)分别是分别是 甲团甲团 163 164 164 165 165 166 166 167 乙团乙团 163 165 165 166 166 167 168 168哪个芭蕾舞团女演员的身高更整齐?哪个芭蕾舞团女演员的身高更整齐?S甲甲2=1.5S乙乙2=2. 5 S甲甲2 S乙乙2甲芭蕾舞团女演员的身高更整齐甲芭蕾舞团女演员的身高更整齐解:解:165X 甲甲166X=乙乙某快餐公司的香辣鸡腿很受消费者欢迎,为了保持公司信誉,公司严把鸡某快餐公司的香辣鸡腿很受消费者欢迎,为了保持公司信誉,公司严把鸡腿的进货质量,现有甲
58、、乙两家农副产品加工厂到快餐公司推销鸡腿,两腿的进货质量,现有甲、乙两家农副产品加工厂到快餐公司推销鸡腿,两家鸡腿的价格相同,品质相近,快餐公司决定通过检查鸡腿的重量来确定家鸡腿的价格相同,品质相近,快餐公司决定通过检查鸡腿的重量来确定选购哪家公司的鸡腿,检查人员以两家的鸡腿中各抽取选购哪家公司的鸡腿,检查人员以两家的鸡腿中各抽取15个鸡腿,记录它个鸡腿,记录它们的质量如下(单位:们的质量如下(单位:g):):甲甲 74 74 75 74 76 73 76 73 76 75 78 77 74 72 73乙乙 75 73 79 72 76 71 73 7278 74 77 78 80 71 75
59、根据上面的数据,你认为快餐公司应该选购哪家加工厂的鸡腿?根据上面的数据,你认为快餐公司应该选购哪家加工厂的鸡腿?7 .7415737274757474 甲x9 .7415757172797375 乙x62. 27 .74737 .74747 .74741512222 甲s2 . 89 .74759 .74739 .74751512222 乙s22乙甲ss 因为因为 ,所以选择甲厂鸡腿加工。,所以选择甲厂鸡腿加工。二、方差与标准差的意义二、方差与标准差的意义方差与标准差是表示一组数据离散程度的最好的指标。其值越大,说明离散程度大,其值小说明数据比较集中,它是统计描述与统计分析中最常应用的差异量数
60、。它基本具备一个良好的差异量数应具备的条件:反应灵敏,每个数据取值的变化,方差或标准差都随之变化;有一定的计算公式严密确定;容易计算;适合代数运算;受抽样变动的影响小,即不同样本的标准差或方差比较稳定;简单明了,这一点与其他差异量数比较稍有不足,但其意义还是较明白的。二、方差与标准差的意义二、方差与标准差的意义1、每一个观测值都加一个相同常数C之后,计算得到的标准差等于原来标准差。2、每一个观测值都乘以一个相同的常数C,则所得的标准差等于原来标准差乘以这个常数。3、以上两点项结合,每一个观测值都乘以同一个常数C,再加上一个常数D,所得的标准差等于原标准差乘以这个常数C。三、总标准差的合成三、总
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 区商务局年度工作总结及下一步工作安排
- 窗外作文800字初二【10篇】
- 高级酒店客房上半年工作总结
- 个人季度工作总结范文
- 安全伴我行演讲稿三篇
- 2024年度三方委托校园借款服务合同3篇
- 幼小衔接工作计划
- 2024年度桶装水配送服务与水资源节约利用合同3篇
- 六班幼儿园设计案例
- 《乳及乳制品介绍》课件
- 部编版三年级上册道德与法治《我们的学校》单元作业设计
- 【核心素养目标】2023-2024学年人教版物理九年级上学期19.2家庭电路中电流过大的原因教案
- 2025年经济师考试农业经济高级经济实务试卷与参考答案
- 给某公司的新媒体(抖音)运营推广策划方案
- 2024年秋新人教版七年级上册英语教学课件 Unit 6 A day in the life(第1课时)Section A 1a-1e
- 膝关节个案护理
- ICS(国际标准分类法)分类
- 附件2:慢病管理中心评审实施细则2024年修订版
- 2024至2030年中国网络文学市场运行态势及投资前景机会分析报告
- 2024年四年级英语上册 Unit 5 Our School教案 陕旅版(三起)
- 利益冲突声明
评论
0/150
提交评论