现代心理与教育统计学课后题完整版重点讲义资料_第1页
现代心理与教育统计学课后题完整版重点讲义资料_第2页
现代心理与教育统计学课后题完整版重点讲义资料_第3页
现代心理与教育统计学课后题完整版重点讲义资料_第4页
现代心理与教育统计学课后题完整版重点讲义资料_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章 绪论 1. 名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用 f 表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示 概率:又称机率。或然率,用符号 P 表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率 统计量:样本

2、的特征值叫做统计量,又叫做特征值 参 数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标 观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2. 何谓心理与教育统计学?学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3. 选用统计方法有哪几个步骤? 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,

3、将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4. 什么叫随机变量?心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性有规律变化的变量 5. 怎样理解总体、样本与个体? 总体 N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用 N 表示,其构成的基本单元为个体。特点:大小随研究问题而变(有、无限)总体性质由

4、组成的个体性质而定 样本 n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用 n 表示,又叫样本容量。特点:样本容量越大,对总体的代表性越强 样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点 6. 何谓次数、频率及概率 表示 f:随机事件在某一类别中出现的数目,又称为频数,用 f 次数频率:即相对次数,即某个事件次数被总事件除,用比例、百分数表示 概率 P:又称机率或然率,用 P 表示,指某事件在无限管侧重所能预料的相对出现次数。估计值(后验):几次观测中出现 m 次,P(A)=m/n 真实值(先验):特殊情

5、况下,直接计算的比值 (结果有限,出现可能性相等) 7. 统计量与参数之间有何区别和关系? 参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标 统计量:样本的特征值叫做统计量,又称特征值 二者关系:参数是一个常数,统计量随样本而变化 参数常用希腊字母表示,统计量用英文字母表示 当试验次数=总体大小时,二者为同一指标 当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值 8. 试举例说明各种数据类型之间的区别? 9. 下述一些数据,哪些是测量数据?哪些是计数数据?其数值意味着什么? 17.0 千克 89.85 厘米 199.2 秒 93.5 分是测量数据 17 人 25

6、 本是计数数据 10. 说明下面符号代表的意义 反映总体集中情况的统计指标,即总体平均数或期望值 X反映样本平均数 表示某一事物两个特性总体之间关系的统计指标,相关系数 r 样本相关系数 反映总体分散情况的统计指标标准差 s 样本标准差 表示两个特性中体之间数量关系的回归系数 N n 第二章 统计图表 1. 统计分组应注意哪些问题? 分类要正确,以被研究对象的本质为基础 分类标志要明确,要包括所有数据 如删除过失所造成的变异数据,要遵循 3 原则 2. 直条图适合哪种资料? 条形图也叫做直条图,主要用于表示离散型数据资料,即计数资料。 3. 圆形图适合哪种资料 又称饼图,主要用于描述间断性资料

7、,目的是为显示各部分在整体中所占的比重大小,以及各部分之间的比较,显示的资料多以相对数(如百分数)为主 4. 将下列的反应时测定资料编制成次数分布表、累积次数分布表、直方图、次数多边形。 177.5 167.4 116.7 130.9 199.1 198.3 225.0 212.0 180.0 171.0 144.0 138.0 191.0 171.5 147.0 172.0 195.5 190.0 206.7 153.2 217.0 179.2 242.2 212.8 171.0 241.0 176.5 165.4 201.0 145.5 163.0 178.0 162.0 188.1 17

8、6.5 172.2 215.0 177.9 180.5 193.0 190.5 167.3 170.5 189.5 180.1 217.0 186.3 180.0 182.5 171.0 147.0 160.5 181.6 185.5 179.5 143.7 137.5 200.1 177.1 150.5 146.4 148.5 143.5 157.5 153.2 最大值 242.2 最小值 116.7 全距为 125.5 N=65 代入公式 K=1.87(N-1)2/5=9.8 所以 K 取 10 定组距 13 最低组的下限取 115 表 2-1 次数分布表 %)百分次数(频率(f) P)

9、次数(组中值(分组区间 Xc) 3 0.03 232 238 2 2 219 0.02 225 1 9 212 6 206 0.09 9 199 193 6 0.09 22 180 186 14 0.22 25 167 173 0.25 16 8 0.08 154 5 160 17 141 11 0.17 147 5 128 3 0.05 134 2 1 0.02 115 121 100 65 合计 1.00 累加次数分布表表 2-2 向下累加次数向上累加次数分组区 f)次数(相对累加次相对累加次 间 cf 实际累加次数() ) (实际累加次数 cf 数数 0.03 1.00 2 2 232

10、65 0.05 0.97 3 63 219 1 0.14 9 62 206 6 0.95 0.23 15 56 193 0.86 6 0.45 180 50 0.77 14 29 0.69 167 45 36 16 0.55 0.77 20 5 50 0.31 154 0.94 15 0.23 11 141 61 0.98 64 3 128 4 0.06 1.00 1 115 1 65 0.02 7. 下面是一项美国高中生打工方式的调查结果。根据这些数据用手工方式和计算方式个制作一个条形图。并通过自己的体会说明两种制图方式的差别和优缺点 %) )高二(% 打工方式 高三( 5.0 看护孩子 2

11、6.0 22.0 商店销售 7.5 17.5 11.5 餐饮服务 1.5 其他零工 8.0 30 25 20 高二 15 高三 10 5 0 商店销售看护孩子 其他零工餐饮服务 Y 轴名称为:打工人数百分比左侧 轴名称为:打工方式下侧 X 集中量数第三章 应用算术平均数表示集中趋势要注意什么问题?1. 应用算术平均数必须遵循以下几个原则:同质性原则。数据是用同一个观测手段采用相同的观测标准,能反映某一问题的同 一方面特质的数据。 平均数与个体数据相结合的原则 平均数与标准差、方差相结合原则 中数、众数、几何平均数、调和平均数个适用于心理与教育研究中的哪些资料?2. 次数分布表两端数据或个 中数

12、适用于: 当一组观测结果中出现两个极端数目时 要快速估计一组数据代表值时别数据不清楚时 数据不同质时,表示典型情况众数适用于:要快速且粗略的求一组数据代表值时 作为表示次数 M-Mo 粗略估计次数分布的形态时,用次数分布中有两极端的数目时)当次数分 MMdMdMo; 负偏:;分布是否偏态的指标(正态:M=Md=Mo 正偏: 布中出现双众数时等距、等比量表实验几何平均数适用于少数数据偏大或偏小,数据的分布成偏态 平均增长率,按一定比例变化时学习时间一定,记录各被试完成相同工作所用时间 调和平均数适用于工作量固定, 记录一定时间内各被试完成的工作量 对于下列数据,使用何种集中量数表示集中趋势其代表

13、性更好?并计算它们的值。3. =6 4 5 6 6 7 29 中数=5 众数 3 4 5 5 7 5 =5.71 2 3 5 6 7 8 9 平均数 求下列次数分布的平均数、中数。 4.分组 f 分组 f 34 1 65 35 21 60 4 30 16 6 55 25 11 20 50 8 9 15 45 16 24 40 7 10 解:组中值由“精确上下限”算得;设估计平均值在 35组,即 AM=37;中数所在组为35,f=34,其精确下限 Lb=34.5,该组以下各组次数累加为 Fb=21+16+11+9+7=64 MD 分组65 60 f 1 4 组中值 67 62 d=(Xi-AM)

14、/i 6 5 fd 6 20 24 24 32 24 0 -21 -32 55 50 45 40 35 6 8 16 24 34 57 52 47 42 37 4 3 2 1 0 32 30 21 -1 16 27 -2 25 -33 22 20 11 -3 -36 15 17 9 -4 -35 12 10 7 -5 N=157 fd=-27 fd27 5AM+36.14i37X N157N157Fb64 225i=34.5+Md=Lb+36.6 f34MD 5. 求下列四个年级的总平均成绩。 年级 一 二 三 四 94 90.5 91 92 x200 236 318 215 n nX90.5

15、236913189221594200 iiX91.72 解:T 236318n215200i 三个不同被试对某词的联想速度如下表,求平均联想速度 6. Xi) 词数/分(时间(分)被试 联想词数 13/2 A 13 2 13/3 13 B 3 - 13 25 C 解:C 被试联想时间 25 分钟为异常数据,删除 11 调和平均数 M5.2 H13112)( N13213Xi7. 下面是某校几年来毕业生的人数,问平均增加率是多少?并估计 10 年后的毕业人数有多少。 1985 1984 1981 1982 1983 年份 1978 1979 1980 1120 810 1050 毕业人数 542

16、 760 601 930 750 解:用几何平均数变式计算: X1120N1.10925Mg= 所以平均增加率为 11% 7N-1X54211010 年后毕业人数为11201.10925=3159 人 8. 计算第二章习题 4 中次数分布表资料的平均数、中数及原始数据的平局数。 解:组中值由“精确上下限”算得;设估计平均值在 167组,即设 AM=173;中数所在组为167,f=16,其精确下限 Lb=166.5,该组以下各组次数累加为 Fb=1+3+11+5=20 MD fd d=(Xi-AM)/i f) 次数(组中值(分组区间 Xc) 10 5 238 232 2 4 4 219 225

17、1 18 6 206 212 3 12 193 6 199 2 14 180 14 186 1 0 173 0 167 16 -5 160 154 5 -1 -22 141 -2 11 147 -9 -3 3 134 128 -4 -4 115 121 1 合计 fd=18N=65 fd18 i=173+13176.6XAM+平均值 N65N65Fb20 22Md=Lb+167.3i=166.5+中数 f16Md原始数据的平均数=176.8 差异量数第四章 度量离中趋势的差异量数有哪些?为什么要度量离中趋势?1. 度量离中趋势的差异量数有全距、四分位差、百分位差、平均差、标准差与方差等等。在心

18、理和教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。这些特殊性常表现为数据的变异性。如两个样本的平均数相同但是整齐程度不同,如果只比较平均数并不能真实的反映样本全貌。因此只有集中量数不可能真实的反映出样本的分布情况。为了全面反映数据的总体情况,除了必须求出集中量 数外,这时还需要使用差异量数。 各种差异量数各有什么特点?2. 103 页“各种差异量数优缺点比较”见课本 标准差在心理与教育研究中除度量数据的离散程度外还有哪些用途?3. 可以计算差异系数(应用)和标准分数(应用) 应用标准分数求不同质的数据总和时应注意什么问题?4. 要求不同质的数据的次数分布

19、为正态 计算下列数据的标准差与平均差 5.11.0 13.0 10.0 9.0 11.5 12.2 13.1 9.7 10.5 Xi10.59.711.512.213.113.011.010.09.0 X11.1 N9Xi-X10.71.19A.D.= 9n6. 计算第二章习题 4 所列次数分布表的标准差、四分差 Q 设估计平均值在 167组,即 AM=173, i=13 2 fdfd 分组区间 Xc d=(Xc-AM)/i f 5010 5 232 2 238 164 219 4 225 1 5418 212 6 3 206 2412 6 193 2 199 1414 1 186 14 18

20、0 00 16 167 173 0 5-5 -1 154 5 160 44-22 147 11 141 -2 27-9 3 134 -3 128 16-4 1 121 115 -4 250 18 65 合计 2 fdfd2501822()i=s=(13=25.2 65NN65N=65 6525%=16.25 6575%=48.75 所以 Q1、Q3 分别在 154组(小于其组精确下限的各组次数和为 15)和 180组(小于其组精确下限的各组次数和为 36) ,其精确下限分别 ,所以有:179.5 和 153.5 为11N-F6515 b14413=156.75i=153.5+QL b11f51

21、33N-F6536 b344QLi=179.5+13=191.34 b33f143QQ191.34-156.7513=Q=17.30 227. 今有一画线实验,标准线分别为 5cm 和10cm,实验结果 5cm 组的误差平均数为 1.3cm,标准差为 0.7cm,10cm 组的误差平均数为4.3cm,标准差为 1.2cm,请问用什么方法比较其离散程度的大小?并具体比较之。 用差异系数来比较离散程度。 X)100%=(0.7/1.3)100%=53.85% CV1=(s1/1 X)100%=(1.2/4.3) 100%=27.91%CV1 CV2=(s2/2所以标准线为 5cm 的离散程度大。

22、8. 求下表所列各班成绩的总标准差 di 人数 标准差 平均数班级 0.3 1 40 6.2 90.5 -0.2 2 6.5 91.0 51 -1.2 92.0 5.8 48 3 1.3 89.5 5.2 4 43 N40514843182 i NX90.54091.05192.04889.54316525.5ii X90.80 T 182N182i dXX 其值见上表 iTi222225.26469.79436.5485.8Ns406.251 ii22222Nd431.30.2)51(147.4348(400.31.2) ii 22 dNNs6469.79147.43iiiis6.03 即各

23、班成绩的总标准差是 6.03 T182Ni9. 求下表数据分布的标准差和四分差 设估计平均数 AM=52,即在 50组,d=(Xc-AM)/I 计算各值如下表所示: 22fd dd 累加次数 Xc f 分组 fd 5 25 25 5 55 77 1 7580 70 2 72 54 4 16 32 8 12 52 9 3 65 36 4 67 10 2 60 48 4 5 20 62 8 55 1 43 8 1 8 57 0 0 10 0 50 35 52 0 -9 9 45 1 9 25 47 -1 -14 4 -2 28 42 40 7 16 -12 -3 9 35 36 4 37 9 -8

24、 16 5 2 32 32 -4 30 -10 3 25 27 -5 25 50 2 -6 1 20 -6 22 36 1 36 -16 55 合计 312 2ff311622()i=s=5(11.82 55N55N5525%=13.75 5575%=41.25 所以 Q1 在 40组,其精确下限 Lb1=39.5,小于其组的次数为 Fb1=9,其组次数 f1=7;Q2 在 55组,其精确下限 Lb2=54.5,小于其组的次数为Fb2=35,其组次数 f2=8。计算 Q1、Q2 如下: 11N-F559 b1445=42.89i=39.5+QL b11f7133N-F5535 b344QLi=

25、54.5+5=58.41 b33f83QQ58.41-42.8913=7.76Q 即四分位差为 7.76 22第五章 相关关系 1. 解释相关系数时应注意什么? (1) 相关系数是两列变量之间相关成都的数字表现形式,相关程度指标有统计特征数 r 和总体系数 (2) 它只是一个比率,不是相关的百分数,更不是等距的度量值,只能说 r 比 r 相关小大密切,不能说 r=0.8 是 r=0.4 的两倍(不能用倍数关系来解释) 小大(3) 当存在强相关时,能用这个相关关系根据一个变量的的值预测另一变量的值 (4) -1r1,正负号表示相关方向,值大小表示相关程度;(0 为无相关,1 为完全正相关,-1

26、为完全负相关) (5) 相关系数大的事物间不一定有因果关系 (6) 当两变量间的关系收到其他变量的影响时,两者间的高强度相关很可能是一种假象 (7) 计算相关要成对数据,即每个个体有两个观测值,不能随便 2 个个体计算 (8) 非线性相关的用 r 得可能性小,但并不能说不密切 2. 假设两变量为线性关系,计算下列各情况的相关时,应用什么方法? (1) 两列变量是等距或等比的数据且均为正态分布(积差相关) 两列变量是等距或等比的数据且不为正态分布(等级相关) )2(3) 一变量为正态等距变量,另一列变量也为正态变量,但人为分为两类(二列相关) (4) 一变量为正态等距变量,另一列变量也为正态变量

27、,但人为分为多类(多列相关) (5) 一变量为正态等距变量,另一列变量为二分称名变量(点二列相关) (6) 两变量均以等级表示(等级相关、交错系数、相容系数) 3. 如何区分点二列相关与二列相关? 主要区别在于二分变量是否为正态。二列相关要求两列数据均为正态,其中一列被人为地分为两类;点二列相关一列数据为等距或等比测量数据,且其总体分布为正态,另一列变量是二分称名变量,且两列数存在一一对应关系。 4. 品质相关有哪几种?各种品质相关的应用条件是什么? 品质相关分析的总条件是两因素多项分类之间的关联程度,分为一下几类: (1) 四分相关,应用条件是:两因素都为正态连续变量(eg.学习能力,身体状

28、态) )人为分为两个类别;同一被试样品中,分别调查两个不同因素两项分类情况 (2) 系数:除四分相关外的 22 表(最常用) (3) 列联表相关 C:RC 表的计数资料分析相关程度 5. 预考查甲乙丙丁四人对十件工艺美术品的等级评定是否具有一致性,用哪种相关方法? 等级相关 6. 下表是平时两次考试成绩分数,假设其分布成正态,分别用积差相关与等级相关方法计算相关系数,并回答,就这份资料用哪种相关法更恰当? 222 AB BA 被试 B A RRDRD=R-RRBABABA 7138 7396 6889 83 86 1 1-1263 3016 2 58 52 3364 2704 1-18756

29、7031 89 3 7921 79 6241 94431 4992 6084 64 78 4 4096 424462 7735 91 7225 5 8281 85 11-122 3264 4624 6 68 48 2304 954936 2585 2209 7 47 3025 55 17298-1 6232 82 76 5776 8 6724 45-2315 800 25 32 1024 625 9 010100010 4200 10 3136 56 5625 75 45735-2 47193 659 46993 48080 670 343685555 YNXXY1046993670659 0

30、.82r= 222222659X)NY(48080Y)670104719310NX(2D66340.7941r1或 R2210(10N(N1)-1)R4R343683YX(N+1)r110.794 RN-1N(N+1)9110用积差相关的条件成立,故用积差相关更精确 7. 下列两列变量为非正态,选用恰当的方法计算相关 本题应用等级相关法计算,且含有相同等级 X 有 3 个数据的等级相同,等级 3.5 的数据中有 2 个数据的等级相同,等级为 6.5 和 8.5 的个数据等级 3 的数据中有 3 等级为个数据等级相同,3 有 Y 个数据相同;2 数据中也分别有相同,等级为 5.5 的数据中有 2

31、 个数据等级相同,等级为 9 的数据中有 3 个数据等级相同。 2 DRR D=R-RY 被试 X YXXY 0 0 1 14 1 1 13 1 3 11 2 2 -1 12 0.25 3 3.5 10 3 11 0.5 0.25 10 3.5 3 4 0.5 11 0.25 8 5 5 -0.5 5.5 7 1 1 6 6 5.5 7 6.5 0.25 6.5 7 6 5 -0.5 7 0.25 8 8.5 5 -0.5 4 9 0.25 9 5 -0.5 9 8.5 4 1 1 2 4 10 9 10 4.5 N=10 22222(22(21)1)n(n-1)2(21)C1.5 X1212

32、121222223(31)n(n1)-1)3(31)2(24.5C Y12121212331010NN281x1.5C X12123310NN10278y4.5C Y1212222Dyx81784.5r0.972 RC2817822y2x8. 问下表中成绩与性别是否相关? 成绩的平方女成绩男成绩成绩性别被试 6889 1 男 83 83 8281 2 91 女 91 9025 3 95 女 95 7056 4 84 84 男 7921 5 89 89 女 7569 6 87 87 男 7396 7 86 86 男 7225 85 85 男 8 7744 88 女 9 88 8464 女 92

33、10 92 77570 455 425 880 XX为女生为男生成绩,适用点二列相关计算法。pq 为女生成绩,为男生的平均成绩,qps为所有学生成绩的标准差的平均成绩, t425455 XX8591 中可以计算得:p=0.5 q=0.5 从表qp 55 2 XX7757088022()s)(3.6 t1010NN XX8591qp pq0.5r0.50.83 pbs3.6t相关系数为-0.83,相关较高 9. 第 8 题的性别若是改为另一成绩 A()正态分布的及格、不及格两类,且知 1、3、5、7、9被试的成绩 A 为及格,2、4、6、8、10 被试的成绩 A 为不及格,请选用适当的方法计算相

34、关,并解释之。 成绩的平方 B 及格成绩 不及格成绩成绩被试 成绩 A 6889 83 及格 83 1 91 91 不及格 2 8281 95 3 95 及格 9025 84 不及格 4 84 7056 89 及格 89 7921 5 87 不及格 6 87 7569 86 7 7396 86 及格 85 7225 85 8 不及格 88 9 88 7744 及格 10 92 92 不及格 8464 77570 439 880 441 XsXX分别是成绩 A 分别为成绩 B 和适用二列相关。的标准差和平均数,及格和和tqpt不及格时成绩 B 的平均数,p 为成绩 A 及格的比率,y 为标准正态

35、曲线中 p 值对应的高度 2 XX77570880441880 22X88.288X3.6)()s tp t1051010NN439 X87.8p=0.5y=0.39894 查正态表得q 5 XXpq88.287.80.50.5qpr0.070 所以 或者 bsy3.60.39894t XXp88.2880.5tpr0.070相关不大 bsy3.60.39894t10. 下表是某新编测验的分数与教师的评价等级,请问测验成绩与教师的评定间是否有一致性?0.871 11. 下表是 9 名被试评价 10 名著名的天文学家的等级评定结果,问这 9 名被试的等级评定 是否具有一致性? 被试2 被评价者

36、RR ii9 2 1 3 7 5 4 6 8 81 9 1 1 1 1 A 1 1 1 1 1 33 2 3 9 4 3 3 1089 3 B 4 2 43 8 2 5 2 C 4 5 4 1849 4 9 46 2116 D 5 7 3 5 2 5 5 10 4 47 2 5 6 6 E 6 2 9 2 9 2209 52 7 6 6 6 6 4 F 3 8 6 2704 58 5 8 10 9 9 4 3 7 3 G 3364 67 8 10 10 6 8 H 4489 8 3 7 7 67 7 4489 I 8 10 5 10 8 7 10 2 73 4 10 7 10 J 9 9 7

37、5329 9 8 27719 495 适用肯德尔 W 系数。 2)(R2495i2R27719s=3216.5 i10Ns3216.50.481W= 即存在一定关系但不完全一致 113232-10)9-N)(10KN(N 121212. 将 11 题的结果转化为对偶比较结果,并计算肯德尔一致性系数 B E A F C D G H I J 9 9 9 9 9 9 9 A 9 9 8 7 7 5 7 8 0 B 7 8 7 7 5 7 0 C 7 6 6 2 8 8 0 5 3 D 6 7 2 5 9 5 4 E 4 6 5 0 4 6 7 6 3 4 0 7 1 3 7 F 6 4 5 0 4

38、2 2 3 G 6 5 4 4 2 2 3 H 0 1 2 5 3 1 I 2 0 3 5 2 2 4 J 0 1 1 2 2 0 3 4 已知 N=10,K=9 选择对角线以下的择优分数 2r)8(Kr8(294994)ijij294rr29410.3191U ijij10(10-1)N(N-1)K(K-1)9(9-1)或者选择对角线上的择优分数 22247rr311 ijij)上((上)2rK)8(r311)8(22479ijij)(上(上)110.319U N(N-1)K(K-1)9(9-1)10(10-1)13. 概率分布 第六章1. 概率的定义及概率的性质 表明随机事件发生可能性大小

39、的客观指标就是概率 2. 概率分布的类型有哪些?简述心理与教育统计中常用的概率分布及其特点 概率分布是指对随机变量取值的概率分布情况用数学方法(函数)进行描述。概率分布依据不同的标准可以分为不同的类型: (一) 离散分布与连续分布 连续分布指连续随机变量的概率分布,即测量数据的概率分布,如正态分布 离散分布是指离散随机变量的概率分布,即计数数据的概率分布,如二项分布 (二) 经验分布与理论分布 经验分布指根据观察或试验所获得的数据而编制的次数分布或相对频率分布 理论分布有两个含义,一是随机变量概率分布的函数-数学模型,二是指按某种数学模型计算出的总体的次数分布 (三) 基本随机变量分布与抽样分

40、布 基本随机变量分布指理论分布中描述构成总体的基本变量的分布,常用的有二项分布与正态分布 抽样分布是样本统计量的理论分布,又称随机变量函数的分布,如平均数,方差等 3. 何谓样本平均数的分布 所谓样本平均数的分布是指从基本随机变量为正态分布的总体(又称母总体)中,采用有放回随机抽样方法,每次从这个总体中抽取大小为 n 的一个样本,计算出它的平均数 XX,再将 n 个个体,又可计算出一个个个,然后将这些个体放回去,再次取 n12 X,理论及实验证 n 个个体,这样如此反复,可计算出无限多个体放回去,再抽取明这无限多个平均数的分布为正态分布。 4. 从 N=100 的学生中随即抽样,已知男生人数为

41、 35,问每次抽取 1 人,抽的男生的概率是多少?(35/100=0.35) 5. 两个骰子掷一次,出现相同点数的概率是多少? 110.028 666. 从 30 个白球 20 个黑球共 50 个球中随机抽取两次(放回抽样) ,问抽一黑球与一白球的概率是多少?两次皆是白球与两次皆是黑球的概率各是多少? 302020300.48 (一黑一白) 5050505020200.16 (皆是黑球) 505030300.36 (皆是白球) 50507. 自一副洗好的纸牌中每次抽取一张。抽取下列纸牌的概率是多少? (1) 一张 K 4/54 (2) 一张梅花 13/54 (3) 一张红桃 13/54 (4)

42、 一张黑心 13/54 (5) 一张不是 J、Q、K 牌的黑桃 10/54 掷四个硬币时,出现一下情况的概率是多少? 8.服从二项分布 b(4, 0.5) 113222()C() (1) 两个正面两个反面 4822111044)C() 2() 四个正面 42216111311C()() 3) 三个反面 ( 4224115 四个正面或三个反面 (4) 41616111(5) 连续掷两次无一正面 16162569. 在特异功能试验中,五种符号不同的卡片在 25 张卡片中各重复 5 次,每次实验自 25 张卡片中抽取一张,记下符号,将卡片送回。共抽 25 次,每次正确的概率是 1/5.写出实验中的二

43、项式。问这个二项式分布的平均数和标准差各等于多少? 服从二项分布 b(25, 0.2) np250.25 =npq250.20.82 10. 查正态表求: (1) Z=1.5 以上的概率 0.5-0.43319=0.06681 (2) Z=-1.5 以下的概率 0.5-0.43319=0.06681 (3) Z=1.5 之间的概率 0.433192= (4) P=0.78 Z=? Y=? Z=0.77 Y=0.29659 (5) P=0.23 Z=? Y=? Z=-0.74 Y=0.30339 (6) Z 为 1.85 至 2.10 之间的概率?0.48214-0.46784=0.0143 1

44、1. 在单位正态分布中,找出有下列个案百分数的标准测量 Z 的分值 (1)85 (2)55 (3)35 (4)42.3 (5)9.4 12. 在单位正态分布中,找出有下列个案百分数的标准测量的 Z 值 (1)0.14 (2)0.62 (3)0.375 (4)0.418 (5)0.729 13. 今有 1000 人通过一数学能力测验,欲评为六个等级,问各个等级评定人数应是多少? 解:66=1,要使各等级等距,每一等级应占 1 个标准差的距离,确定各等级的 Z 分数界限,查表计算如下: N p 人数分布比率 p 各组界限分组 23 以上 0.02275 1 2136 12 2 0.13591 34

45、1 3 0.34134 01341 -10.34134 4 0 136 5 -1-20.13591 23 以下 6 0.02275 -2 分数 T 将下面的次数分布表正态化,求正态化 14. 各组中 T 分数点以下累积 正态化上限以 Z f 分组 组中值 T=10Z+50 累加次百分比下累加 数 73.3 99% 99 2.33 55 52 100 2 68.8 98 47 97 97% 2 50 1.88 64.8 42 93% 96 6 93 1.48 45 60.8 86% 8 37 40 1.08 90 86 57.1 12 35 0.71 76% 82 32 76 53.3 0.33

46、 63 30 63% 14 70 27 48.5 56 44 24 22 25 -0.15 44% 43.6 32 12 17 26 20 -0.64 26% 38.25 -1.175 20 12 12% 12 15 16 29.5 -2.05 2% 7 4 4 2 10 15. 掷骰子游戏中,一个骰子掷 6 次,问 3 次及 3 次以上 6 点向上的概率各是多少? 服从二项分布: 333b(3, 6, )=C()()0.054511 3 次: 66663 次以上: 4563210456b(4, 6, )b(5, 6, )b(6, 6, )=C()()C()()C()()8.710555111

47、111 666666666666123654301230()()C()()C(1C)()C()()55551111 或者用 66666666666616. 今有四择一选择测验 100 题,问答对多少题才能说是真的会答而不是猜测? 解:服从二项分布,p=1/4, q=3/4, np=1001/4=255,此二项分布接近正态,故: npq4.3325np 根据正态分布概率,当 Z=1.645 时,该点以下包含了全体的 95%。如果用原是分数表示,251.6454.3332.12331.645则为 33 题,即完全凭猜测,100 题中猜对以下的可能性为 95%,猜对 33 题及以上的概率仅为 5%。

48、所以答对 33 题才能说是真的会而不是猜测。 17. 一张考卷中有 15 道多重选择题,每题有 4 个可能的回答,其中至少有一个是正确答案。一考生随机回答, (1)答对 5 至 10 题的概率, (2)答对的平均题数是多少? 18. E 字形试标检查儿童的视敏度,每种视力值(1.0,1.5)有 4 个方向的 E 字各有两个(共 8个) ,问:说对几个才能说真看清了而不是猜测对的? 解:服从二项分布,n=8,p=1/4,np=25,所以不能用正态分布概率算,而直接用二项分布算: 870187b(8, 8, )=C()()0.000015b(7, 8, )=C()()0.000366331111

49、88444444652365b(5, 8, b(6, 8, )=C()()0.003845)=C()()0.023071331111 88444444444b(4, 8, )=C()(0.0865)311 8444由以上计算可知说对 5 个及 5 个以上的概率总和为 0.000015+0.000366+0003845+0.023071=0.027297=2.73%5,可用正态分布概率作近似值。 5515b(5, 20, )=C()()0.0148111 答对 5 题的概率是 20222至少答对 8 题的概率用正态分布概率近似计算如下: 050.52.23610np200.58 所以答对题的 Z 分 X8100.894Z 所以答对至少 8 题的概率即为数为 Z=-0.894 以上的概 2.236率。当 Z=0.894 时查正态表的概率为 0.31327,所以 Z=-0.894 以上的概率为0.5+0.31327=0.81327,即至少答对 8 题的概率为 0.81327 20. 设某城市大学录取率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论