版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、-. z.绪论名词解释随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量总体:又称为母全体、全域,指据有*种特征的一类事物的全体样本:从总体中抽取的一局部个体,称为总体的一个样本个体:构成总体的每个根本单元称为个体次数:指*一事件在*一类别中出现的数目,又成为频数,用f表示频率:又称相对次数,即*一事件发生的次数被总的事件数目除,亦即*一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示概率:又称机率。或然率,用符号P表示,指*一事件在无限的观测中所能预料的相对出现的次数,也就是*一事物或*种情况在*一总体中出现的比率统计量:样本的特征值叫做统计量,又叫做特征
2、值参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标观测值:在心理学研究中,一旦确定了*个值,就称这个值为*一变量的观测值,也就是具体数据何谓心理与教育统计学?学习它有何意义心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进展科学推论找出心理与教育活动规律的一门学科。选用统计方法有哪几个步骤?首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的其次要分析实
3、验数据的类型,不同数据类型所使用的统计方法有很大差异,了解实验数据的类型和水平,对选用恰当的统计方法至关重要第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件什么叫随机变量?心理与教育科学实验所获得的数据是否属于随机变量随机变量的定义:率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性有规律变化的变量怎样理解总体、样本与个体?总体N:据有*种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的根本单元为个体。特点:大小随研究问题而变有、无限总体性质由组成的个体性质而定样本n:从总体中抽取的一局部交个体,称为总体的一个样本。样本数目用n表示
4、,又叫样本容量。特点:样本容量越大,对总体的代表性越强 样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个根本单元称为个体。有时个体又叫做一个随机事件或样本点何谓次数、频率及概率次数f:随机事件在*一类别中出现的数目,又称为频数,用f表示频率:即相对次数,即*个事件次数被总事件除,用比例、百分数表示概率P:又称机率或然率,用P表示,指*事件在无限管侧重所能预料的相对出现次数。估计值后验:几次观测中出现m次,PA=m/n真实值先验:特殊情况下,直接计算的比值 结果有限,出现可能性相等统计量与参数之间有何区别和关系?参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计
5、指标统计量:样本的特征值叫做统计量,又称特征值二者关系:参数是一个常数,统计量随样本而变化 参数常用希腊字母表示,统计量用英文字母表示 当试验次数=总体大小时,二者为同一指标 当总体无限时,二者不同,但统计量可在*种程度上作为参数的估计值试举例说明各种数据类型之间的区别?下述一些数据,哪些是测量数据?哪些是计数数据?其数值意味着什么?17.0千克 89.85厘米 199.2秒 93.5分是测量数据17人 25本是计数数据说明下面符号代表的意义反映总体集中情况的统计指标,即总体平均数或期望值反映样本平均数表示*一事物两个特性总体之间关系的统计指标,相关系数r 样本相关系数反映总体分散情况的统计指
6、标标准差s样本标准差表示两个特性中体之间数量关系的回归系数Nn统计图表统计分组应注意哪些问题?分类要正确,以被研究对象的本质为根底分类标志要明确,要包括所有数据如删除过失所造成的变异数据,要遵循3原则直条图适合哪种资料?条形图也叫做直条图,主要用于表示离散型数据资料,即计数资料。圆形图适合哪种资料又称饼图,主要用于描述连续性资料,目的是为显示各局部在整体中所占的比重大小,以及各局部之间的比拟,显示的资料多以相对数如百分数为主将以下的反响时测定资料编制成次数分布表、累积次数分布表、直方图、次数多边形。177.5 167.4 116.7 130.9 199.1 198.3 225.0 212.0
7、180.0 171.0 144.0 138.0 191.0 171.5 147.0 172.0 195.5 190.0 206.7 153.2 217.0 179.2 242.2 212.8 171.0 241.0 176.5 165.4 201.0 145.5 163.0 178.0 162.0 188.1 176.5 172.2 215.0 177.9 180.5 193.0 190.5 167.3 170.5 189.5 180.1 217.0 186.3 180.0 182.5 171.0 147.0 160.5 153.2 157.5 143.5 148.5 146.4 150.5
8、177.1 200.1 137.5 143.7 179.5 185.5 181.6 最大值242.2 最小值116.7 全距为125.5N=65 代入公式K=1.87N-12/5=9.8 所以K取10定组距13 最低组的下限取115表2-1 次数分布表分组区间组中值*c次数f频率P百分次数%2322382 0.033 2192251 0.022 2062126 0.099 1931996 0.099 18018614 0.2222 16717316 0.2525 1541605 0.088 14114711 0.1717 1281343 0.055 1151211 0.022 合计65 1.0
9、0100 表2-2 累加次数分布表分组区间次数f向上累加次数向下累加次数实际累加次数cf相对累加次数实际累加次数cf相对累加次数2322651.00 20.032191630.97 30.052066620.95 90.141936560.86150.2318014500.77290.4516716360.55450.691545200.31500.7714111150.23610.94128340.06640.981151 10.02651.00下面是一项美国高中生打工方式的调查结果。根据这些数据用手工方式和计算方式个制作一个条形图。并通过自己的体会说明两种制图方式的差异和优缺点打工方式高二
10、%高三%看护孩子26.0 5.0 商店销售7.5 22.0 餐饮效劳11.5 17.5 其他零工8.0 1.5 051015202530看护孩子商店销售餐饮效劳其他零工高二高三左侧Y轴名称为:打工人数百分比下侧*轴名称为:打工方式集中量数应用算术平均数表示集中趋势要注意什么问题?应用算术平均数必须遵循以下几个原则:同质性原则。数据是用同一个观测手段采用一样的观测标准,能反映*一问题的同一方面特质的数据。平均数与个体数据相结合的原则平均数与标准差、方差相结合原则中数、众数、几何平均数、调和平均数个适用于心理与教育研究中的哪些资料?中数适用于: 当一组观测结果中出现两个极端数目时 次数分布表两端数
11、据或个别数据不清楚时 要快速估计一组数据代表值时众数适用于:要快速且粗略的求一组数据代表值时 数据不同质时,表示典型情况次数分布中有两极端的数目时 粗略估计次数分布的形态时,用M-Mo作为表示次数分布是否偏态的指标正态:M=Md=Mo; 正偏:MMdMo; 负偏:MMdMo当次数分布中出现双众数时几何平均数适用于少数数据偏大或偏小,数据的分布成偏态 等距、等比量表实验平均增长率,按一定比例变化时调和平均数适用于工作量固定,记录各被试完成一样工作所用时间 学习时间一定,记录一定时间内各被试完成的工作量对于以下数据,使用何种集中量数表示集中趋势其代表性更好?并计算它们的值。 4 5 6 6 7 2
12、9 中数=6 3 4 5 5 7 5 众数=5 2 3 5 6 7 8 9 平均数=5.71求以下次数分布的平均数、中数。分组f分组f651353460430215562516508201145161594024107解:组中值由准确上下限算得;设估计平均值在35组,即AM=37;中数所在组为35,fMD=34,其准确下限Lb=34.5,该组以下各组次数累加为Fb=21+16+11+9+7=64分组f组中值d=(*i-AM)/ifd651676660462520556574245085232445164723240244212435343700302132-1-21251627-2-32201
13、122-3-3315917-4-3610712-5-35N=157fd=-27求以下四个年级的总平均成绩。年级一二三四90.5919294n236318215200解:三个不同被试对*词的联想速度如下表,求平均联想速度被试联想词数时间分词数/分*iA13213/2B13313/3C1325-解:C被试联想时间25分钟为异常数据,删除下面是*校几年来毕业生的人数,问平均增加率是多少?并估计10年后的毕业人数有多少。年份19781979198019811982198319841985毕业人数54260175076081093010501120解:用几何平均数变式计算: 所以平均增加率为11%10年
14、后毕业人数为11201.1092510=3159人计算第二章习题4中次数分布表资料的平均数、中数及原始数据的平局数。解:组中值由准确上下限算得;设估计平均值在167组,即设AM=173;中数所在组为167,fMD=16,其准确下限Lb=166.5,该组以下各组次数累加为Fb=1+3+11+5=20分组区间组中值*c次数fd=(*i-AM)/ifd2322382 5102192251 442062126 3181931996 21218018614 11416717316 001541605 -1-514114711 -2-221281343 -3-91151211 -4-4合计N=65 fd=
15、18平均值中数原始数据的平均数=176.8差异量数度量离中趋势的差异量数有哪些?为什么要度量离中趋势?度量离中趋势的差异量数有全距、四分位差、百分位差、平均差、标准差与方差等等。在心理和教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。这些特殊性常表现为数据的变异性。如两个样本的平均数一样但是整齐程度不同,如果只比拟平均数并不能真实的反映样本全貌。因此只有集中量数不可能真实的反映出样本的分布情况。为了全面反映数据的总体情况,除了必须求出集中量数外,这时还需要使用差异量数。各种差异量数各有什么特点?见课本103页各种差异量数优缺点比拟标准差在心理与教育研究中除
16、度量数据的离散程度外还有哪些用途?可以计算差异系数应用和标准分数应用应用标准分数求不同质的数据总和时应注意什么问题?要求不同质的数据的次数分布为正态计算以下数据的标准差与平均差11.0 13.0 10.0 9.0 11.5 12.2 13.1 9.7 10.5计算第二章习题4所列次数分布表的标准差、四分差Q设估计平均值在167组,即AM=173, i=13分组区间*cfd=(*c-AM)/ifdfd22322382 510502192251 44162062126 318541931996 2122418018614 1141416717316 0001541605 -1-5514114711
17、 -2-22441281343 -3-9271151211 -4-416合计65 18250N=65 6525%=16.25 6575%=48.75 所以Q1、Q3分别在154组小于其组准确下限的各组次数和为15和180组小于其组准确下限的各组次数和为36,其准确下限分别为153.5和179.5,所以有:今有一画线实验,标准线分别为5cm和10cm,实验结果5cm组的误差平均数为1.3cm,标准差为0.7cm,10cm组的误差平均数为4.3cm,标准差为1.2cm,请问用什么方法比拟其离散程度的大小?并具体比拟之。用差异系数来比拟离散程度。CV1=(s1/)100%=(0.7/1.3)100%
18、=53.85%CV2=(s2/)100%=(1.2/4.3) 100%=27.91%CV1所以标准线为5cm的离散程度大。求下表所列各班成绩的总标准差班级平均数标准差人数di190.56.240 0.3291.06.551-0.2392.05.848-1.2489.55.243 1.3 其值见上表 即各班成绩的总标准差是6.03求下表数据分布的标准差和四分差设估计平均数AM=52,即在50组,d=(*c-AM)/I计算各值如下表所示:分组f*c累加次数dd2fd2fd7580177555252557027254416328654675239361260562482420105585743118
19、85010523500004594725-119-94074216-2428-14354379-3936-12302325-41632-8252273-52550-10201221-63636-6合计55312-165525%=13.75 5575%=41.25 所以Q1在40组,其准确下限Lb1=39.5,小于其组的次数为Fb1=9,其组次数f1=7;Q2在55组,其准确下限Lb2=54.5,小于其组的次数为Fb2=35,其组次数f2=8。计算Q1、Q2如下: 即四分位差为7.76相关关系解释相关系数时应注意什么?相关系数是两列变量之间相关*的数字表现形式,相关程度指标有统计特征数r和总体系
20、数它只是一个比率,不是相关的百分数,更不是等距的度量值,只能说r大比r小相关密切,不能说r大=0.8是r小=0.4的两倍不能用倍数关系来解释当存在强相关时,能用这个相关关系根据一个变量的的值预测另一变量的值-1r1,正负号表示相关方向,值大小表示相关程度;0为无相关,1为完全正相关,-1为完全负相关相关系数大的事物间不一定有因果关系当两变量间的关系收到其他变量的影响时,两者间的高强度相关很可能是一种假象计算相关要成对数据,即每个个体有两个观测值,不能随便2个个体计算非线性相关的用r得可能性小,但并不能说不密切假设两变量为线性关系,计算以下各情况的相关时,应用什么方法?两列变量是等距或等比的数据
21、且均为正态分布积差相关两列变量是等距或等比的数据且不为正态分布等级相关一变量为正态等距变量,另一列变量也为正态变量,但人为分为两类二列相关一变量为正态等距变量,另一列变量也为正态变量,但人为分为多类多列相关一变量为正态等距变量,另一列变量为二分称名变量点二列相关两变量均以等级表示等级相关、交织系数、相容系数如何区分点二列相关与二列相关?主要区别在于二分变量是否为正态。二列相关要求两列数据均为正态,其中一列被人为地分为两类;点二列相关一列数据为等距或等比测量数据,且其总体分布为正态,另一列变量是二分称名变量,且两列数存在一一对应关系。品质相关有哪几种?各种品质相关的应用条件是什么?品质相关分析的
22、总条件是两因素多项分类之间的关联程度,分为一下几类:四分相关,应用条件是:两因素都为正态连续变量eg.学习能力,身体状态人为分为两个类别;同一被试样品中,分别调查两个不同因素两项分类情况系数:除四分相关外的22表最常用列联表相关C:RC表的计数资料分析相关程度预考察甲乙丙丁四人对十件工艺美术品的等级评定是否具有一致性,用哪种相关方法?等级相关下表是平时两次考试成绩分数,假设其分布成正态,分别用积差相关与等级相关方法计算相关系数,并答复,就这份资料用哪种相关法更恰当?被试ABA2B2ABRARBRA RBD=RA-RBD218683739668897138236-1125852336427043
23、0167856-1137989624179217031414394647840966084499264242459185828172257735122-1164868230446243264965439755473025220925858972-11882766724577662323515-249322510246258001010100001075565625313642005735-24670659480804719346993555536834或用积差相关的条件成立,故用积差相关更准确以下两列变量为非正态,选用恰当的方法计算相关此题应用等级相关法计算,且含有一样等级*有3个数据的等级一
24、样,等级3.5的数据中有2个数据的等级一样,等级为6.5和8.5的数据中也分别有2个数据一样;Y有3个数据等级一样,等级为3的数据中有3个数据等级一样,等级为5.5的数据中有2个数据等级一样,等级为9的数据中有3个数据等级一样。被试*YR*RYD=R*-RYD21131411002121123-11310113.530.50.25410113.530.50.2558755.5-0.50.256676.55.5117656.57-0.50.258548.59-0.50.259548.59-0.50.25102410911N=104.5问下表中成绩与性别是否相关?被试性别成绩男成绩女成绩成绩的平方
25、1男838368892女919182813女959590254男848470565女898979216男878775697男868673968男858572259女8888774410女9292846488042545577570适用点二列相关计算法。p为男生成绩,q为女生成绩,为男生的平均成绩,为女生的平均成绩,为所有学生成绩的标准差从表中可以计算得:p=0.5 q=0.5 相关系数为-0.83,相关较高第8题的性别假设是改为另一成绩A正态分布的及格、不及格两类,且知1、3、5、7、9被试的成绩A为及格,2、4、6、8、10被试的成绩A为不及格,请选用适当的方法计算相关,并解释之。被试成绩A
26、成绩B及格成绩不及格成绩成绩的平方1及格838368892不及格919182813及格959590254不及格848470565及格898979216不及格878775697及格868673968不及格858572259及格8888774410不及格9292846488044143977570适用二列相关。和分别为成绩B的标准差和平均数,和分别是成绩A及格和不及格时成绩B的平均数,p为成绩A及格的比率,y为标准正态曲线中p值对应的高度 查正态表得所以 或者相关不大下表是*新编测验的分数与教师的评价等级,请问测验成绩与教师的评定间是否有一致性?0.871下表是9名被试评价10名著名的天文学家的等
27、级评定结果,问这9名被试的等级评定是否具有一致性?被评价者被试RiRi2123456789A111111111981B243394332331089C424429558431849D3555521074462116E962265269472209F678636646522704G5391047983583364H81068837107674489I781071010825674489J1097978491073532949527719适用肯德尔W系数。 即存在一定关系但不完全一致将11题的结果转化为对偶比拟结果,并计算肯德尔一致性系数ABCDEFGHIJA999999999B077587788
28、C026567777D023565878E044455669F013346777G022443566H022132445I012232355J012102344N=10,K=9 选择对角线以下的择优分数或者选择对角线上的择优分数概率分布概率的定义及概率的性质说明随机事件发生可能性大小的客观指标就是概率概率分布的类型有哪些?简述心理与教育统计中常用的概率分布及其特点概率分布是指对随机变量取值的概率分布情况用数学方法函数进展描述。概率分布依据不同的标准可以分为不同的类型:离散分布与连续分布连续分布指连续随机变量的概率分布,即测量数据的概率分布,如正态分布离散分布是指离散随机变量的概率分布,即计数数
29、据的概率分布,如二项分布经历分布与理论分布经历分布指根据观察或试验所获得的数据而编制的次数分布或相对频率分布理论分布有两个含义,一是随机变量概率分布的函数-数学模型,二是指按*种数学模型计算出的总体的次数分布根本随机变量分布与抽样分布根本随机变量分布指理论分布中描述构成总体的根本变量的分布,常用的有二项分布与正态分布抽样分布是样本统计量的理论分布,又称随机变量函数的分布,如平均数,方差等何谓样本平均数的分布所谓样本平均数的分布是指从根本随机变量为正态分布的总体又称母总体中,采用有放回随机抽样方法,每次从这个总体中抽取大小为n的一个样本,计算出它的平均数,然后将这些个体放回去,再次取n个个体,又
30、可计算出一个,再将n个个体放回去,再抽取n个个体,这样如此反复,可计算出无限多个,理论及实验证明这无限多个平均数的分布为正态分布。从N=100的学生中随即抽样,男生人数为35,问每次抽取1人,抽的男生的概率是多少?(35/100=0.35)两个骰子掷一次,出现一样点数的概率是多少?从30个白球20个黑球共50个球中随机抽取两次放回抽样,问抽一黑球与一白球的概率是多少?两次皆是白球与两次皆是黑球的概率各是多少? 一黑一白 皆是黑球 皆是白球自一副洗好的纸牌中每次抽取一*。抽取以下纸牌的概率是多少?一*K 4/54一*梅花 13/54一*红桃 13/54一*黑心 13/54一*不是J、Q、K牌的黑
31、桃 10/54掷四个硬币时,出现一下情况的概率是多少?服从二项分布b4, 0.5两个正面两个反面四个正面三个反面四个正面或三个反面连续掷两次无一正面在特异功能试验中,五种符号不同的卡片在25*卡片中各重复5次,每次实验自25*卡片中抽取一*,记下符号,将卡片送回。共抽25次,每次正确的概率是1/5.写出实验中的二项式。问这个二项式分布的平均数和标准差各等于多少?服从二项分布b25, 0.2查正态表求:Z=1.5以上的概率 0.5-0.43319=0.06681Z=-1.5以下的概率 0.5-0.43319=0.06681Z=1.5之间的概率 0.433192=P=0.78 Z= Y= Z=0.
32、77 Y=0.29659 P=0.23 Z= Y= Z=-0.74 Y=0.30339Z为1.85至2.10之间的概率?0.48214-0.46784=0.0143在单位正态分布中,找出有以下个案百分数的标准测量Z的分值185 255 335 442.3 59.4在单位正态分布中,找出有以下个案百分数的标准测量的Z值10.14 20.62 30.375 40.418 50.729今有1000人通过一数学能力测验,欲评为六个等级,问各个等级评定人数应是多少?解:66=1,要使各等级等距,每一等级应占1个标准差的距离,确定各等级的Z分数界限,查表计算如下:分组各组界限比率p人数分布pN12以上0.
33、02275232120.135911363010.341343414-100.341343415-2-10.135911366-2以下0.0227523将下面的次数分布表正态化,求正态化T分数分组组中值f上限以下累加各组中点以下累加次数累积百分比Z正态化T分数T=10Z+50555221009999%2.3373.350472989797%1.8868.845426969393%1.4864.840378908686%1.0860.8353212827676%0.7157.1302714706363%0.3353.3252224564444%-0.1548.5201712322626%-0.6
34、443.6151216201212%-1.17538.251074422%-2.0529.5掷骰子游戏中,一个骰子掷6次,问3次及3次以上6点向上的概率各是多少?服从二项分布:3次:3次以上:或者用今有四择一选择测验100题,问答对多少题才能说是真的会答而不是猜想?解:服从二项分布,p=1/4, q=3/4, np=1001/4=255,此二项分布接近正态,故:根据正态分布概率,当Z=1.645时,该点以下包含了全体的95%。如果用原是分数表示,则为,即完全凭猜想,100题中猜对33题以下的可能性为95%,猜对33题及以上的概率仅为5%。所以答对33题才能说是真的会而不是猜想。一*考卷中有15道多重选择题,每题有4个可能的答复,其中至少有一个是正确答案。一考生随机答复,1答对5至10题的概率,2答对的平均题数是多少?E字形试标检查儿童的视敏度,每种视力值1.0,1.5有4个方向的E字各有两个共8个,问:说对几个才能说真看清了而不是猜想对的?解:服从二项分布,n=8,p=1/4,np=25,所以不能用正态分布概率算,而直接用二项分布算:由以上计算可知说对5个及5个以上的概率总和为0.000015+0.000366+0003845+0.023071=0.027297=2.73%5,可用正态分布概率作近似值。答对5题的概
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 年度药物运载系统药品市场分析及竞争策略分析报告
- 2024版个体运输户与大车司机合作协议
- 垫层防水施工方案
- 2025年度个人医疗借款担保合同模板2篇
- 2025年度社区便利店酒水新品引进及销售合作协议3篇
- 2025年新型打桩技术劳务分包合同范本4篇
- 二零二五版药品质量检验试剂定制研发合同3篇
- CECT品牌定位及传播策略
- 2024中考模拟考试语文试卷(一模)含答案
- 2025年模具行业安全生产标准化建设合同4篇
- (完整版)水利部考试历年真题-水利基础知识试题集
- 个人顶账房合同范例
- 安徽省淮南四中2025届高二上数学期末统考模拟试题含解析
- 保险专题课件教学课件
- 牛津上海版小学英语一年级上册同步练习试题(全册)
- 室上性心动过速-医学课件
- 建设工程法规及相关知识试题附答案
- 中小学心理健康教育课程标准
- 四年级上册脱式计算400题及答案
- 人教精通版三年级英语上册各单元知识点汇总
- 教案:第三章 公共管理职能(《公共管理学》课程)
评论
0/150
提交评论