第6讲 心理测量的统计基础(2)_第1页
第6讲 心理测量的统计基础(2)_第2页
第6讲 心理测量的统计基础(2)_第3页
第6讲 心理测量的统计基础(2)_第4页
第6讲 心理测量的统计基础(2)_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、12007-9-28 心理测量学第六讲 心理测量的统计基础(2)22007-9-28五、相对量数o百分等级指出原始数据在常模团体中的相对位置 。o百分等级的计算: 1、计算有多少观测值在我们感兴趣的特定分数值之下。2、计算观测值的总数。3、用特定分数值之下的观测值的个数除以观测值的总数。4、将结果乘以100。 公式为:PR=B/N100=Xi的百分等级 PR=百分等级,Xi=感兴趣的特定分值,B=在Xi以下的观测值的个数,N=群体的观测值的总数。 32007-9-28o如果有相同的分数,需要对公式进行修正。 o基本公式的修正: 42007-9-28oz分数 z=(X-M)/S z分数的分布形状

2、和原始分数的分布是相同的 。 z分数的均值是0,标准差是1。 52007-9-28六、正态分布o公式 o(X-)2/2是对任何X值的z2 o正态分布有两个参数:和。 o正态分布的特征:o标准正态分布 :当正态分布中的分数转换为z分数时,z分数的分布称作标准正态分布,均数为0,方差为1。 62007-9-28七、相关o散点图(scatter diagram) :考察具有统计关系的两个变量之间的基本方法。 将两个变数的n对观察值(x1,y1)、 (x2,y2) (xn,yn)分别标注在同一坐标图上。72007-9-28散点图散点图82007-9-28o相关系数 :Pearson积差相关,Spear

3、man相关,点二列相关,Kendall和谐系数 o一个相关关系可以评估和描述两个变量间的三方面的关系 :相关的方向 ,相关的形式 ,相关的程度或强度 92007-9-28o相关系数的解释 :相关系数是否大到足以说明两个变量间重要的或有意义的关系 。o1、这个相关系数与00有显著差异吗? 样本相关系数与总体相关系数间存在抽样误差,所样本相关系数与总体相关系数间存在抽样误差,所以求得样本相关系数后应进行假设检验。以求得样本相关系数后应进行假设检验。 o2、X观测值中有百分之几的方差与Y观测值的方差是共同的?o3、X和Y之间有较高相关并不意味着这些变量间有因果关系 。 102007-9-28在实际工

4、作中要区别相关的统计学意义与在实际工作中要区别相关的统计学意义与相关强度。相关有统计学意义指该样本相相关强度。相关有统计学意义指该样本相关系数关系数r r来自来自=0=0的总体概率很小,而相关的总体概率很小,而相关强度表示两变量间相互关系的密切程度,强度表示两变量间相互关系的密切程度,用值的大小来反映。用值的大小来反映。112007-9-28o相关系数在测量信度方面的应用 o相关系数在测量效度方面的应用 122007-9-28八、回归1、掌握回归分析的基本概念;2、理解一元线性回归(simple linear regression)模型,能够对模型进行估计和检验并利用模型进行预测;132007

5、-9-28主要内容 (一)、基本概念 (二)、线性回归的基本假设。 (三)、回归模型的建立方法 (四)、回归方程的检验方法。142007-9-28(一)基本概念(一)基本概念两个变量之间的关系有函数关系函数关系和统计关系统计关系。函数关系函数关系是一种确定关系,当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,这种关系为确定性的函数关系。如某种商品的销售收入Y与该商品的销售量X以及该商品价格P之间的关系可以表示为Y=PX,这就是一种函数关系。一般把作为影响因素的变量称为自变量;把发生对应变化的变量称为因变量。Y是因变量,P与X是自变量。152007-9-28(函数关系)(1)是一一对

6、应的确定关系(2)设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量(3)各观测点落在一条线上 162007-9-28统计关系统计关系是非确定关系,即一个变量受另一个变量的影响,但又不是确定的函数关系。两个变数一般用Y和X表示,统计学将它们的关系分为因果关系和相关关系。172007-9-28因果关系是指一个变量的变化引起另一个变量的相应变化,即一个是引起变化的原因,一个是变化的结果。前者定义为自变量(independent

7、 variable)以 X 表示,后者称作因变量(dependent variable),以 Y 表示。相关关系是指当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化,但两个变量之间不是因果关系。如身高与体重的关系。这里没有自变量与因变量之分。182007-9-28相关关系(1)变量间关系不能用函数关系精确表达;(2)一个变量的取值不能由另一个变量唯一确定;(3)当变量 x 取某个值时,变量 y 的取值可能有几个;(4)各观测点分布在直线周围。192007-9-28 相关关系的例子相关关系的例子收入水平收入水平(y)与受教育程度与受教

8、育程度(x)之间的关系之间的关系父亲身高父亲身高(y)与子女身高与子女身高(x)之间的关系之间的关系202007-9-28o统计学上采用回归分析统计学上采用回归分析 (regression analysis)研究呈因果关系的相关变量间的关系。研究呈因果关系的相关变量间的关系。表示原因表示原因的变量称为自变量,表示结果的变量称为因变量。的变量称为自变量,表示结果的变量称为因变量。o 研究研究“一因一果一因一果”,即一个自变量与一个因,即一个自变量与一个因变量的回归分析称为变量的回归分析称为一元回归分析一元回归分析;o 研究研究“多因一果多因一果”,即多个自变量与一个因,即多个自变量与一个因变量的

9、回归分析称为变量的回归分析称为多元回归分析多元回归分析。o 一元回归分析又分为一元回归分析又分为直线回归分析直线回归分析与与曲线回曲线回归分析归分析两种;多元回归分析又分为两种;多元回归分析又分为多元线性回归多元线性回归分析分析与与多元非线性回归分析多元非线性回归分析两种。两种。212007-9-28222007-9-28o统计学上采用相关分析统计学上采用相关分析 ( correlation analysis)研究呈平行关系的相关变量之间研究呈平行关系的相关变量之间的关系。的关系。o 对两个变量间的直线关系进行相关分对两个变量间的直线关系进行相关分析称为析称为简单相关分析简单相关分析(也叫(也

10、叫直线相关分直线相关分析析););o 对多个变量进行相关分析时,研究一对多个变量进行相关分析时,研究一个变量与多个变量间的线性相关称为个变量与多个变量间的线性相关称为复相复相关分析关分析;研究其余变量保持不变的情况下;研究其余变量保持不变的情况下两个变量间的线性相关称为两个变量间的线性相关称为偏相关分析偏相关分析。232007-9-28 在回归模型中,自变量X是试验时预先确定的,没有误差或误差很小,而依变量Y不仅随着X的变化而变化,并且有随机误差。回归模型尚有预测的特征。回归模型资料的统计方法叫回归分析回归分析,确定由X来预测或控制Y的回归方程回归方程 ,并确定当给X某一个值时Y将会在什么范围

11、内变化。 在相关模型中,X和Y变数是平行变化关系,均具有随机误差,所表示的只是两个变数的偕同变异,没有自变数和依变数之分,也不具有预测的性质。相关模型资料的统计方法叫相相关分析关分析,其目的是要测定两个变数在数量关系上的密切程度和性质。回归分析与相关分析回归分析与相关分析)(xfy 242007-9-28o相关分析就是用一个指标来表明现象间相相关分析就是用一个指标来表明现象间相互依存关系的密切程度。广义的相关分析互依存关系的密切程度。广义的相关分析包括相关关系的分析(狭义的相关分析)包括相关关系的分析(狭义的相关分析)和回归分析。和回归分析。o回归分析是指对具有相关关系的现象,根回归分析是指对

12、具有相关关系的现象,根据其相关关系的具体形态,选择一个合适据其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式),用来近的数学模型(称为回归方程式),用来近似地表达变量间的平均变化关系的一种统似地表达变量间的平均变化关系的一种统计分析方法。计分析方法。252007-9-28回归分析与相关分析的关系: 回归分析(analysis of regression)和相关分析(analysis of correlation)均为研究及度量两个或者两个以上变量之间关系的方法。从广义上说,相关分析包括回归分析。但严格地讲,二者有区别。262007-9-28相关分析与回归分析的区别 o 1.在相关分

13、析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。o2.相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。272007-9-28相关分析与回归分析的联系o相关分析和回归分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具

14、体形式才有意义。o简单说:1、相关分析是回归分析的基础和前提;2、回归分析是相关分析的深入和继续。282007-9-28回归模型: 变量与变量之间的相关关系虽然不是确定性的函数关系,但在大量的观察之下,仍然可以借助一些数学模型来表达他们之间的规律,这种表达变量间规律的数学模型就称为回归模型。 根据相关变量之间的规律性分为:线性回归模型和非线性回归模型,即直线模型和曲线模型。按回归分析涉及的相关变量的数目分为:一元线性回归模型和多元线性回归模型。292007-9-28一一 元元线线性性回回归归Simple Linear regression2007-9-2830(二)、线形回归的基本假设 适用条

15、件 : 变量要求:自变量是间距测度变量或名义测度等级的变量,因变量是间距测度等级以上的变量。 1、线性关系的假设 X与Y在总体上具有线性关系。回归分析必须建立在变量之间具有线性关系的假设成立上。 2、正态性假设 在回归分析中的Y服从正态分布。与某一个Xi值对应的一组Y值构成变量Y的一个子总体,所有这样的子总体都服从正态分布。且各个子总体的方差都相等。2007-9-2831 3、独立性假设 包含两层意思。一个是指与某一个X值对应的一组Y值和与另一个X值对应的一组Y值之间没有关系,彼此独立。另一个是指误差项独立,不同的X所产生的误差之间相互独立,无自相关(non-autocorrelation),

16、而误差项也需与自变量X相互独立。 2007-9-2832xy0 x1xx 2xx 3xx xyE)()(yfxy0)(E0),(jiCov0),(iixCov)(iyE)(iyf2007-9-2833(三)、回归模型的建立 回归模型的建立实际上就是根据已知两变量的数据求回归方程。(一) 一般步骤: 1、根据数据资料作散点图,直观地判断两变量之间是否大致成一种直线关系。 2、设直线方程式为:=a+bX。如果估计值与实际值Y 之间的误差比其他估计值与实际值Y之间的误差小,则这个表达式就是最优拟合直线模型(linear model fit),即表示X与Y 之间线性关系的最佳模型。 3、选定某种方法,

17、如平均数法、最小二乘法等。使用实际数据资料,计算表达式中的a和b。 4、将a、b值代入表达式,得出回归方程。 2007-9-2834 建立直线回归方程的基本原理建立直线回归方程的基本原理 在散点图中可以设想出无数条直线代表在散点图中可以设想出无数条直线代表这些点的直线趋势,但是在这些直线中,我这些点的直线趋势,但是在这些直线中,我们希望找出一条最具代表性的直线,如果有们希望找出一条最具代表性的直线,如果有一条直线它满足散点图上的每一点沿一条直线它满足散点图上的每一点沿Y Y轴方轴方向到直线的距离(即向到直线的距离(即Y- Y- )的平方和最小,)的平方和最小,简单讲就是使误差的平方各最小,那么

18、我们简单讲就是使误差的平方各最小,那么我们认为这样一条直线是最有代表性的。该直线认为这样一条直线是最有代表性的。该直线回归方程的表达式为:回归方程的表达式为:Y2007-9-2835 式中式中X X为自变量,(为自变量,( 读读hathat)为因为因变量变量Y Y的估计值。的估计值。a a为直线在为直线在Y Y轴上的截距,轴上的截距,即即X=0X=0时的值。时的值。b b为直线的斜率,称为回为直线的斜率,称为回归系数,表示归系数,表示X X变动一个单位时,变动一个单位时, 平均平均变动的单位数。变动的单位数。 YYbXaY 2007-9-2836bxay 上式读作y依x的直线回归方程。其中,x

19、是自变量,y是与x相对应的依变量的点估计。a是x0时的y值,称作回归截距(regression intercept)。b是当x增加一个单位时,y平均增加或减少的单位数,称作回归系数(regression coefficient)。直线回归方程直线回归方程 Linear regression equation回归系数回归截距bxay2007-9-2837XY为随机误差项为模型参数,与式中:XYEY2007-9-2838)(YEXXY截距截距斜率斜率一元线性回归方程的可能形态一元线性回归方程的可能形态 为正为正 为负为负 为为02007-9-2839XYEYbxay以样本统计量估计总体参数以样本统

20、计量估计总体参数斜率(回归系数)斜率(回归系数)截距截距截距截距a 表示在没有自变量表示在没有自变量x的影响时,其它各的影响时,其它各种因素对因变量种因素对因变量y的平均影响;的平均影响;回归系数回归系数b 表表明自变量明自变量x每变动一个单位,因变量每变动一个单位,因变量y平均变平均变动动b个单位。个单位。2007-9-2840iiiiybxayyyxbxay)(值应为的实际而变量之间的平均变动关系,变量与是理论模型,表明2007-9-2841bxay最小平方法最小平方法基本数学要求:基本数学要求:min) (02yyyy02012min,min) (22xbxaybxaybabxayyy,

21、有求偏导数,并令其为零、分别对函数中,有由2007-9-28422xbxaxyxbnayxbynxbnyaxxnyxxynb22)(2007-9-2843 注意: 因果关系不可能完全根据统计分析证明。在回归模型中所表述的因果关系即使很好的拟合了数据,也不能完全肯定它实际上存在,因为在模型中将因变量和自变量互换,也同 样能很好的拟合数据。严格地说,回归分析在研究中所起的作用不是确证因果关系,而是确认因变量和自变量的统计关系是否存在。如果在变量之间有比较稳定的关系,回归分析可以加以量化描述。因此,回归模型只是整个研究方案中的一环,它必须依赖理论和经验的支撑,服从研究设计的需要,在研究方法论的指导下

22、展开。 2007-9-2844(四)、线性回归方程检验方法一般有以下两种等效的检验方法:(1)对回归方程的方差分析(实际上对回归方差分析的主要目的就是进行回归方程的检验);(2)对回归系数进行显著性检验。2007-9-28451、回归方程的有效性检验 散点图中任意一点到Y的距离均可以分为两部分:一部分是该点到回归直线的距离, 另一部分是该点的估计值到Y的距离,如图1 :(Y- )= (Y- )+ ( - ),如果各点都很靠近 回归线,则(Y- )很小, (Y- )中大部分是 ( - ),这种情况说明误差小,回归方程合适。YYYY2007-9-2846 图1 线性回归变异分析示意图 (Y-Y)Y

23、(Y- )(-Y)Y X= a+bX2007-9-2847v (Y- )即所有Y值的总平方和,记作SS总v ( - )表示由回归直线表示的线性关系解释的那部分离差平方和,记作SS回归v(Y- ) 是用回归直线无法解释的那个离差平方和,即偏离回归线的平方和,称为误差平方和或剩余残差平方和,记作SS误差 即:SS总= (Y- ) df=n-1 SS回归= ( - ) df=1 SS误差=(Y- ) df=n-2 F=MS回归/MS误差 YYYY2007-9-2848运用F检验,判断MS回归是否显著大于MS误差,如果MS回归显著大于MS误差,则表明总变异中回归的贡献显著,称回归方程显著。2007-9-2849 回归系数的假设检验回归系数的假设检验 样本回归系数样本回归系数b b是总体回归系数是总体回归系数的估计值。从的估计值。从=0=0(无直线回归关系)无直线回归关系)的总体中抽取样本,由于存在抽样误差,的总体中抽取样本,由于存

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论