心理统计学学习笔记——数据整理_第1页
心理统计学学习笔记——数据整理_第2页
心理统计学学习笔记——数据整理_第3页
心理统计学学习笔记——数据整理_第4页
心理统计学学习笔记——数据整理_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、心理统计学学习笔记第二章数据整理第二章数据整理&1. 数据种类一间断变量与连续变量eg: 人数 间断二四种量表。1称名量表 。 Eg:307 室,学好,电话好吗不能进行数学运算(也包括不能大小比较)2顺序量表。 Eg: 名次。能力大小,不能运算3等距量表。可以运算(做加减法),不能乘除要求:没有绝对0年龄有绝对0时间(年代,日历。)位移无绝对0,可能有相对0,即有正负4等比量表。可做乘除法。要有绝对零。成绩中的, 0 分不是绝对0(因为并不说明此人一窍不通)分数代表的意义。Eg:010 分与 90100 分。每一分的“距离”不一样因为严格来说,成绩是顺序量表。但为了实际运用中的各种统计

2、,把它作为等距量表&2. 次数分布表一简单次数分布表eg:组别次数(人次)1002909958089147079156069760 分以下31求全距R=Max Min( 连续变量 )(间断变量) R=MaxMin+12定组数K( 组数 ) 1.87(N 1) 。取整 N- 总数3定组距I=R/K 。一般,取奇数或 5 的倍数(此种更多)。4定各组限5求组值X=( 上限下限 )/2上限指最高值加或取10 的倍数等)6归类划记7登记次数例题:9996929090(I ) R=99-57+1=4387868483838282807978(II)K=1.87(50-1)。97878787777

3、77767676767575747473(III)I=R/K =43/95727272717171707069696867676765(iu)组别组值次数646262615795999729094923858987280848267579771470747211656967760646245559571总和50二相对(比值)次数分布表。累积次数分布表相对(比值)累积次数:累积次数值/总数 N注:一般避免不等距组(“以上”“以下”称为开口组)相对次数累积次数(此处意为“每组上限以下的人次)”小于制“.0450.0648.0445.1243.2837.2223.1412.085.0211.00&a

4、mp;3. 次数分布图一直方图1标出横轴,纵轴(5: 3)标刻度2直方图的宽度(一个或半个组距)3编号,题目4必要时,顶端标数)图二次数多边图1画点,组距正中2连接各点3向下延伸到左右各自一个组距的中央最大值即y 轴最大值相对次数分布图,只需将纵坐标改为比率。(累积次数,累积百分比也同样改纵坐标即可)”S 形”曲线是正态分布图的累积次数分布图图心理统计学学习笔记第三章常用统计量数 作者: wtbtan转贴自:本站原创点击数: 53文章录入: wtbtan 第三章常用统计量数&1. 集中量一算术平均数公式算术平均数的优缺点。P3637算术平均数的特征。( X-# )=0离(均数)差 (X

5、-# )(X-# )取 #时,得最小值即:离差平方和是一最小值二几何平均数 g= 略long#g=1/N logXi根据按一定比例变化时,多用几何平均数eg:91 年9293949596121011998%求平均增长率xg=加权平均数甲: 600 人#=70 分乙: 100 人#=80 分加权平均数:=(70*600+80*100)/(600+100)(总平均数 )eg:600 人, 100 人简单平均数:( 70 80 )/2三中(位)数。(Md)1.原始数据计算法分:奇、偶。2频数分布表计算法(不要求)3优点,缺点,适用情况(p42)四众数( o)1理论众数粗略众数2计算方法: Mo=3M

6、d-2#Mo=Lmo+fa/(fa+fb)*I计算不要求3优缺点平均数,中位数,众数三者关系。&2. 差异量数一全距R=Max-Min二平均差( MD 或 AD )MD= |x -#(或 Md)|/N三方差总体方差的估计值S2 = (X #)2反编样本的方差: 2 x 有编N 很小时,用S2 估计总体N>30 时,用 S2 或 2 x 都可以计算方法: 2 x x2 /N ( X/N) 2标准差 x 2 x2/1四差异系数(CV )CV= x/# *100%CV 5%,35%3 个用途五偏态量与锋态量(SK)1.偏态量: sk=(#- Mo)/ x动差(一级 四级)a3= (x-

7、#)3 、 / N/ x3三级动差计算偏态系数)2峰态量:高狭峰a4>0 (a4=0 正态峰 )低调峰。 A4<0用四级动差a4=(X - #)4/N/ x4 3&3. 地位量数一百分位数eg:P30=60( 分) “ 60 分以下的还有30%的人 ”二百分等级30 60(在 30的人的位置上,相应分数为60)So Md心理统计学学习笔记第四章概率与分布 作者: wtbtan转贴自:本站原创点击数: 43文章录入: wtbtan 第四章概率与分布&1 概率一概率的定义W(A)=m/n ( 频率 / 相对频数 )后验概率:P(A)=lim m/n先验概率:不用做试验的

8、二概率的性质和运算1性质: o P1p=1必然可能事件p=0不可能事件2加法。P(a+b)=P(a)+P(b)“或”:两互不相克事件和。推广: “有限个 ” P(A1+A2+An)=P(A1)+P(A2)+P(An)eg:( 1) A= 出现点数不超过4(x4)P(A)=P(x=1)+P(x=2)+P(x=3)+P(x=4)=1/6+1/6=4/6=2/3(2)完全凭猜测做判断题, (共 2 道),做对 1 题的概率为:A=T.TiB=F.Ti C=T.FiD=F.FiP=P(B)+P(C)=1/4+1/4=0.53.乘法:P(A1,A2An)=P(A1),P(A2)P(An)Eg:(1) 四

9、选 1。(十道)完全凭猜测得满分得概率:(1/4)*(1/4)*(1/4)=1/410&2. 二项分布一二项分布P(x)=Cnxpxgn-x做对的概率px :做错的概率gn-x : X: 对的数量pxgn-x 每一种分情况的概率。一种情况:pxgn-x再乘上系数。Eg: 产品合格率为90取 n=3(个)TTT 的情况90 * 90*90=P30.729TFT90*0.10*90=P2g10.081两个合格的情况TTFFTT其概率C32P2g1=3p2g1.Cn0P0gn+CnP1gn-1+CnPng0=1注:二项分布可能的结果只有两种。F 0r T合格Or不合格选对Or选错例:( 1)

10、10 道是非题,凭猜测答对5, 6,7,8, 9, 10 题的概率?至少答对5 题的概率?P(x=5) C510P5g5=C510(1/2)51/2)5=.24609P(x=6)=C610P6g4=C610(1/2)6(1/2)4=.20508P(x=7)=C710P7g3=C710(1/2)7(1/2)3=.11719=.04395=.00977+P(x=10)=C1010P10g0=(1/2)10=.000098至少答对5 题: P(X 5) = 0.62306(2)四选一,猜中8, 9, 10 题的概率?P(x=8)=C819P8g2=C819(1/4)8(3/4)2=.0039二二项分

11、布图(P8485)三二项分布的平均数与标准差(前提np5且 ng5)平均数 M=np标准差 r=npg1/2&3. 正态分布一正态分布曲线二标准正态分布。 (P387 附表可查面积P)Z=(x- )/r (x: 原始分数 )标准分数(有正有负) Z=0三正态分布表的使用查表P(0Z1)=0.34134 Z 的范围中的人数比例(百分数)P(0 Z 1.645)=0500.41.64 .44950=0.451.65 .45053=0.45之上,标准分数高于2 个标准差,则非常聪明。Eg:1. =70(分 )10P(70 x 80)=p(o z 1)P(60 x 70)=P(-1 z 0)2

12、. P(0 z 1)=P( x +)P(-1 z 0)=P(- x)图(略)例:某地区高考,物理成绩 57。 08(分) 18。 04(分)总共 47000 人。(1)成绩在 90 分以上多少人?( 2)成绩在( 80,90)多少人?( 3)成绩在 60 分以下多少人?解 : XN(57.08,18.042) 参数( , 2)Normal 表示符合正态分布令 Z= (x-57.08)/18.04 ) ,则 ZN(0,12) 标准分数平均数一定为0,标准差一定为1。( 1) Z1=(90 57。08)/18.04=1.82 P(Z>1.82)=.0344N1=np=47000*0.0344

13、=1616( 人 )(2)Zz=(80-57.08)/18.04=1.27P(1.27<Z<1,82)=.46562-.39796=0.677N2=NP=3177( 人)( 3) Z3=(60-57.08)/18.04=0.16 P(Z<0.16)=.56356N3=26487( 人 )四正态分布的应用T=KZ+CTN(C,K2)IQ=15Z+100IQ=100一般IQ 130 超常(30=2x*15)IQ<70弱智70 几 bndenlineeg:1.某市参加一考试2800 人,录取150 人,平均分数75 分,标准差为8。问录取分数定为多少分?解:XN(75.82)

14、Z=(x- #)/ x=(x-15)/8 N(0,12)P=150/2800=0.0530.5-0.053=0.447Z=1.615X=1.615*8+75 88(分)2某高考,平均500 分,标准差100 分,一考生650 分,设当年录取10,问该生是否到录取分?解:Zo=(650-500)/100=1.5(X N(500,1002)(Z N(0,12)Po=0.5-0.43319=0.06681=6.681%<10%所以可录取。心理统计学学习笔记第五章抽样分布(概率P) 作者: wtbtan转贴自:本站原创点击数: 49文章录入: wtbtan 第五章抽样分布(概率P)&1.

15、 抽样方法一 简单随机抽样二 等距抽样三 分层抽样四 整群抽样五 有意抽样&2. 抽样分布( 1)(2)(3)(4)(5)2025303540(1) 2022.52527.530(2)22.52527.53032.5(3)2527.53032.535(4)27.53032.53537.5(5)3032.53537.540总体分布图抽样分布图一平均数E(#)= 二。标准差,方差。 x= /n1/2 #2= 2/n&3. 样本均值( #)的抽样分布一总体方差 2 已知时,的抽样分布1正态总体, 2已知时,的抽样分布设( X1,X2,Xn)为抽自正态总体XN( , 2 )的一个简单随

16、机样本,则其样本均值也是一个正态分布的随机变量,且有:E(#)= , x2= 2 /n即 N( , 2 /n)Z=(#- ) /n1/2Eg: 一次测验, =100 5从该总体中抽样一个容量为25 的简单随机样本,求这一样本均值间于99 到 101 的概率?解:已知 X N(100,52)n=25.则 N(100,12)Z=(#-100)/1 N(0,1)当#=99 时, Z=-1当#=101 时, Z=1所以 P(99 # 101)=P(-1 Z 1)=.682682.非正态总体, 2已知时, #的抽样分布设( X1,X2,Xn)是抽自非正态总体的一个简单1 随机样本。当n 30时,其样本均

17、值接近正态分布,且有:E(#)= , x2= 2 /n即 # N(, 2 /n)若是小样本,题目无解。Eg(1)一种灯具,平均寿命5000 小时,标准差为400 小时(无限总体)从产品中抽取100 盏灯,问它们的平均寿命不低于4900 小时的概率。解:已知: 5000,400, n=100>30 是大样本所以近似正态分布 N(5000,402)当 4900 时, Z=(4900-5000)/400/1001/2=-2.5P(# 4900)=P(Z-2.5)=0.993793.有限总体的修正系数(引出)( 2)同上题,从2000(有限总体)盏中不放回地抽取100 盏,问。(概念)设总体是有

18、限的总体,其均值为 ,方差为 2(X1,X2Xn )是以不放回形式从该总体抽取的一个简单随机样本。则样本均值的数学期望(E(#) )与方差为E(#)= #=和 2( N-n ) /(N- 1)*(2/n)N 时,修正系数不计。 (N-n) /(N- 1)*(2/n)1/2.n/N 0.05%,要用修正系数如题( 2), n/N 0.05 所以要用修正系数所以解题2: x2 ( N-n )/(N-1) *(2/n) 2000100 )/2000-1=4002/100=1520 #=15201/2 =38.987 Z=(4900-5000)/38.987= -2.565P(Z-2.565)=.99

19、49二总体方差 2 未知时,样本均值的抽样分布。用 S2(总体方差的估计值)代替2t=(x- )/s/n1/2 tn-1 dp(自由度 )=n-1设( X1,X 2,Xn)为抽自正态总体的一个容量为n 的简单随机样本,即t=(x- )/s/n1/2符合自由度为n-1 的 t 分布当总体为非正态分布,且2 未知。则样本小:无解大:接近七分布t t=(x- )/s/n1/2 tn-1Z t=(x- )/s/n1/2 N(0,1)(也可用 Z)总体均值为80,非正态分布, 方差未知, 从该总体中抽一容量为64 的样本, 得 S=2,问样本均值大于80.5 得概率是多少?解:因为64>30是大样

20、本P(#>80.5)=P(t>(x- )/s/n1/2 )=P(t>2) df=63 P 0.025若用 Z ,P(Z>z) 0.02275(若 N24,总体正态,则Z 分布 1 不能用,只能用七分布)非正态总体:小样本无解大样本 Z (x- )/ /n1/22 已知正态总体Z= (x- )/ /n1/2非正态总体:小样本无解 2未知:大样本 t (x- )/ /n1/2Z正态总体:小样本t=(x- )/ /n1/2大样本 Z t=(x- )/ /n1/2&3. 两个样本均值之差(#1-#2)的抽样分布若 1 是独立地抽自总体X1 N(1, 2)的一个容量为n,

21、的简单随机样本的均值;是。X2 N(2, 22的)。n2.的。则两样本均值之差(#1 #2)N(1-2, 12/n1, 22/n2)复杂计算一种钢丝的拉强度,服从正态分布总体均值为80,总体标准差6,抽取容量为36 的简单随机样本,求样本均值79, 81 的概率XN(80,62)ZN(0,12)Z=(x- )/6/361/2=(x-8)/1x 79,8081Z -1,1 P=.68268若 不知。 S=b,则 X (80,2)用公式 t=(# - )/s/n1/2 tn-1=t35某种零件平均长度0.50cm,标准差 0.04cm, 从该总零件中随机抽16 个,问此 16 个零件的平均长度小于

22、0.49cm 的概率无解。抽 100 个,则概率?Z (x- )/ /n1/2 =(#-0.50)/0.004#<0.49P(Z<-0.01/0.004)=P(Z<-2.5)=.49379=从 500 件产品中不放回地抽25 件。25/500=0.05 要修正系数( N-n) /(N- 1) .95某校一教师采用一种他认为有效的方法,一年后,从该师班中随机抽取9 名学生的成绩,平均分84.5 分, S=3。而全年级总平均分为82 分,试问这9 名学生的 <84.5 分的概率为多大?# N(82, 2 )tt8t=(# - )/s/n1/2 =84.5-82)/3/3=2

23、.5df=80.975 P(t<2.5)说明方法有效( S=3 是 的估计值,两组数据都很整齐。图(略)&4. 有关样本方差的抽样分布一 f2 分布1f2 分布的密度函数f(x)=1/2n/2*r*n/2)* e-x/2*xn/2-1(x>0)f(x)=0(x 0)图(略)2.定理:设( X1,X2,X3Xn )为抽自正态总体X N( , 的2)一个容量为n 的简单随机样本,则 #= (X-#)2/n-1 为相互独立的随机变量,且 N(, 2 /n) (X-#)2 / 2(=n-1) S2 / 2 X2n-1(I=1,2,n)若抽自非正态总体:小样本无解大样本 X2(( n-1)S2 / 2二F分布1F 分布的密度函数f(x)= (n1+n2)/2/(n1/2)(n2/2) (n1/n2)(n1/n2*X)n1/2-1(1+n1/n2*X)-n1+n2/2(x 0)f(x)=0(x<0)2.定理设 (X1,X2,Xn)为抽自 X N( 1, 2的1)一个容量为n1 的简单 (y1,y

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论