把统计当成文科来背吧求你们看一下_第1页
把统计当成文科来背吧求你们看一下_第2页
把统计当成文科来背吧求你们看一下_第3页
把统计当成文科来背吧求你们看一下_第4页
把统计当成文科来背吧求你们看一下_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

把统计当成文科来背!!!一、 统计中的原理二、 几个重要概念三、 优缺点四、 使用条件、分类没有列举计算公式,自己背!没有列举假设检验区间估计,假设检验,方差分析适应条件,自己背!没有非参检验的使用条件,自己背!东拼拼西凑凑弄完了也分享大家看一下!、统计中的原理1推断统计的数学基础(概率)概率:表明随即时间出现可能性大小的客观指标。概率的定义包含以下两种,当观测次数够多时他们是相等的。后验概率:对随机事件进行n次观察,某一事件A出现的次数m与观测次数n的比值在n趋近无穷时所稳定在的常数p。先验概率:在满足试验可能结果数有限且每一种结果出现的可能性相等的条件下,随机事件包含的结果数除以结果总数。2抽样原理(随机性原则)抽样的基本原则是随机性原则,所谓随机性原则,是指在进行抽样时,总体中每一个个体是否被抽选的概率完全均等。由于随机抽样使每个个体有同等机会被抽取,因而有相当大的可能使样本保持和总体有相同的结构,或者说,具有最大的可能使总体的某些特征在样本中得以发现,从而保证由样本推论总体。3假设检验的原理(小概率原理)假设检验:统计学中的一种推论过程,通过样本统计量得出的差异作为一般性结论,判断总体参数之间是否存在差异。假设检验的实质是对可置信性的评价,是对一个不确定问题的决策过程,其结果在一定概率上正确的,而不是全部。(1) 两类假设对于任何一种研究而言,其结果无外乎有两种可能,即是否符合我们预期。一般来说证伪一件事情比证实一件事容易,在行为科学的研究中,由于我们无法了解总体中除样本以外的个体情况,因此尝试拒绝虚无假设的方法优于证明备择假设。备则假设:因变量的变化、差异却是是由于自变量的作用往往是我们对研究结果的预期,用H1表示。虚无假设:实际上什么也没有发生,我们所预计的改变、差异、处理效果都不存在观察到的差异只是随机误差在起作用,用H0表示。(2) 小概率原理小概率原理:小概率事件在一次试验中几乎是不可能发生的。至于什么就算小概率事件,那就是我们在计算前明确的决策标准,也就是显著性水平a。在检验过程中,我们假设虚无假设是真实的,同时计算出观测到的差异完全是由于随机误差所致的概率。之后将其与我们实现界定好的显著性水平比较,从而考虑是否依据小概率原理来拒绝虚无假设。(3)两类错误(信号检测论)I型错误:当虚无假设正确时,我们拒绝了它所犯的错误,也叫a错误。研究者得出了处理有效果的结论,而实际上并没有效果,即所谓“无中生有”。II型错误:当虚无假设是错误的时候,我们没有拒绝所犯的错误,也叫8错误。假设检验未能侦查到实际存在的处理效应,即所谓“失之交臂”。两类检验的关系:a+p不一定等于1在其他条件不变的情况下,a与。不可能同时减小或增大(4)检验的方向性单侧检验:强调某一方向的检验,显著性的百分等级为a双侧检验:只强调差异不强调方向性的检验,显著性百分等级为a/2对于同样的显著性标准,在某一方向上,单侧检验的临界区域要大于双侧检验,因此如果差异发生在该方向,单侧检验犯8错误的概率较小,我们也说它的检验效力更高。4方差分析的原理(方差的可加性原则)(1) 方差分析的概念方差分析的目的是推断多组资料的总体均数是否相同,也即检验多组数据之间的均数差异是否有统计意义。当我们用多个t检验来完成这一过程时,相当于从t分布中随机抽取多个t值,这样落在临界范围之外的可能大大增加,从而增加了1型错误的概率。我们可以把方差分析看作t检验的增强版。(2) 方差的可分解性方差分析依据的基本原理就是方差的可加性原则。作为一种统计方法,方差分析把实验数据的总变异分解为若干个不同来源的分量。数据的变异由两部分组成:组内变异:由于实验中一些希望加以控制的非实验因素和一些未被有效控制的未知因素造成的变异,如个体差异、随机误差。组内变异是具体某一个处理水平之内的,因此在对总体变异进行估计的时候不涉及研究的处理效应。组间差异:不仅包括组内变异的误差因素,还包括了是不同组所接受的实验处理不同造成的影响。如果研究数据的总变异是由处理效应造成的,那么组间变异在总变异中应该占较大比例。(3) 方差分析的基本假定(正太独立方差齐)(正赌气)样本必须来自正态分布的总体每次观察得到的几组数据必须彼此独立各实验处理内的方差应彼此无显著差异5线性回归的基本假设:线性关系假设:X,Y在总体上具有线性关系;正态性假设:Y服从正态分布;独立性假设:有两个意思:一个是某一个X对应的一组Y值和与另一个X对应的一组Y值之间没有关系,彼此独立;另一个就是,误差项独立,不同的X所产生的误差之间应相互独立,且与自变量也应独立;误差等分散性假设:特定X水平的误差,除了呈随机化的常态分布,其变异量也应相等,称为误差等分散性;6卡方检验的假设:(我排毒)(1) 分类相互排斥,互不包容;(2) 观测值相对独立;(3) 期望次数的大小:每个单元格中期望次数至少在5以上,分类中不超过20%的类别的理论次数可以小于5。单元格人数过少时处理方法:(1)单元格合并法(2)增加样本数(3)去除样本法(4)使用校正公式7假设检验与参数估计的联系与区别假设检验是当样本统计量超过一定标准时,就说统计显著,是检验两事物差异是否显著的一种方法;而参数估计是要找到总体值所可能落入的可靠范围,是利用样本统计量对总体参数所作的估计。而作为两者的代表性指标一一显著性水平和置信水平也是从不同角度回答了相同的问题。8协方差分析的性质在实验过程中,我们经常会遇到一些光靠实验操作难以控制额外变量的情况,如果这些变量与因变量之间存在共变关系,我们就可以运用协方差分析对数据进行统计控制。协方差分析本质上可以视为线性回归与方差分析的综合使用,即在原有的方差中减去那些与因变量呈线性关系的变量与因变量的协方差,从而消除这些额外变量的影响,以达完善实验的目的。9参数检验VS非参数检验参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。凡参数检验都有两个共同的前提:总体分布呈正态分布;若检验涉及两个总体,则两总体方差必须同质。但在实际研究中,研究人员也许对所研究的总体所知不多,一些前提假设也难以满足,这时就必须使用非参数检验。非参数检验即是一类不依赖于特定的总体分布,无须对总体参数作出规定的检验方法。两者差异有非参数检验对总体的分布情况要求低,也不要求对总体参数进行假设,因而适用面比参数检验广得多。就数据应用情况而言,参数检验通常情况下都用于等比或等距数据;而非参数检验更多用于顺序变量甚至称名变量上当等距或等比数据能够满足统计假设时,非参数检验检验虽然也可以用,但由于它只能从数据中提出一部分信息,相对参数检验方法会浪费很多信息,因而效度远不如参数检验法。另外,非参数检验还不能处理交互作用二、几个重要概念随机样本:即从总体中经随机抽取所得的样本抽样误差:以样本均值为例,则是样本均值X与总体均值目间的差异。其取值范围为:H±Z°05-SE052最大允许抽样误差是评价抽样结果精确度的一个指标,用d表示,通常为:d=1.96-SEx。|标准误:由于抽样研究中存在抽样误差,需要估计其大小,而所用的量SEx便是抽样分布的标准差,称为标准误,可用SE或。一表示。标准误越小,说明样本对总体的代X表性越好。同样以样本均值为例,bX便等于X与目间的标准距离。自由^^(Degreeoffreedom):用df或n’表示,是一组数据中可以独立自由变动的数目。(这个概念我们放到实验中来理解可能更清晰些,例如有一个实验要我们分配4名被试,那么我们在分配前3名被试时,他们的位置都可以是自由的,比如第一位被试可以放在1234任何一个位置上,但最后一名被试则是没得选择,只能放在最后那个位置,因此他是“不自由”的,于是自由度便等于n-1了。自由度的计算中,n是原有的样本容量,而减去的则是受限制的数目,此处乍看好像是最后一名被试受到限制了,但实际上是全体被试受到了可分配数目的限制,也就是说自由度总是受到一些参数或统计量的限制,涉及的参数或统计量越多,往往可以自由变动的数目,也就越少)中心极限定律b因为^广显由此可得以下定律:大数定律:样本容量n越大,标准误越小;总体方差越大,标准误就越大中心极限定律:对于任何均值为H,标准差为b的总体,样本容量为n的样本均值分布,会随着n趋近无穷大时趋近均值为H,标准差为"―的正态分布。方差分析因素:实验中的自变量称为“因素”水平|:某一个因素的不同处理情况称为因素的“水平”处理:包括量差和质别两种情况,按各个“水平”进行的重复实验称为实验的各种处理。统计功效与效果量统计功效|,亦即统计检验力,是指在假设检验中正确拒绝一个错误的虚无假设接受正确的杯子假设的概率,由于取伪错误的概率为。,故统计功效等于1书。统计功效大小取决于多种因素,如检验的类型、样本容量、a水平以及抽样误差的状况等。对统计功效进行分析应是以上诸因素结合在一起的分析。•通常影响统计检验力的因素有如下几种:样本大小n:样本小,检验力低;a大小:a越小,P错误越大,检验力越低;因变量误差变异的大小:标准差越大,标准误也就越大,达显著性水平时P也就越大,1-•通常影响统计检验力的因素有如下几种:样本大小n:样本小,检验力低;a大小:a越小,P错误越大,检验力越低;因变量误差变异的大小:标准差越大,标准误也就越大,达显著性水平时P也就越大,1-。就越小。方向:单侧检验的统计检验力要高于双侧检验提高信度可以提高统计检验力•置信区间的影响因素样本容量n:n越大,标准误越小,置信区间越窄;本质是因为样本量的增大,获得信息就越大,估计的越准确。置信水平a:置信水平越高,置信区间越宽。样本方差:样本数据变异性越大,对于相同置信度,所得置信区间越大。2效果量效果量是一个能测量自变量和因变量间关联强度的效果量数。常用的效果量数有如下几种:(1)d效果量d是一种比率,本质上等同于信号检测论中的d',计算公式为:独立样本:x -xd= 对照组S对照组相关样本:,、r2(2)pbr2Pb是点二列相关系数的平方,可以确定两独立样本实验的效果量也可以确定两相关样本实验的效果。计算公式都是一样的,不同的只是自由度计算,前者自由度为df=ni+n2-2;后者为df=D-1(D为对子数)。公式如下:(t)2r2=Pb (t)2+df以上两种效果量均运用于t检验。中门是一种相关量数,它可以表示两个变量之间的相关程度,无论是直线相关还是曲线相关。门系数的取值范围是[0.00,1.00],不存在负的曲线相关。n2是用来解释样本的自变量与因变量关联程度的描述统计量。方差分析中,n2的计算公式如下:SS门2=一组间SS总n2越大,说明自变量对因变量的影响效果也就越大。如果12很小,便说明即使假设检验统计上有显著性,也没有实际效果。°2是与12对应的总体参数,是解释总体的自变量与因变量关联程度的指标。以上三种效果量的临界定义)小中大d0.20.50.8r2pb0.010.0590.138120.060.16决定系数决定系数即相关系数的平方,是衡量回归有效性高低的指标,是回归平方和与总平方和的比值:SSt解释相关系数是否显著时,应谨记随着样本容量的增大,达到显著性的相关系数会越小;且即使相关系数是显著的,若决定系数不够大,用这一方程作预测的作用也不大。三、优缺点1算术平均数、方差、标准差•特点(平均数)在一组数据中每个变量与平均数之差的总和等于零:£(X-X)=0在一组数据中,每一个数都加上一个常数C,所得的平均数为原来的平均数加常数C:1/、一顼X.+C)=X+Cni在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来的平均数乘以常数C:1,、一顼X.-C)=X-Cni•特点(方差、标准差)每一个观测值都加一个相同的常数C之后,计算得到的标准差等于原来的标准差每一个观测值都乘以一个相同的常数C,所得到的标准差等于原标准差乘以这个常数优缺点(算术平均数、方差、标准差)优点:反应灵敏、计算严密、计算简单、简明易解、适合于进一步用代数方法验算、较少受抽样变动影响缺点:易受极端数据的影响、不能在出现模糊数据时计算2中数(自己切!!!)优点:计算简单、容易理解、不受极端值影响、能在有模糊数据情况下使用、可在顺序型数据时使用缺点:代表性低、不够灵敏、稳定性低、需要排序、不能进一步做代数运算3众数优点:能在数据不同质的情况使用,能避免极端值干扰缺点:不稳定、代表性差、不够灵敏、不能做进一步的代数运算3Md=Mo+2M3月12号是植树节,你要do一些事

平均数中数众数优点符合优良集中量的全部要求便于加权处理统计推断结果更可靠稳定符合优良集中量的2346条要求少受极端值影响1.符合优良集中量的第3条要求应用加权平均数离差、相关计算,进行统计推断等用于等距、等比数据数列中有极端数值时测量单位的性质不确定时上下端距离不确定时采用百分体制时用于顺序量表粗略估计时出现多峰分布时不足易受极端值影响组距不确定时无法计算易受抽样偏差影响不适合代数运算方差与标准差全距平均差优点感应灵敏严密确定适合代数法则处理受抽样变动影响小意义简明计算简单意义简明计算简单严密确定缺点原理难理解,计算复杂受极端值影响较大极易受极端值影响无法反映全部数据的差异情况易受极端值影响不适合代数运算应用反映数据离散程度进行推论统计和检验用于判断数据可否舍弃计算CV、Z和标准误使用价值很小少用4标准分数优点可比性一一不同性质的成绩,一经转换为标准分数,就可在同一背景下比较可加性一一不同性质的原始数据具有相同的参照点,因此可相加明确性一一知道了标准分数,利用分布寒暑表就能知道其百分等级稳定性一一转换成标准分数之后,规定了标准差为1,保证了不同性质分数在总分数中权重一样5正态分布当样本量足够大时,我们会发现生活中许多变量的分布都近似于正态曲线正态曲线的形状就像一口挂钟,呈对称分布,其均值、中数、众数相等大部分的原始分数都集中分布在均值附近,极端值相对而言比较少曲线两端向靠近横轴处不断延伸,但始终不会与横轴向交正态分布曲线转化为z分数后人以z分数与零点对应曲线下面积固定6良好估计量的标准:无偏性一一用多个样本的统计量估计总体参数的估计值,其偏差的平均数为零。有效性一一当总体参数的无偏估计不止一个统计量时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好。一致性一一当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数。充分性一一样本的统计量是否充分地反映了全部n个数据所反映总体的信息。统计检验总表(说不给我还是给了,自己背吧,这个不全哈哈哈)检验方法总体情况标准误检验值Z检验正态b2已知bSE-=~f0X yfnZ-^rrSEXt检验^2未知喝 SSE—XJn-1t-SE- X Z’检验非正态b2已知SE-—~f0X VnZ,-1且n330b2未知喝 SSE-—*XJn-1SEX使用条件、分类0根据变量性质的划分名称变量:如性别、颜色等,也称类目变量,若属性只有两种结果,亦称二分名称变量。其所属数据是计数数据,即各类属的数量。顺序变量:按事物的某一属性的大小或多少按顺序排列起来的数据,相邻两个等级的间隔是不等距的,只有等级上的差别,无单位又无绝对0点。等距变量:这类数据只有相等的单位,而无绝对0点,如测验分数、温度等。比率变量:又称等比变量,是一种既有相等单位,又有绝对零点的变量,如距离、时间、人的身高、体重等。后三种变量的数据都是用一定的测量工具或测量标准测量时所获得的数据,统称度量数据。1差异系数 W=土X100%两个或两个以上样本所使用的观测工具不同,所测的特质相同两个或两个以上样本使用的是同种观测工具,所测的特质相同,但样本间水平差异较大2标准分数比较不同测量单位时变量值的相对位置计算不同质的观测值得总合或平均值,以表示在团体中的相对位置异常值的取舍(通常在一个正态分布中,若一个数据的取值落在±3a之外,则在整理数据时可将此数据作为异常值舍弃)学习时需要记忆几个经典Z分数及其对应的百分比值:1S=34.14%;2S=47.72%;3S=49.875%;1.64S=45%;1.96S=47.5%;2.33S=49%;2.58S=49.5%3积差相关(皮尔逊相关)数据要成对出现,即若干个体中每个个体都有两种不同的观测值,并且每队数据与其它对子相互独立两列变量各自总体的分布都是正态的,至少接近正态两个相关的变量是连续变量,也即两列数据都是测量数据两列变量之间的关系应是直线性的4等级相关(Spearman相关)当研究考察的变量为顺序型数据时,若原始数据为等比货等距,则先转化为顺序型数据当研究考察的变量为非线性数据时5肯德尔相关w系数也叫肯德尔和谐系数,原始数据资料的获得一般采用等级评定法,即让K个被试对N件实物进行等级评定。其原理是评价者评价的一致性除以最大变异可能性。U系数其与肯德尔W系数所处理的问题相同,但评价者采用对偶比较法,即将N件事物两两配对分别进行比较。6点二列相关与二列相关点二列相关适用于一列数据为等距正态变量,另一列为离散型二分变量。二列相关 适用于两列变量都是正态等距变量,但其中一列变量被人为地分成两类。(二分变量是否为正态分布,总的原则是,如果不是十分明确,观测数据的分布形态是否为正态分布,这是不管观测数据代表的是一个真正的二分变量还是基于正态分布的人为的二分变量,都用点二列相关;当确认数据分布形态为正态分布,都应选用二列相关)适用于两个变量都是只有两个点值或只表示某些质的属性。ad—bc—中侦(a+b)(a+c)(b+d)(c+d)7正态分布(P-Z-O转换表)依据z分数求概率,即已知标准分数求面积。从概率求Z分数,即从面积求标准分数值。已知概率或Z值,求概率密度,即正态曲线的高。8卡方检验y(f-f)2X2=y o e f 其中fo为观察次数;fe为理论期望次数公式的适用范围要求观察彼此之间独立,并且单位格的理论期望次数不能小于5(小于5时可与相邻的组合并)拟合度检验X2匹配度检验是用样本数据来检验总体分布的形状或比率,以确定与假设的总体性质的匹配度。df=C-1其中C为分类数独立性检验X2独立性检验帮助我们考察多种因素的不同分类之间是否独立。它是检验行和列两个变量彼此有无关联的一种统计方法,适用于命名型变量和顺序型变量。同质性检验用来检验不同人群母总体在某一个变量的反应是否有显著差异,同志是可以考虑合并数据的。9.事后检验由方差分析只能得到显著差异的结果,事后检验使我们能够比较各组,发现差异具体产生在什么地方。事后检验采用成对比较的方式,每次比较两个组的差异。这里我们只介绍常用的红丝带检验(HSD)而不是过气的内裤检验(N-K)。•HSD检验法I把要比较的各个平均数从小到大作等级排列II处理条件的数目上,自由度f查表得到相应显著性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论