版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本课内容包含统计回顾方差分析主成分分析和因子分析聚类分析判别分析典型相关分析对应分析列联表Logistic回归Poisson对数线性模型时间序列分析。。。。统计基本概念回顾随机性和规律性现实中的随机性和规律性从中学起,我们就知道自然科学的许多定律,例如物理中的牛顿三定律,物质不灭定律以及化学中的各种定律等等。但是在许多领域,很难用如此确定的公式或论述来描述一些现象。比如,人的寿命是很难预先确定的。一个吸烟、喝酒、不锻炼、而且一口长荤的人可能比一个很少得病、生活习惯良好的人活得长。因此,可以说,活得长短是有一定随机性的(randomness)。这种随机性可能和人的经历、基因、习惯等无数说不清的因素都有关系。现实中的随机性和规律性但是从总体来说,我国公民的平均年龄却是非常稳定的。而且女性的平均年龄也稳定地比男性高几年。这就是规律性。一个人可能活过这个平均年龄,也可能活不到这个年龄,这是随机的。但是总体来说,平均年龄的稳定性,却说明了随机之中有规律性。这种规律就是统计规律。概率和机会你可能经常听到概率(probability)这个名词。例如在天气预报中会提到降水概率。大家都明白,如果降水概率是百分之九十,那就很可能下雨;但如果是百分之十,就不大可能下雨。因此,从某种意义说来,概率描述了某件事情发生的机会。显然,这种概率不可能超过百分之百,也不可能少于百分之零。换言之,概率是在0和1之间的一个数,说明某事件发生的机会有多大。有些概率是无法精确推断的比如你对别人说你下一个周末去公园的概率是百分之八十。但你无法精确说出为什么是百分之八十而不是百分之八十四或百分之七十八。其实你想说的是你很可能去,但又没有完全肯定。实际上,到了周末,你或者去,或者不去;不可能有分身术把百分之八十的你放到公园,而其余的放在别处。有些概率是可以估计的比如掷骰子。只要没有人在骰子上做手脚,你得到6点的概率应该是六分之一。得到其他点的概率也是一样。得到6的概率或者机会是可以知道的,但掷骰子的结果还只可能是六个数目之一。这个已知的规律就反映了规律性,而得到哪个结果则反映了随机性。如果你掷1000次骰子,那么,大约有六分之一的可能会得到6;这也是随机性呈现有规律的一个体现。变量做任何事情都要有对象。比如一个班上注册的学生有200人,这是一个固定的数目,称为常数(constant)或者常量。但是,如果猜测今天这个班有多少人会来上课,那就没准了。这有随机性。可能有请病假或事假的,也可能有逃课的。这样,就要来上课的人数是个变量(variable)。另外对于某项政策同意与否的回答,也有“同意”、“不同意”或者“不知道”三种可能值;这也是变量,只不过不是数量而已。变量当变量按照随机规律所取的值是数量时该变量称为定量变量或数量变量(quantitativevariable);因为是随机的,也称为随机变量(randomvariable)。象性别,观点之类的取非数量值的变量就称为定性变量或属性变量或分类变量(qualitativevariable,categoricalvariable)。这些定性变量也可以由随机变量来描述,比如男性和女性的数目,同意某政策人数的比例等等。只有当变量用数量来描述时,才有可能建立数学模型,才可能使用计算机来分析。数据有了变量的概念,什么是数据呢?拿掷骰子来说,掷骰子会得到什么值,是个随机变量;而每次取得1至6点中任意点数的概率它在理论上都是六分之一(如果骰子公平)。这依赖于在掷骰子背后的理论或假定;而在实际掷骰子过程中,如果掷100次,会得到100个由1至6点组成的数字串;再掷100次,又得到一个数字串,和前一次的结果多半不一样。这些试验结果就是数据。所以说,数据是关于变量的观测值.通过数据可以验证有关的理论或假定(比如每一次得到每个点的概率是不是1/6等等)。对于顾客是否喜欢某种饮品的调查也类似,但这里不象掷骰子那样事先可以大致猜测顾客喜欢与否的概率。在问了1000人之后,可能有364人说喜欢,而480人说不喜欢,其余的人可能不回答,或说不知道,或从来没有喝过这种饮料。这些数目就是数据。当然,它仅仅反映了1000个被问到的人的观点;但这对于估计整个消费群体的观点还是有用的。统计和计算机现代生活越来越离不开计算机了。最早使用计算机的统计当然更离不开计算机了。事实上,最初的计算机仅仅是为科学计算而建造的。大型计算机的最早一批用户就包含统计。而现在统计仍然是进行数字计算最多的用户。计算机现在早已脱离了仅有计算功能的单一模式,而成为百姓生活的一部分。计算机的使用,也从过去必须学会计算机语言到只需要“傻瓜式”地点击鼠标。结果也从单纯的数字输出到包括漂亮的表格和图形的各种形式。统计软件统计软件的发展,也使得统计从统计学家的圈内游戏变成了大众的游戏。只要你输入你的数据,点几下鼠标,做一些选项,马上就得到令人惊叹的漂亮结果了。你可能会问,是否傻瓜式的统计软件使用可以代替统计课程了?当然不是。数据的整理和识别,方法的选用,计算机输出结果的理解都不象使用傻瓜相机那样简单可靠。统计软件有些诸如法律和医学方面的软件都有不少警告,不时提醒你去咨询专家。但统计软件则不那么负责。只要数据格式无误、方法不矛盾而且不用零作为除数就一定给你结果,而且没有任何警告。另外,统计软件输出的结果太多;即使是同样的方法,不同软件输出的内容还不一样;有时同样的内容名称也不一样。这就使得使用者大伤脑筋。即使是统计学家也不一定能解释所有的输出。因此,就应该特别留神,明白自己是在干什么。不要在得到一堆毫无意义的垃圾之后还沾沾自喜。统计软件统计软件的种类很多。有些功能齐全,有些价格便宜;有些容易操作,有些需要更多的实践才能掌握。还有些是专门的软件,只处理某一类统计问题。面对太多的选择往往给决策带来困难。这里介绍最常见的几种。统计软件SPSS:这是一个很受欢迎的统计软件;它容易操作,输出漂亮,功能齐全,价格合理。对于非统计工作者是很好的选择。Excel:它严格说来并不是统计软件,但作为数据表格软件,必然有一定统计计算功能。而且凡是有MicrosoftOffice的计算机,基本上都装有Excel。但要注意,有时在装Office时没有装数据分析的功能,那就必须装了才行。当然,画图功能是都具备的。对于简单分析,Excel还算方便,但随着问题的深入,Excel就不那么“傻瓜”,需要使用函数,甚至根本没有相应的方法了。多数专门一些的统计推断问题还需要其他专门的统计软件来处理。SAS:这是功能非常齐全的软件;尽管价格不菲,许多公司还是因为其功能众多和某些美国政府机构认可而使用。尽管现在已经尽量“傻瓜化”,仍然需要一定的训练才可以进入。对于基本统计课程则不那么方便。统计软件S-plus:这是统计学家喜爱的软件。不仅由于其功能齐全,而且由于其强大的编程功能,使得研究人员可以编制自己的程序来实现自己的理论和方法。它也在进行“傻瓜化”以争取顾客。但仍然以编程方便为顾客所青睐。R软件:这是一个免费的,由志愿者管理的软件。其编程语言与S-plus所基于的S语言一样,很方便。还有不断加入的各个方向统计学家编写的统计软件包。同时从网上可以不断更新和增加有关的软件包和程序。这是发展最快的软件,受到世界上统计师生的欢迎。是用户量增加最快的统计软件。对于一般非统计工作者来说,主要问题是它没有“傻瓜化”。统计软件Minitab:这个软件是很方便的功能强大而又齐全的软件,也已经“傻瓜化”,在我国用的不如SPSS与SAS那么普遍。Statistica:也是功能强大而齐全的“傻瓜化”的软件,在我国用的也不如SAS与SPSS那么普遍。Eviews:这是一个主要处理回归和时间序列的软件。GAUSS:这是一个很好用的统计软件,许多搞经济的喜欢它。主要也是编程功能强大。目前在我国使用的人不多。FORTRAN:这是应用于各个领域的历史很长的非常优秀的编程软件,功能强大,也有一定的统计软件包。计算速度比这里介绍的都快得多。但需要编程和编译。操作不那么容易。MATLAB:这也是应用于各个领域的以编程为主的软件,在工程上应用广泛。编程类似于S和R。但是统计方法不多。统计软件当然,还有其他的软件,没有必要一一罗列。其实,聪明的读者只要学会使用一种“傻瓜式”软件,使用其他的仅仅是举一反三之劳;最多看看帮助和说明即可。如果只有英文帮助,那还可以顺便提高你的英文阅读能力。想想看举出你所知道的统计应用例子。举出日常生活中随机性和规律性的例子。你使用过统计软件或者利用过其他软件中的统计功能吗?你有什么经验和体会?数据的收集二手数据每天翻开报纸或打开电视,就可以看到各种数据。比如高速公路通车里程、物价指数、股票行情、外汇牌价、犯罪率、房价、流行病的有关数据(确诊病例、疑似病例、死亡人数和出院人数等等);当然还有国家统计局定期发布的各种国家经济数据、海关发布的进出口贸易数据等等。从中可以选取对自己有用的信息。这些间接得到的数据都是二手数据。第一手数据获得第一手数据并不象得到二手数据那么轻松。某些在华的外资企业每年至少要花三四千万元来收集和分析数据。他们调查其产品目前在市场中的状况和地位并确定其竞争对手的态势;他们调查不同地区,不同阶层的民众对其产品的认知程度和购买意愿以改进产品或推出新品种争取新顾客;他们还收集各地方的经济交通等信息以决定如何保住现有市场和开发新市场。市场信息数据对企业是至关重要的。他们很舍得在这方面花钱。因为这是企业生存所必需的,绝不是可有可无的。观测数据和试验数据上面所说的数据是在自然的未被控制的条件下观测到的,称为观测数据(observationaldata)。而对于有些问题,比如在不同的医疗手段下某疾病的治疗结果有什么不同、不同的肥料和土壤条件下某农作物的产量有没有区别、用什么成分可以提高某物质变成超导体的温度等等。这种在人工干预和操作情况下收集的数据就称为试验数据(experimentaldata)。
总体和样本要想了解北京市民对建设北京交通设施是以包括轨道运输在内的公共交通工具为主还是以小汽车为主的观点,需要进行调查;调查对象是所有北京市民,调查目的是希望知道市民中对这个问题的不同看法各自占有的比例。显然,不可能去问所有的北京市民,而只能够问一部分;并且根据这一部分的观点来理解整个北京市民的总体观点。总体和样本这种情况下,称所有(每个)北京市民对这个问题的观点为一个总体(population),而调查时问到的那部分市民的观点为该总体的一个样本(sample)。当然,也有可能调查所有的人(比如人口普查),那叫做普查(census)。总体是包含所有要研究的个体(element)的集合。而样本是总体中选中的一部分。
随机样本在抽取样本时,如果总体中的每一个体都有同等机会被选到样本中,这种抽样称为简单随机抽样(simplerandomsampling),而这样得到的样本则称为随机样本(randomsample)。随机样本就北京交通问题的调查为例,在随机抽样的情况下,如果样本量(samplesize,也就是样本中个体的数目)在总体中的比例为1/5000,那么,无论在东城区或者在延庆县,无论在白领阶层还是蓝领阶层被问到的人的比例都应该大体是1/5000。也就是说,这种比例在总体的任何部分是大体不变的。方便样本在实践中,得到随机样本不容易。很多搞调查的人就采取简单的办法。还以北京的交通问题的调查为例。假定按照随机选出的电话号码进行调查。这样肯定节省时间和资源,但这样得到的就不是一个随机样本了。如果按照随机选择的数字(无论号码本上有没有)打电话,那很多电话是空号或单位电话;显然这种样本也不是随机样本,它称为方便样本(conveniencesample)。在调查中,即使选择对象的确是随机的,最理想的情况所得到的样本也只代表那些愿意回答问题人的观点所组成的总体;没有回答问题的人的观点永远不会被这种调查的样本所代表。方便样本这种不回答的问题是抽样调查特有的问题。在其他问题中,也有使用方便样本的情况。比如在肺癌研究中,人们往往看到吸烟和肺癌的关系的数据;这些数据并不是整个人群中采集的随机样本;它们可能只是医院中的病人记录中得到的。在杂志和报纸上也有问卷,但得到的只是拥有这份报刊,而且愿意回答的人的观点。误差
假定在某一职业人群中女性占的比例为60%。如果在这个人群中抽取一些随机样本,这些随机样本中女性的比例并不一定是刚好60%,可能稍微多些或稍微少些。这是很正常的,因为样本的特征不一定和总体完全一样。这种差异不是错误,而是必然会出现的抽样误差(samplingerror)。刚才提到在抽样调查中,一些人因为种种原因没有对调查作出反映(或回答),这种误差称为未响应误差(nonresponseerror)。而另有一些人因为各种原因回答时并没有真实反映他们的观点,这称为响应误差(responseerror)。和抽样误差不一样,未响应误差和响应误差都会影响对真实世界的了解;应该在设计调查方案时尽量避免。抽样调查的一些常用方法在抽样调查时,最理想的样本是前面提到的随机样本。但是由于实践起来不方便,在大规模调查时一般不用这种全部随机抽样的方式,而只是在局部采用随机抽样的方法。下面介绍几种抽样方法。这里没有深奥的理论;读者完全可以根据常识判断在什么情况下简单的随机样本不方便以及下面的每个方法有什么好处和缺陷。对于它们具体的设计、实施与数据分析,有许多专门的书籍,就不在这里赘述了。一些抽样方法1.分层抽样(stratifiedsampling)。这是先把要研究的总体按照某些性质分类(stratum),再在各类中分别抽取样本。在每类中调查的人数通常是按照这该类人的比例,但出于各种考虑,也可能不按照比例,也可能需要加权(加权就是在求若干项的和时,对各项乘以不同的系数,这些系数的和通常为1)。比如可以按照教育程度把要访问的人群分成几类;再在每一类中调查和该类成比例数目的人。这样就确保了每一类都有成比例的代表。一些抽样方法2.整群抽样(clustersampling)。这是先把总体划分成若干群(cluster),再(通常是随机地)从这些群中抽取几群;然后再在这些抽取的群中对个体进行抽样。比如,在某县进行调查,首先在所有村中选取若干村子,然后只对这些村子的人进行调查。显然,如果各村情况差异不大,这种抽样还是方便的。否则就会增大误差了。一些抽样方法3.多级抽样(multistagesampling)。在群体很大时,往往在抽取若干群之后,再在其中抽取若干子群,甚至再在子群中抽取子群,等等。最后只对最后选定的最下面一级进行调查。比如在全国调查时,先抽取省,再抽取市地,再抽取县区,再抽取乡、村直到户。在多级抽样中的每一级都可能采取各种抽样方法。因此,整个抽样计划可能比较复杂,也称为多级混和型抽样。一些抽样方法4.系统抽样(systematicsampling)。这是先把总体中的每个单元编号,然后随机选取其中之一作为抽样的开始点进行抽样。如果编号是随机选取的,则这和简单随机抽样是等价的。在选取开始点之后,通常从开始点开始按照编号进行所谓等距抽样;也就是说,如果开始点为5号,“距离”为10,则下面的调查对象为15号、25号等等。抽样方法的选择不能一概而论实际上每个抽样通常都可能是各种抽样方法的组合。既要考虑精确度,还要根据客观情况考虑方便性、可行性和经济性。不能一概而论。计算机中常用的数据形式数据是由一些变量和它们的观测值所组成。下面就是调查人们对某个问题观点的一个数据的方阵形式。其中有6个变量:观点(观测值为支持、反对和不知道三种)、教育程度(有高中低三种取值,用H、M、L表示)、月收入(取值为实际数字)、性别(取值有男女两个,用M和F表示)以及地区号(用数字1,2,3,4表示)等。该表一共有1364个观测值(问卷回答)。可以看出这些变量有定性(属性)变量,也有定量(数值)变量。按照这个数据的格式,每一列为一个变量的不同观测值;而每一行则称为一个观测值,它是个由数量值和属性值组成的向量,每一个值相应于一个变量。思考1.
举出一些观测数据和试验数据的例子。2.
举出简单随机样本的例子。3.
根据你的经验,举出总体和样本的一些具体例子。4.
举出调查抽样时可能发生的各种影响调查结果的问题,并且提出你认为可以减少或避免这些问题的建议。5.
根据你的直觉,本章提到的几种抽样方法的优缺点是什么?原因何在?6.
举出一些书报上发表的数据例子,并指出那些是变量,哪些是观测值。数据的描述如同给人画像一样直方图比如某个地区(地区1)学校高三男生的身高;有163个度量如何用图形来表示这个数据,使人们能够看出这个数据的大体分布或“形状”呢?一个办法就是画一个直方图(histogram)。盒型图比直方图简单一些的是盒形图(boxplot,又称箱图、箱线图、盒子图)。后面图的左边一个是根据地区1高三男生的身高数据所绘的盒形图;其右边的图代表另一个地区(地区2)的高三学生的身高茎叶图地区1高三男生身高数据的茎叶图
HEIGHTStem-and-LeafPlotFrequencyStem&Leaf9.0015.00122334417.0015.5566666777889999920.0016.0111222222333333344435.0016.5555566666666777778888888888899999925.0017.000000001111222223333334424.0017.55566667777777777788889913.0018.011111112233311.0018.556677888994.0019.23332.0019.563.00Extremes(>=198)Stemwidth:10.00Eachleaf:1case(s)散点图往往人们得到的数据有两个变量的,比如美国男士和女士初婚年限的数据。该数据描述了自1900年到1998年男女第一次结婚延续的时间的中位数。当然,不可能将所有人的婚姻年限都给出来。所以,每年就取了一个中间的值(中位数)作为代表。自1900到1960年是每十年一个值,以后到1990是每五年取一个数,1995年以后是每年一个数。这里的一个变量为记录年份,另一个是结婚时间长短。由于分男士和女士,因此有两二维数据。这时可以以一个变量为横坐标(如年份),另一个为纵坐标(这里是结婚年限)来点图。这种图称为散点图(scatterplot)。还可以看出在二十世纪六十年代婚姻年限降低,而后来又升高。而男子的年限平均比女性长。这个图是用SPSS画的。
定性变量的点图定性变量(或属性变量,分类变量)不能点出直方图、散点图或茎叶图,但可以描绘出它们各类的比例。下面用SPSS绘的图表示了说世界各种主要语言的人数的比例
饼图条形图汇总统计量或概括统计量(summarystatistic)汇总统计量(位置)均值(mean)中位数(median)(第一,第三)四分位数(点)(firstquantile,thirdquantile)k-百分位数(k-percentile)众数(mode)汇总统计量(尺度)
(scalestatistic)极差(range)四分位间距(四分位极差)(interquantilerange)
标准差(standarddeviation)
方差(variance)
两个尺度不同的数据的直方图,左边的标准差大约只有右边的一半
数据的标准得分
(standardscore)
两个水平类似的班级(一班和二班)上同一门课,但是由于两个任课老师的评分标准不同,使得两个班成绩的均值和标准差都不一样(数据:grade.sav)。一班分数的均值和标准差分别为78.53和9.43,而二班的均值和标准差分别为70.19和7.00。那么得到90分的一班的张颖是不是比得到82分的二班的刘疏成绩更好呢?怎么比较才能合理呢?虽然这种均值和标准差不同的数据不能够直接比较,但是可以把它们进行标准化,然后再比较标准化后的数据。一个标准化的方法是把原始观测值(亦称得分,score)和均值之差除以标准差;得到的度量称为标准得分(standardscore)。思考1.
根据你的经验,给出定性和定量变量的例子。2.
对于问题1中你的例子,试图画出各种描述性图形并计算汇总统计量。3.
举例说明众数、中位数和均值的优缺点。4.
举例说明尺度统计量说明了数据的什么特性。5.
标准得分实际上是对原始数据的一种标准化。试举出标准得分的用处。统计推断从数据得到对现实世界的结论的过程估计总体它代表我们所关心的那部分现实世界。而在利用样本中的信息来对总体进行推断之前人们一般对代表总体的变量假定了分布族。比如假定人们的身高属于正态分布族;对抽样调查假定了二项分布族等等。这些模型基本上是根据经验来假定的,所以仅仅是对现实世界的一个近似。在假定了总体分布族之后,进一步对总体的认识就是要在这个分布族中选择一个适合于我们问题的分布;由于分布族成员是由参数确定的,如果参数能够估计,对总体的具体分布就知道得差不多了。估计一种是点估计(pointestimation),也就是用估计量的实现值来近似相应的总体参数。另一种是区间估计(intervalestimation);它是包括估计量在内(有时是以估计量为中心)的一个区间;该区间被认为很可能包含总体参数。点估计给出一个数字,用起来很方便;而区间估计给出一个区间,说起来留有余地;不象点估计那么绝对。无偏估计(大样本性质)区间估计的置信度(大样本性质)估计
注意置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。如果给出被调查的人数,则内行可以由推算出置信度(由后面给出的公式),反之亦然。一个描述性例子
一个有10000个人回答的调查显示,同意某种观点的人的比例为70%(有7000人同意),可以算出总体中同意该观点的比例的95%置信区间为(0.691,0.709);另一个调查声称有70%的比例反对该种观点,还说总体中反对该观点的置信区间也是(0.691,0.709)。到底相信谁呢?实际上,第二个调查隐瞒了置信度(等价于隐瞒了样本量)。如果第二个调查仅仅调查了50个人,有35个人反对该观点。根据后面的公式可以算出,第二个调查的置信区间的置信度仅有11%。假设检验在假设检验中,一般要设立一个原假设;而设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出假设和现实的矛盾,从而否定这个假设。在多数统计教科书中(除了理论探讨之外)的假设检验都是以否定原假设为目标。如果否定不了,那就说明证据不足,无法否定原假设。但这不能说明原假设正确。很多教科书在这个问题上不适当地用“接受原假设”的说法,犯了明显的低级逻辑错误。假设检验的过程和逻辑首先要提出一个原假设,比如某正态总体的均值等于5(m=5)。这种原假设也称为零假设(nullhypothesis),记为H0。与此同时必须提出对立假设,比如总体均值大于5(m>5)。对立假设又称为备选假设或备择假设(alternativehypothesis)记为记为H1或Ha。假设检验的过程和逻辑根据零假设(不是备选假设!),我们可以得到该检验统计量的分布;然后再看这个统计量的数据实现值(realization)属不属于小概率事件。也就是说把数据代入检验统计量,看其值是否落入零假设下的小概率范畴;如果的确是小概率事件,那么我们就有可能拒绝零假设,否则我们说没有足够证据拒绝零假设。假设检验的过程和逻辑注意:零假设和备选假设在假设检验中并不对称。因检验统计量的分布是从零假设导出的,因此,如果发生矛盾,当然就对零假设不利了。不发生矛盾也不说明备选假设有问题(因为和备选假设无关)。假设检验的过程和逻辑检验统计量在零假设下等于这个样本的数据实现值或更加极端值的概率称为p-值(p-value)。显然得到很小p-值意味着小概率事件发生了。如果小概率事件发生,是相信零假设,还是相信数据呢?当然是相信数据。于是就拒绝零假设。但小概率并不能说明不会发生,仅仅发生的概率很小罢了。拒绝正确零假设的错误常被称为第一类错误(typeIerror)。假设检验的过程和逻辑有第一类错误,就有第二类错误;那是备选零假设正确时反而说零假设正确的错误,称为第二类错误(typeIIerror)。零假设和备选假设哪一个正确,这是确定性的,没有概率可言。而可能犯错误的是人。涉及假设检验的犯错误的概率就是犯第一类错误的概率和犯第二类错误的概率。负责的态度是无论做出什么决策,都应该给出犯错误的概率。假设检验的过程和逻辑到底p-值是多小才能够拒绝零假设呢?也就是说,需要有什么是小概率的标准。这要看具体应用的需要。但在一般的统计书和软件中,使用最多的标准是在零假设下(或零假设正确时)抽样所得的数据拒绝零假设的概率应小于0.05(也可能是0.01,0.005,0.001等等)。这种事先规定的概率称为显著性水平(significancelevel),用字母a来表示。当p-值小于或等于a时,就拒绝零假设。所以,a是所允许的犯第一类错误概率的最大值。当p-值小于或等于a时,我们说这个检验是显著的(significant)。假设检验的过程和逻辑归纳起来,假设检验的逻辑步骤为:第一,写出零假设和备选假设;第二,确定检验统计量;第三,确定显著性水平a;第四,根据数据计算检验统计量的实现值;第五,根据这个实现值计算p-值;第六,进行判断:如果p-值小于或等于a,就拒绝零假设,这时犯错误的概率最多为a;如果p-值大于a,就不拒绝零假设,因为证据不足。假设检验的过程和逻辑实际上,计算机软件仅仅给出p-值,而不给出a。这有很多方便之处。比如a=0.05,而假定我们得到的p-值等于0.001。这时我们如果如果采用p-值作为新的显著性水平,即a=0.001,于是可以说,我们拒绝零假设,显著性水平为0.001。拒绝零假设时犯错误的概率实际只是千分之一而不是百分之五。在这个意义上,p-值又称为观测的显著性水平(observedsignificantlevel)。在统计软件输出p-值的位置,有的用“p-value”,有的用significant的缩写“Sig”就是这个道理。假设检验的过程和逻辑展示结果的精确性(根据数据减少a的值)总是没有害处的。这好比一个身高180厘米的男生,可能愿意被认为高于或等于180厘米,而不愿意说他高于或等于155厘米,虽然这第二种说法数学上没有丝毫错误。假设检验的过程和逻辑关于“临界值”的注:作为概率的显著性水平a实际上相应于一个检验统计量取值范围的一个临界值(criticalvalue),它定义为,统计量取该值或更极端的值的概率等于a。也就是说,“统计量的实现值比临界值更极端”等价于“p-值小于a”。使用临界值的概念进行的检验不计算p-值。只比较统计量的取值和临界值的大小。使用临界值而不是p-值来判断拒绝与否是前计算机时代的产物。当时计算p-值不易,只有采用临界值的概念。但从给定的a求临界值同样也不容易,好在习惯上仅仅在教科书中列出相应于特定分布的几个有限的a临界值(比如a=0.05,a=0.025,a=0.01,a=0.005,a=0.001等等),或者根据分布表反过来查临界值(很不方便也很粗糙)。现在计算机软件都不给出a和临界值,但都给出p-值和统计量实现值,让用户自己决定显著性水平是多少。
假设检验的例子汽车厂商声称其发动机排放标准的一个指标平均低于20个单位。在抽查了10台发动机之后,得到下面的排放数据:17.0、21.7、17.9、22.9、20.7、22.4、17.3、21.8、24.2、25.4。该样本均值为21.13。究竟能否由此认为该指标均值超过20?这次我们的假设检验问题就是假设检验的例子检验统计量为我们可以发现p-值为0.1243,因此,我们没有证据否定零假设。旅游企业员工的心理保健在深圳市宝安区龙华街道富士康公司,一名24岁河南籍女子从8楼楼顶跳下,当场身亡。据称,此女子是富士康集团的一名员工,该公司是从事电脑、通讯、电子等高新科技的一家大型企业。自今年1月份以来,富士康公司已经接连发生多起员工跳楼事件。
引例:富士康员工跳楼事件富士康员工跳楼事件心理分析一是年轻员工抗压能力差、心理脆弱。二是密集型工作磨损心理。三是统一管理缺乏心灵关怀。
大学生心理健康问题目前大学生自杀的事情时有发生,大学生承受的压力越来越大,也让社会对于大学生的心理健康问题尤为关注。大学生从某种意义上说就像一个“产品”,不能在最后发现不合格,大家就责备大学教育不好,其实很可能在培养过程中就已经出了问题。“几乎在各年级段的大学生中,都发现部分群体存在值得关注的心理异常问题,且心理异常学生检出比例有逐年上升趋势。”上述结论来自对南京大学等25所江苏省高校大学生心理健康状况的一项调研报告。在此次调查过程中,据各校心理普查和日常心理咨询记录提供的资料,心理异常学生检出的比例,虽然差异很大,但平均达到5%~7%,有些学校高达14%以上。参与此次调研的苏州大学苏南地区大学生心理健康教育研究中心副主任王静,近日接受记者采访时表示,这些心理健康问题以学习、适应、人际关系、恋爱与性、挫折应对、毕业择业等发展性问题为主,强迫症、焦虑症、抑郁症、成瘾、物质依赖、神经症等障碍性问题次之。心理疾病(10%)
心理问题(20%)心理健康(70%)
一种动态的调适过程
0(5%)抑郁100(5%)(10%)(10%)(70%)心理健康的基本界定心理健康反应轴躁狂神经症大脑神经系统发生的语言、行为等病变;如:神经衰弱、癔症、强迫症、恐怖症等;人格障碍感知、气质、性格、能力等异常变态;如:偏执、敏感、焦虑、癫痫、混合等;心身疾病由心理因素引发的长期不愈的周期性病变;如:脑中毒、脑代谢障碍、溃疡、疼痛、慢性病等;精神病感情刺激及情感调适不当造成的偏执性病变;如:精神分裂症、躁狂症、抑郁症、更年期忧郁症等;心理疾病的表现形式(10%)
亚健康状态(生理、心理不适反应)
工作倦怠感(认识能力、工作满意度受损)
慢性疲劳综合症(肌体、器官病变)
焦虑状态(情感、行为过度反应)心理问题的表现形式(20%)亚健康------身心的一种临界状态心血管症状口腔及呼吸、消化系统症状皮肤、骨关节症状神经系统、精神心理及睡眠症状泌尿生殖及性功能系统症状免疫系统症状情绪、意志、个性及人际交往等症状眼疾病、手机腕、键盘肘、屏幕脸、骨痛群、怒车族轻度抑郁症----工作、生活倦怠感的产物表现为比较恐惧、幻觉、爱钻牛角尖、自卑、烦躁、健忘、易怒、逆反、悲观、怨天尤人。戴安娜、崔永元、金喜善、张国荣皆属于此类(抑郁症有时称为贵族病)无兴趣、无动力、无情感、无目的过劳死-----长期慢性疲劳过度所致头痛、眩晕、恶心、乏力、注意力不集中等症状频现,最终导致突发性疾病。多发在公安、新闻、IT界、文化演艺、企业、科教界、国家公务员等行业;根据国家科研部门统计:知识分子平均寿命仅为58岁,比普通人平均寿命少10余岁。爱力信中国总裁杨迈、电影演员古月、画家陈逸飞等均属于过劳死;第二章旅游者的感知第一节员工的心理健康第二节心理障碍第三节员工心理健康的维护
旅游企业员工的心理保健
一、心理健康的概念健康是体格上、精神上、社会上的完全安逸状态,而不只是没有疾病、身体不适或不衰弱。-----“既没有身体上的疾病与缺陷,又有完整的生理、心理状态和社会适应能力”。(一)心理健康的概念1.世界卫生组织章程序言中1、心理学家和精神病学家们的标准直接的标准:是否具有对自身和社会产生直接伤害的行为表现;是否具有会造成个人内在心理伤害的消极情绪基本标准:
同等条件下大多数人的心理和行为的一般模式,即社会常模。心理健康的标准一、心理健康的概念“心理健康,是指人们对于环境以及人们相互之间具有最高效率及快乐的适应情况。不只是要有效率,也不只是要能有满足之感,或是能愉快地接受生活的变故,而要三者都具备。心理健康的人应能保持平静的情绪,有敏锐的智能,适合于社会环境的行为和愉快的气质。”2.心理学家麦灵格美国学者坎布斯(A.W.Combs)的观点坎布斯认为为一个心理健康、人格健全的人应有四种特质:1.积极的自我观;2.恰当地认同他人;3.面对和接受现实;4.主观经验丰富,可供取用马斯洛和密特尔曼认为人的心理是否健康有十条标准:1.是否有充分的安全感;2.是否对自己有较充分的了解,并能恰当地评价自己的能力;3.自己的生活理想和目标能否切合实际;4.能否与周围环境保持良好的接触;5.能否保持自身人格的完整与和谐;6.是否具备从经验中学习的能力;7.能否保持适当和良好的人际关系;8.能否适度地表达和控制自己的情绪;9.能否在集体允许的前提下,有限度地发挥自己的个性;10.能否在社会规范的范围内,适度地满足个人的基本需要。《旅游心理学>>第八章旅游企业员工的心理保健奥尔波特认为人的心理健康有七种标志:1.自我意识广延;2.良好的人际关系;3.情绪上的安全感;4.知觉客观;5.具有各种技能,并专注于工作;6.现实的自我形象;7.内在统一的人生观。适合我国人民特点的心理健康标准:1.了解自我,悦纳自我;2.接受他人,善与人处;3.正视现实,接受现实;4.热爱生活,乐于工作;5.能适当地表现情绪;6.人格完整和谐;7.心理行为符合年龄与性别特征;8.智力发展正常。根据前面的标准?您的是否健康?亚健康——华南农业大学注意:心理健康标准的相对性心理健康或正常的标准是随时代的变迁而变化的。文化背景不同,判断心理健康与否的标准也不同。心理健康标准还要考虑年龄、性别、社会身份、情境等各种因素。注意:心理健康水平是一个连续体,心理健康与心理病态或心理异常之间没有明确界限。
心理健康状态是动态的,一个心理健康的人并不意味着完全没有不健康的心理和行为。无论从外显的行为表现,还是从内在的情感体验上讲,心理障碍患者与我们正常人之间并没有质的不同。心理健康的标准具有相对性,心理健康与心理病态之间并没有鲜明的分野。心理健康水平是一个连续体,心理健康与心理病态或心理异常之间没有明确界限的概念是非常重要的。我国最新心理健康标准:健全的认知能力;适度的情感反应;坚强的意志品质;和谐的人格结构;良好的社会适应及人际关系;我国最新的心理健康标准一、心理健康的概念员工心理健康,就是企业员工有一种高效而满意的、持续的心理状态。主要体现在企业员工五大心理状态,职业压力感、职业倦怠感、职业方向感、组织归属感、人际亲和感都是积极均衡的。(二)员工心理健康1.自我诊断:工作压力知多少请你根据当前情况,对问题做出回答,并评分,然后计算分数:计分法:是,3分;不好说,1分;不是;-1分()单位对我的工作要求清晰,我知道应该做什么,怎么做()我知道自己的职责范围,目前完全胜任()我有合理的工作目标,基本能够达到()我的业绩能够得到反馈()我目前的工作内容比较丰富()我对职业发展路径比较明确()我的工作时间相对弹性()我的家庭和工作关系比较协调()我对目前的单位有明显的责任感()我现在的团队会给我及时的支持和协助如果你的分数大于16分,说明你目前的工作压力源较少,你会持有比较轻松的心态。如果你的分数10分(包括10分)和16分(包括16分)之间,说明你目前的工作压力源一般,你会有一定的压力感受;如果你的分数小于10分,说明你目前的工作压力源较多,你会有明显的压力感受。《旅游心理学>>第八章旅游企业员工的心理保健(一)职业压力感适度的“压力”过轻——使人过于放松,忽略了防范风险;可能使人长期回避责任。过重——对身体、心理、行为带来消极影响。(二)职业倦怠感定义
:职业倦怠就是在以人为服务对象的职业领域中,个体由于长期遭受到情绪和人际关系紧张源而产生的反应,主要表现为情感枯竭、去人性化和成就感降低等症状。
1.自我诊断:职业方向在哪里?下面10个问题,请你根据当前情况,对问题做出回答,并评分,然后计算分数:计分法:是,3分;不好说,1分;不是;-1分()我知道自己的工作目标是什么()我认为自己可以达到制定的工作目标()我可以在一个岗位上工作3年以上()我知道自己适合做什么工作()我对目前的工作很感兴趣()我正在全力以赴向工作目标努力()现在做的工作比较喜欢也很感兴趣()我对自己的工作目标有足够的信心()我在工作中能找到很多乐趣()我觉得认真工作在哪里都有发展如果你的分数大于16分,说明你目前的工作处于积极状态,职业方向感比较明晰。如果你的分数在10分(包括10分)和16分(包括16分)之间,说明你目前有自己的职业追求,但是还没有确定清晰的方向。如果你的分数小于10分,说明你目前的工作目标不明确,不知道自己想要什么.(三)职业方向感2、迷失职业方向感没有明确的立场和追求。导游?酒店?景区?3、找回自己的职业方向感——我能做什么?想做什么?还缺什么?——资源积累——理性理想很丰满,现实却很骨感。
(四)组织归属感
1、定义
:“组织归属感”又叫“组织承诺”、“组织忠诚”等。一般是指个体认同并参与一个组织的强度。它不同于个人与组织签订的工作任务和职业角色方面的合同,而是一种“心理合同”,或“心理契约”。
(四)组织归属感
2、员工组织归属感的影响因素(1)管理性因素(2)文化价值观(3)心理因素(4)个体因素(5)环境因素(五)人际亲和感
人际亲和的理论
1.本能论2.生存论3.需要层次理论4.人际需要的三维理论《旅游心理学>>第八章旅游企业员工的心理保健(一)对于个人而言意义重大三、员工心理健康的作用(二)对于企业而言意义重大(三)对于社会而言意义重大(一)个人原因四、引起员工心理健康原因(二)企业原因(三)社会历史原因心理障碍末年初可忙坏了职场人,而由于受年终总结、下年度工作变动、年终奖金等问题的困扰,很多职场人士都患上了心理疾病。有关数据也显示,每年11月至12月是抑郁症高发期,患者主要集中在20岁至50岁之间的人群。也就是说,我们这些奋斗在职场中的人正是抑郁症的高发群体。中华英才网的在2007年年底的对来自于IT、金融、制造业等15个行业的1500名企事业职员做的调查,结果显示有91.7%的人表示在新年来临之际感到焦虑。其中28.40%的人是因为“一年碌碌无为”而感到焦虑;还有26.70%的人认为“计划的目标没有实现”感到焦虑;其余有17.1%的人认为是因为过去一年工作不顺,担忧年龄的有14.5%,感到意外过多而焦虑的比例为11.8%。“碌碌无为”等焦虑的产生都与年初目标的设定有关。在受调查者年初制定的计划中,有高达45.6%的人将工作目标定为“薪水获得满意的提高”,往往高于“业绩获得提高”的21.3%,“做几件漂亮的事”的18.3%,以及“职位提高”的14.8%。有37.20%的职员表示,“自我要求及期待过高”使得自己在年终自评时对自己不满意;公司的企业管理是让他们产生焦虑的一个重要因素。其中,17.7%的白领认为“绩效考核不合理”是造成他们陷入焦虑的主要理由;有20.4%的人认为“公司效益不佳”让他们对未来一年自身前途产生担忧。引入案例一、心理障碍心理障碍的英文名称psychologicaldisorder。指一个人由于生理、心理或社会原因而导致的各种异常,在临床上,常采用“心理病理学”的概念,将范围广泛的心理异常或行为异常统称为“心理障碍”,或称为异常行为。心理障碍:指影响个体正常行为和活动效能的心理因素或心理状态。二、心理障碍的引发因素
(一)遗传因素(二)心理社会因素(三)机体状态三、判断有否心理障碍常用下述方法:(一)比较(二)心理活动性质的改变(三)社会适应标准(四)统计学标准自我判断一下吧!目前,职业心理障碍主要表现为:
抑郁、
焦虑、
疑病、
强迫、
恐怖、
神经衰弱、
癔症等。四、职业心理障碍问题
了解:1、神经衰弱
精神易兴奋和精神易疲劳二者相结合的各种症状情绪症状:易激惹、烦恼、情绪紧张心理生理症状:睡眠障碍和肌肉紧张性疼痛2、焦虑神经症
焦虑和烦恼以经常的、持续的、无确定对象或固定内容的紧张不安或对现实生活中某些问题过分担心或烦恼为特征。病人总的表现就是终日心烦意乱、忧心忡忡、坐立不安;致使注意力不易集中,对日常生活事物没有兴趣,严重干扰了其学习、工作和生活。运动不安是指病人焦虑时,常伴有坐立不安、来回踱步、紧张不安,甚至搓手顿足或感叹不已。自主神经功能亢进,如心悸、气促、胸痛、头痛或头晕、多汗、面色发红或苍白、口干、吞咽困难、胃部不适、恶心、呕吐、胀气、肠鸣、腹泻、呼吸困难或呼吸急促及尿频、尿急、阳痿、性感缺乏、月经时不适或无月经等症状,甚至有窒息感。引例李先生是一位年近三十的酒店员工,患有令人头疼的恐高症。他在两年前乘坐“晨风”号二等卧铺车前往东京出差,由于车颠簸得厉害,从卧铺的上层滚下来。当时他完全处于毫无防备的酣睡状态。没有想到,这一突然的打击对他造成了严重影响。从那以后,李先生开始惧怕高处,二层楼还可以勉强上去,但再往高处走,就会感到害怕。即便身处三楼一个大房间的中央,他也会觉得焦虑不安。家人都很奇怪,到底李先生怎么了?3、恐惧症指接触到特定事物或处境时具有的强烈的恐惧情绪,患者采取回避行为,并有焦虑症状和植物性神经功能障碍的一类心理学障碍。患者的恐怖与正常人的恐怖是不一样的,他们的恐惧是非理性的、耗费性的。形式:社交恐惧、学校恐怖症、动物恐怖症、境遇恐怖症等。“他特别怕脏”是什么病?尊敬的医生:我是一名高中学生,最近两年不知什么原因变得特别怕脏,总觉得周围都是细菌,甚至有时想到艾滋病。别人碰了我的衣服我就要马上脱下来,而且非要洗了才踏实。如果不得已用手摸了人家的东西,比如找的钱什么的,马上就得洗手,而且要洗二三十次,有时甚至洗1个小时。我家就住在离县城20多里的农村,家里也没那么干净,我也知道这样做没有必要,而且浪费好多学习时间,有时还怕别人看见笑话自己,可就是控制不住,心理特别痛苦,不知道这是怎么回事?有人说我患了“洁癖”症,是这样吗?一个痛苦的人4、强迫症强迫观念:患者会不自觉地一直想某种对心理上有伤害性的观念或思想。强迫行为:患者不能自觉控制自己一再重复的、没有任何实际适应意义的行为。强迫症的真正意义,在于通过不停地思考某些观念或实施某些行为,阻止自己去思考或实施某些自己感到羞耻和自责的事情,保护自己免受焦虑之苦。例子在心理门诊,一位年龄不过16岁,外表看不出有什么毛病的女子,在面对医生的时候,强调自己的鼻子长得不好看,是塌鼻子,眼睛也似乎一个大些一个小些,总之自觉五官长得不顺眼,甚至有些畸形。女子说自己也曾去五官科、整形科检查过,大夫也没说有什么问题,自己虽然当时同意大夫的观点,但不由自主,一照镜子就又觉得有问题了,所以特别难受,希望大夫再给一个肯定的答复,比如自己有问题没有……5、疑病症疑病症主要指本病患者担心或相信患有一种或多种严重躯体疾病的持久的先占观念,病人诉躯体症状,反复就医,虽然经反复医学检查和医生的解释没有相应疾病的证据也不能打消病人的顾虑,常伴有焦虑或抑郁。该病重点是预防,应学会以轻松愉快、自然平和的心情面对发生在自己身上的各种生理变化,认识它、接受它、适应它。补充:心理障碍的治疗(一)身体疗法休克疗法:以电击或药物使患者休克,使其产生强烈的身体痉挛和一时的意识丧失。药物疗法:抗精神病类药物、抗焦虑类药物和抗抑郁类药物精神外科手术(二)个体心理疗法1、精神分析疗法2、来谈者中心疗法3、团体心理疗法4、行为疗法包括积极强化、消退、厌恶条件作用、系统脱敏和模仿第三节员工心理健康的维护为缓解景区一线员工工作压力,培养员工积极健康的心理素质,2010年8月15
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 股权投资合同(模板)
- 2024劳动合同管理制度劳动合同管理制度规定
- 2024的车辆租赁合同范本模板
- 2024自费出国留学中介服务合同示范文本
- 2024年多媒体制作及外包服务合同
- 酒类专卖店加盟协议
- 2024购房合同变更委托书
- 员工短期聘用合同书2024年
- 2024标准房屋买卖协议
- 技术开发合同书-合同样本
- 【工商企业管理专业实操实训报告2600字(论文)】
- HJ 636-2012 水质 总氮的测定 碱性过硫酸钾消解紫外分光光度法
- 主播薪资核算方案
- 机电仪运维中心巡检工作提升方案
- 10以内口算题每页50道
- 大学生职业生涯规划与就业指导(高校学生学习职业生涯规划与就业指导课程)全套教学课件
- 《道德与法治》三年级学情分析
- 校园禁烟承诺书(12篇)
- 国家开放大学《计算机网络》课程实验报告实验六-计算机网络综合性实-
- 学校教育统计工作计划方案
- 售后服务方案及运维方案
评论
0/150
提交评论