版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、一、假设检验一、假设检验二、独立样本二、独立样本T检验检验三、单因素方差分析三、单因素方差分析 不同性别、不同年龄、不同教育背景、不同收入、不同性别、不同年龄、不同教育背景、不同收入、不同客源地的游客群体在旅游购物、游憩动机、不同客源地的游客群体在旅游购物、游憩动机、游憩满意度、乃至旅游影响感知等方面肯定存在游憩满意度、乃至旅游影响感知等方面肯定存在差异,但如果只探讨他们之间的差异,但如果只探讨他们之间的微小差异微小差异是没有是没有意义的,我们需要了解的是他们在这些方面是否意义的,我们需要了解的是他们在这些方面是否存在存在显著差异显著差异。 差异显著性检验属于假设检验的范畴,因而必须差异显著性
2、检验属于假设检验的范畴,因而必须首先了解什么是首先了解什么是假设检验(假设检验(Hypothesis Testing)。一、假设检验一、假设检验(一)假设检验的基本原理(一)假设检验的基本原理 所谓假设,可以理解为是研究者对于某个有待解决的问题所谓假设,可以理解为是研究者对于某个有待解决的问题所提出的暂时性或尝试性的答案。就差异显著性的假设检所提出的暂时性或尝试性的答案。就差异显著性的假设检验而言,其假设的陈述形式是一种差异式陈述方式。验而言,其假设的陈述形式是一种差异式陈述方式。例如:例如: 不同性别的游客对某一景区提供的住宿条件的满意程度是不同性别的游客对某一景区提供的住宿条件的满意程度是
3、否存在显著差异?否存在显著差异? 不同收入的游客群体对某一景区自然风光的评价是否存在不同收入的游客群体对某一景区自然风光的评价是否存在显著差异?显著差异? 要回答这些问题,我们最好先提出有关假设要回答这些问题,我们最好先提出有关假设 。1. 零假设和对立假设零假设和对立假设 如:我们假设不同性别的游客对某一景区提供的住宿条如:我们假设不同性别的游客对某一景区提供的住宿条 件的满意程度不存在显著差异,我们以件的满意程度不存在显著差异,我们以H0代表这个假代表这个假 设,设,H0就称为就称为“零假设零假设”(null hypothesis)(也称为)(也称为“原原 假设假设”或或“虚无假设虚无假设
4、”)。)。 其对立面,不同性别的游客对某一景区提供的住宿条件的其对立面,不同性别的游客对某一景区提供的住宿条件的 满意程度存在显著差异,通常以满意程度存在显著差异,通常以H1代表,称为代表,称为 “对立假对立假设设” (alternative hypothesis)()( 也称为也称为“备择假设备择假设”)。)。 零假设是待检验的假设,如果待检验的假设不成立,那么零假设是待检验的假设,如果待检验的假设不成立,那么 其对立假设就成立。其对立假设就成立。 2假设检验的两类错误假设检验的两类错误第一类错误第一类错误: 也称为也称为弃真错误弃真错误,是指零假设,是指零假设H H0 0实际上是真实际上是
5、真实的,而检验结果却拒绝了它。出现第一类错误的概率是实的,而检验结果却拒绝了它。出现第一类错误的概率是显著性水平显著性水平,因此犯第一类错误的概率是可以控制的。,因此犯第一类错误的概率是可以控制的。 第二类错误第二类错误: :也称为也称为取伪错误取伪错误,是指零假设,是指零假设H H0 0实际上是不真实际上是不真实的,而检验结果却接受了它。第二类错误的概率用实的,而检验结果却接受了它。第二类错误的概率用表表示。示。检验结果检验结果总体情况总体情况 零假设零假设0为真为真 对立假设对立假设1为真为真 接受接受 拒绝拒绝判断正确判断正确第一类错误第一类错误 第二类错误第二类错误 判断正确判断正确弃
6、真错误和取伪错误的概率存在此消彼长的关系弃真错误和取伪错误的概率存在此消彼长的关系:当弃真错误的概率降低时,取伪错误的概率就会增加当弃真错误的概率降低时,取伪错误的概率就会增加 当取伪错误的概率降低时,弃真错误的概率就会增加当取伪错误的概率降低时,弃真错误的概率就会增加同时减少犯这两类错误的概率的唯一的方法是增大样本容同时减少犯这两类错误的概率的唯一的方法是增大样本容量,但这又是不现实的量,但这又是不现实的因此,通常都是首先控制弃真错误的概率,即确定显著性因此,通常都是首先控制弃真错误的概率,即确定显著性水平水平3双侧检验和单侧检验双侧检验和单侧检验 假设检验的两种形式假设检验的两种形式(1)
7、 双侧检验双侧检验 有两个临界值,两个拒有两个临界值,两个拒绝域,每个拒绝域的面积为绝域,每个拒绝域的面积为,原假设,原假设= 0,只要,只要 0或或0有一侧出现,有一侧出现,就要拒绝原假设。就要拒绝原假设。双侧检验按双侧检验按 查表求临界值。查表求临界值。= 0 0双侧检验单侧检验 原假设0备择假设1 0 0(2) 单侧检验单侧检验有一个临界值,一个拒绝域,有一个临界值,一个拒绝域,拒绝域的面积为拒绝域的面积为。 当所考察的数值越大越好时,当所考察的数值越大越好时,用单侧检验。用单侧检验。 如考察灯泡的寿命如考察灯泡的寿命当所考察的数值越小越好时,当所考察的数值越小越好时,用单侧检验。用单侧
8、检验。 如考察产品的废品率如考察产品的废品率单侧检验按单侧检验按查表求临界值。查表求临界值。4假设检验的步骤假设检验的步骤(1) 提出假设。提出假设。 (2) 选取检验统计量,并在原假设选取检验统计量,并在原假设0成立的条件下计算统计成立的条件下计算统计 量的值。量的值。(3) 对于给定的显著性水平对于给定的显著性水平,决定临界值。,决定临界值。 的取值范围为的取值范围为0.01,0.05和和0.10,一般情况下,一般情况下,常用常用0.05。 当当0.05时,差异显著,当时,差异显著,当0.01时,差异极显著。时,差异极显著。(4) 对假设做出判断。对假设做出判断。 通过对计算获得的统计量与
9、临界值的比较,作出接受或通过对计算获得的统计量与临界值的比较,作出接受或 拒绝零假设的决定。拒绝零假设的决定。210:H211:H 显著性水平值显著性水平值定得越大,拒绝域就越大,就越不容易接定得越大,拒绝域就越大,就越不容易接受原假设,反之,显著性水平值定得越小,拒绝域就越小,受原假设,反之,显著性水平值定得越小,拒绝域就越小,就越容易接受原假设。因此,在统计检验的问题中,要注就越容易接受原假设。因此,在统计检验的问题中,要注意意值的确定问题。值的确定问题。 使用统计软件进行假设检验,在输出的结果中,会出现使用统计软件进行假设检验,在输出的结果中,会出现P值(值(Sig.),),P值是判断检
10、验结果的另一个衡量标准,是值是判断检验结果的另一个衡量标准,是进行检验决策的另一个依据。进行检验决策的另一个依据。P值是拒绝零假设的最小值。值是拒绝零假设的最小值。 当当P时,拒绝时,拒绝H0,表明样本均值存在显著差异;,表明样本均值存在显著差异; 当当P 时,接受时,接受H0,表明样本均值不存在显著差异。,表明样本均值不存在显著差异。5. 检验方法的选择检验方法的选择 一般而言,差异显著性检验涉及的变量关系可以理解为一一般而言,差异显著性检验涉及的变量关系可以理解为一种因果关系。从统计学的观点来看,这种涉及两类变量的种因果关系。从统计学的观点来看,这种涉及两类变量的检验属于双变量(检验属于双
11、变量(bivariate)的统计检验。对于双变量的)的统计检验。对于双变量的假设检验,我们必须指定其中的一个变量为自变量假设检验,我们必须指定其中的一个变量为自变量 (independent variable)、另一个为因变量()、另一个为因变量(dependent variable)。)。 如不同性别的游客对某景区提供的住宿条件的满意度存在如不同性别的游客对某景区提供的住宿条件的满意度存在 显著差异,这里视性别为自变量,满意度为因变量,即认显著差异,这里视性别为自变量,满意度为因变量,即认 为这种满意度的差别是因为性别的不同引起的。为这种满意度的差别是因为性别的不同引起的。 因变量因变量自变
12、量(类别变量)自变量(类别变量)类别变量类别变量卡方检验卡方检验连续变量连续变量t检验、方差分析检验、方差分析二、独立样本二、独立样本T检验检验(一)基本原理(一)基本原理 当自变量为间断(类别)变量,因变量为连续变量时,常当自变量为间断(类别)变量,因变量为连续变量时,常使用使用T检验与方差检验进行有关分析。检验与方差检验进行有关分析。 SPSS软件提供的软件提供的T检验有检验有3种形式,分别是单样本种形式,分别是单样本T检验检验 (One-Sample T Test),独立样本),独立样本T检验(检验(Independent -Sample T Test)和成对样本)和成对样本T检验(检验
13、(Paired-Sample T Test)。)。 在旅游研究中,比较常用的是独立样本在旅游研究中,比较常用的是独立样本T检验,因而本章检验,因而本章仅讨论独立样本仅讨论独立样本T检验。独立样本检验。独立样本T检验在一些教科书中检验在一些教科书中被称为独立双样本被称为独立双样本T检验,顾名思义,其显然仅适用于自检验,顾名思义,其显然仅适用于自变量为两组的情况。如考虑不同性别的游客心理感知差异变量为两组的情况。如考虑不同性别的游客心理感知差异时,由于性别只有男女两组,此时应该采取独立样本时,由于性别只有男女两组,此时应该采取独立样本T检检验方法进行有关检验。验方法进行有关检验。 独立样本独立样本
14、T检验常用于进行两独立样本均值的比较。所谓检验常用于进行两独立样本均值的比较。所谓 独立样本是指两组样本之间没有任何联系,但各自接受相独立样本是指两组样本之间没有任何联系,但各自接受相 同的测量。假设两组样本的个数分别为同的测量。假设两组样本的个数分别为n1和和n2,检验这两,检验这两 组样本的均值是否相等可以分为以下两种情况考虑。组样本的均值是否相等可以分为以下两种情况考虑。 1. 两总体方差两总体方差 和和 未知,但它们相等。未知,但它们相等。 此时属于两样本等方差检验,其统计量此时属于两样本等方差检验,其统计量t的计算式为:的计算式为:统计量统计量t服从自由度为(服从自由度为(n1+n2
15、-2)的)的t分布。分布。式中,式中, 和和 分别为两组样本的均值,分别为两组样本的均值,n1和和n2分别为两分别为两组样本的个数,组样本的个数, 和和 分别为两组样本的方差。分别为两组样本的方差。21)2(112) 1() 1(21212122221121nntnnnnSnSnXXt1X2X21S22S222. 两总体方差两总体方差 和和 未知,但它们不相等。未知,但它们不相等。 此时属于两样本异方差的此时属于两样本异方差的T检验,其检验,其t统计量的计算式为:统计量的计算式为:其自由度为:其自由度为:其中:其中:22212121nSnSXXt122121)1 (1nknkdf2221211
16、21nSnSnSk2122 也就是说,独立双样本也就是说,独立双样本T检验,首先必须先检验双样本的检验,首先必须先检验双样本的 方差是否相等,这是选择统计量进行双样本方差是否相等,这是选择统计量进行双样本T检验的基检验的基 础,方差是否相等需要采用础,方差是否相等需要采用F检验,其统计量的计算式为:检验,其统计量的计算式为: 服从自由度为(服从自由度为(n1-1, n2-1)的)的F分布。分布。) 1, 1(212221nnFSSF (二)范例详析:(二)范例详析: 在广泛查阅国内有关游客满意度研究文献的基础上,并考在广泛查阅国内有关游客满意度研究文献的基础上,并考虑研究区的实际情况,从旅游六
17、大要素的吃、住、行、游、虑研究区的实际情况,从旅游六大要素的吃、住、行、游、购、娱和服务所对应的购、娱和服务所对应的“饮食、住宿、交通、资源、购物、饮食、住宿、交通、资源、购物、娱乐、服务娱乐、服务”7个构面选择个构面选择23个评价指标构建个评价指标构建Likert 5点点量表,按非常不满意、不满意、一般、满意、非常满意量表,按非常不满意、不满意、一般、满意、非常满意5个级别分别赋以个级别分别赋以15分值。将所编制的量表作为一项重要分值。将所编制的量表作为一项重要内容编入内容编入“旅游景区游客满意度调查问卷旅游景区游客满意度调查问卷”,用于实地调,用于实地调查。查。 2010年年8月调查组利用
18、该问卷深入白水洋景区进行实地调月调查组利用该问卷深入白水洋景区进行实地调查,问卷调查遵循随机抽样原则,并现场直接回收。共发查,问卷调查遵循随机抽样原则,并现场直接回收。共发放问卷放问卷491份,并全部回收。通过事后对问卷的检查整理,份,并全部回收。通过事后对问卷的检查整理,发现无效问卷发现无效问卷89份,共获得有效问卷份,共获得有效问卷402份,占发放问卷份,占发放问卷总数的总数的81.87%。 福建白水洋景区游客满意度评价指标福建白水洋景区游客满意度评价指标序号与题项序号与题项01 食物的新鲜程度食物的新鲜程度09 交通的舒适性交通的舒适性17 商品质量商品质量02 食物的特色食物的特色10
19、 交通的安全性交通的安全性18 娱乐项目种类娱乐项目种类03 食物的卫生程度食物的卫生程度11 自然风光自然风光19 娱乐项目创新性娱乐项目创新性04 食物的价格食物的价格12 卫生环境卫生环境20 娱乐项目安全性娱乐项目安全性05 住宿的环境卫生住宿的环境卫生13 旅游形象旅游形象21 服务态度服务态度06 住宿的舒适性住宿的舒适性14 门票价格门票价格22 服务效率服务效率07 住宿的价格住宿的价格15 商品种类商品种类23 导向标志与解说导向标志与解说08 交通的便捷性交通的便捷性16 商品特色商品特色1. 提出假设提出假设 本例选择其中的住宿满意度进行独立样本本例选择其中的住宿满意度进
20、行独立样本T检验。根据假检验。根据假设检验的原理,我们提出如下假设:设检验的原理,我们提出如下假设: :不同性别的游客对白水洋景区的住宿满意度存在显:不同性别的游客对白水洋景区的住宿满意度存在显 著差异。著差异。 :不同性别的游客对白水洋景区的住宿环境卫生满:不同性别的游客对白水洋景区的住宿环境卫生满 意度存在显著差异。意度存在显著差异。 :不同性别的游客对白水洋景区的住宿的舒适性满:不同性别的游客对白水洋景区的住宿的舒适性满 意度存在显著差异。意度存在显著差异。 :不同性别的游客对白水洋景区的住宿的价格满意:不同性别的游客对白水洋景区的住宿的价格满意 度存在显著差异。度存在显著差异。1HaH
21、1bH1cH12. 独立样本独立样本T检验的检验的SPSS求解过程求解过程 本例中自变量为性别,因变量为满意度,由于自变量只本例中自变量为性别,因变量为满意度,由于自变量只有男和女两组,属于间断(类别)变量,而满意度是根有男和女两组,属于间断(类别)变量,而满意度是根据据Likert 5点量表进行调查的结果,可视为连续变量,点量表进行调查的结果,可视为连续变量,因而可以采用独立双样本因而可以采用独立双样本T检验的方法进行检验,以判检验的方法进行检验,以判断男性游客与女性游客对景区住宿条件的满意度是否存断男性游客与女性游客对景区住宿条件的满意度是否存在显著差异。在显著差异。 1)数据输入与菜单选
22、择)数据输入与菜单选择 打开打开SPSS软件,输入有关数据,选择菜单软件,输入有关数据,选择菜单“分析(分析(A)比较均值(比较均值(M)独立样本独立样本T检验(检验(T)”,开启,开启“独独 立样本立样本T检验检验”窗口。窗口。2)选择进行)选择进行“独立样本独立样本T检验检验”的变量的变量 本例欲进行住宿条件满意度的差异性检验,所以从对话框本例欲进行住宿条件满意度的差异性检验,所以从对话框左侧的变量列表中选左侧的变量列表中选“住宿的环境卫生住宿的环境卫生”、 “住宿的舒住宿的舒适性适性”、 “住宿的价格住宿的价格”3个变量,使之进入右侧的个变量,使之进入右侧的“检检验变量(验变量(T)”框
23、。框。 3)设置分组变量)设置分组变量 从对话框左侧的变量列表中选从对话框左侧的变量列表中选“性别性别”变量,使之进入右变量,使之进入右侧的侧的“分组变量(分组变量(G)”框,继之点击框,继之点击“定义组(定义组(D)”,在弹出的在弹出的“定义组定义组”对话框中,在对话框中,在“使用指定值(使用指定值(U)”单选框的单选框的“组组1(1)”栏输入栏输入1,在,在“组组2(2)”输入输入2,点击点击“继续继续”键,回到键,回到“独立样本独立样本T检验检验”窗口。割点窗口。割点(C)单选框适合连续变量的情况,因而可以不用填写。)单选框适合连续变量的情况,因而可以不用填写。接着点击接着点击“继续继续
24、”键,返回键,返回“独立样本独立样本T检验检验”对话框。对话框。4)指定输出内容及缺失值处理方法)指定输出内容及缺失值处理方法 单击单击“选项(选项(O)”框,开启选项对话框。框,开启选项对话框。 1)“置信区间(置信区间(C)”编辑框:一般设置编辑框:一般设置95%置信区间。置信区间。 2)“缺失值缺失值”单选框:按分析顺序排除个案(单选框:按分析顺序排除个案(A)表示)表示当分析计算涉及含有缺失值的变量时,才删除该记录;按当分析计算涉及含有缺失值的变量时,才删除该记录;按列表排除个案(列表排除个案(L)表示只要相关变量有缺失值,则在所)表示只要相关变量有缺失值,则在所有分析中均将该记录删除
25、;本例选择前者。有分析中均将该记录删除;本例选择前者。 3)最后单击)最后单击“继续继续”框,返回框,返回“独立样本独立样本T检验检验”对话框。对话框。5)确定设置和输出结果)确定设置和输出结果 所有设置确定无误后,点击所有设置确定无误后,点击“确定确定”按钮,输出分析结按钮,输出分析结果。果。3. SPSS分析结果解读分析结果解读 独立双样本独立双样本T检验的检验的SPSS输出结果比较简单,仅包含描述输出结果比较简单,仅包含描述 统计和统计和T检验两个输出结果表。检验两个输出结果表。 描述性统计量描述性统计量 性别性别N均值均值标准差标准差均值的标准误均值的标准误住宿的环境卫住宿的环境卫生生
26、男性男性2043.4118.74745.05233女性女性1983.2626.77507.05508住宿的舒适性住宿的舒适性男性男性2043.4853.71216.04986女性女性1983.2576.72610.05160住宿的价格住宿的价格男性男性2043.0098.85955.06018女性女性1983.0152.76389.05429方差方程方差方程的的Levene检验检验均值方程的均值方程的t检验检验差分的差分的95%置信置信区间区间FSig.tdfSig.(双(双 侧)侧)均值差均值差值值标准标准误差误差值值下限下限上限上限住住宿宿的的环环境境卫卫生生假设假设方差方差相等相等.21
27、9.6401.964400.050.14914.07594-.00015.29842假设假设方差方差不相不相等等1.963398.256.050.14914.07598-.00023.29851独立样本独立样本T检验检验方差方程的方差方程的Levene检验检验均值方程的均值方程的t检验检验差分的差分的95%置信置信区间区间FSig.tdfSig.(双(双侧)侧)均值均值差值差值标准标准误差值误差值下限下限上限上限住住宿宿的的舒舒适适性性假设假设方差方差相等相等.830.3633.174400.002.22772.07174.08669.36874假设假设方差方差不相不相等等3.174399.0
28、30.002.22772.07176.08665.36879方差方程的方差方程的Levene检验检验均值方程的均值方程的t检验检验差分的差分的95%置置信区间信区间FSig.tdfSig.(双(双侧)侧)均值差均值差值值标准标准误差误差值值下限下限上限上限住住宿宿的的价价格格假设假设方差方差相等相等1.578.210-.066400.948-.00535.08119-.16496.15427假设假设方差方差不相不相等等-.066396.947.947-.00535.08105-.16468.15399 从表中可以看出,从表中可以看出,“住宿的环境卫生住宿的环境卫生”、“住宿的舒适性住宿的舒适性
29、”和和“住宿的价格住宿的价格”Levene检验的检验的F值均未达到显著,表明值均未达到显著,表明两组样本方差同质,此时均要看假设方差相等的两组样本方差同质,此时均要看假设方差相等的t检验结检验结果。果。 就就“住宿的环境卫生住宿的环境卫生”因变量而言,统计量因变量而言,统计量t=1.964,自,自由度由度df=400,显著性水平,显著性水平p=0.0500.05,刚好达到预设,刚好达到预设的的0.05的显著性水平,表明男性游客与女性游客对景区的显著性水平,表明男性游客与女性游客对景区“住宿的环境卫生住宿的环境卫生”的满意度存在显著差异,从描述统计的满意度存在显著差异,从描述统计量表中的均值可以
30、看出,男性的满意度均值高于女性,因量表中的均值可以看出,男性的满意度均值高于女性,因而可以宣称男性游客对景区的而可以宣称男性游客对景区的“住宿的环境卫生住宿的环境卫生”的满意的满意度显著高于女性游客。度显著高于女性游客。 就就“住宿的舒适性住宿的舒适性”因变量而言,统计量因变量而言,统计量t=3.174,自由,自由度度df=400,显著性水平,显著性水平p=0.0020.05,未达到显著,未达到显著,此时应接受关于均值相等的零假设,即认为男性游客与女此时应接受关于均值相等的零假设,即认为男性游客与女性游客对景区的性游客对景区的“住宿的价格住宿的价格”的满意度不存在显著差异。的满意度不存在显著差
31、异。1HaH1bH1cH1项目项目假设内容假设内容检验结果检验结果不同性别的游客对景区住宿条件的不同性别的游客对景区住宿条件的满意度存在显著差异满意度存在显著差异部分成立部分成立不同性别的游客对景区住宿的环境不同性别的游客对景区住宿的环境卫生满意度存在显著差异卫生满意度存在显著差异成立成立不同性别的游客对景区住宿的舒适不同性别的游客对景区住宿的舒适性满意度存在显著差异性满意度存在显著差异成立成立不同性别的游客对景区住宿的价格不同性别的游客对景区住宿的价格满意度存在显著差异满意度存在显著差异不成立不成立 白水洋景区不同性别的游客对景区住宿条件满意度差异性的白水洋景区不同性别的游客对景区住宿条件满
32、意度差异性的 独立样本独立样本T检验结果检验结果 因而我们可以认为,不同性别的游客对白水洋景区提供的住宿因而我们可以认为,不同性别的游客对白水洋景区提供的住宿条件的满意度存在显著差异的假设条件的满意度存在显著差异的假设 部分成立。部分成立。1H三、单因素方差分析三、单因素方差分析 在自变量为间断(类别)变量,因变量为连续变量的情况在自变量为间断(类别)变量,因变量为连续变量的情况下,如果自变量超过两组,此时适宜采用方差分析进行有下,如果自变量超过两组,此时适宜采用方差分析进行有关检验。也就是说独立样本关检验。也就是说独立样本T检验只能检验两个均值检验只能检验两个均值 和和 是否相等,而方差分析
33、则可以检验两个以上均值是否相等,而方差分析则可以检验两个以上均值 是否相等。是否相等。(一)方差分析的基本概念(一)方差分析的基本概念 要想知道什么是方差分析,首先必须了解与方差分析有关要想知道什么是方差分析,首先必须了解与方差分析有关的几个基本概念:的几个基本概念:1. 因素(因素(factor):在试验中,影响试验结果的各种条件称):在试验中,影响试验结果的各种条件称为试验因素。因素常用大写字母为试验因素。因素常用大写字母A、B、C、等表示。等表示。12n,21 2. 因素水平(因素水平(level of factor):因素所处的某种特定状态):因素所处的某种特定状态或数量等级称为因素水
34、平。因素水平用代表该因素的字母或数量等级称为因素水平。因素水平用代表该因素的字母加添足标加添足标1,2,来表示。如,来表示。如A1、A2、,B1、B2、。3. 处理(处理(treatment):事先设计好的实施在试验单位上的):事先设计好的实施在试验单位上的具体项目叫处理。具体项目叫处理。 当研究中考察的因素只有一个时,称为单因素试验;若同当研究中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上的因素对试验结果的影响时,则称时研究两个或两个以上的因素对试验结果的影响时,则称为双因素或多因素试验。为双因素或多因素试验。 随着因素数的增加,普通方差分析的复杂性迅速增加,特随着因素数的
35、增加,普通方差分析的复杂性迅速增加,特别是所需试验的次数呈几何级数增加,因此在实际研究中别是所需试验的次数呈几何级数增加,因此在实际研究中最常用的是单因素方差分析,双因素方差分析已较少用到,最常用的是单因素方差分析,双因素方差分析已较少用到,三或三因素以上的方差分析则很少用到,考虑到目前在旅三或三因素以上的方差分析则很少用到,考虑到目前在旅游研究领域单因素方差分析具有非常广泛的应用,因而本游研究领域单因素方差分析具有非常广泛的应用,因而本章仅介绍单因素方差分析。章仅介绍单因素方差分析。(二)单因素方差分析的基本条件(二)单因素方差分析的基本条件 进行方差分析,要满足以下几个基本条件:进行方差分
36、析,要满足以下几个基本条件:1. 变异的可加性变异的可加性 方差分析所依据的一个基本原理就是变异的可加性。确切方差分析所依据的一个基本原理就是变异的可加性。确切地说,应是变异的可分解性,总变异可以分解成几个来源地说,应是变异的可分解性,总变异可以分解成几个来源不同、彼此相互独立的部分。不同、彼此相互独立的部分。2. 分布的正态性分布的正态性 试验误差是相互独立的,且都服从正态分布试验误差是相互独立的,且都服从正态分布N(0, )。只有在这样的条件下才能进行只有在这样的条件下才能进行F检验。检验。3. 方差的同质性方差的同质性 各个处理观测值总体方差各个处理观测值总体方差 应是相等的。只有这样,
37、才应是相等的。只有这样,才有理由以各个处理均方的合并作为检验各处理差异显著性有理由以各个处理均方的合并作为检验各处理差异显著性的共同的误差均方。的共同的误差均方。22(三)离差平方和的分解(三)离差平方和的分解 以以SS(Sum of Square)代表)代表“离差平方和离差平方和”,“总离差总离差平方和平方和” (Total)为各样本观察值)为各样本观察值 与样本总均值与样本总均值 的离差的离差平方和:平方和: “总离差平方和总离差平方和”反映了总波动的大小,对应的自由度为反映了总波动的大小,对应的自由度为 (nk-1)。)。 “总离差平方和总离差平方和”可以分解为可以分解为“组间离差平方和
38、组间离差平方和” (Between Groups)和)和“组内离差平方和组内离差平方和” (Within Groups)两)两个个 部分,即:部分,即:211)(XXSSkinjijTWBTSSSSSS“组间离差平方和组间离差平方和” 表示各组(各列)的均值表示各组(各列)的均值 与样本总均与样本总均值值 的离差平方和。可以表达如下:的离差平方和。可以表达如下:“组间离差平方和组间离差平方和”反映了不同样本组之间由于因素水平对反映了不同样本组之间由于因素水平对总总 波动的影响,对应的自由度为(波动的影响,对应的自由度为(k-1)。)。 “组内离差平方和组内离差平方和” 表示同组(同列)的每个样
39、本观察值表示同组(同列)的每个样本观察值与与 它们所在的组(列)的均值它们所在的组(列)的均值 的离差平方和。表达式如下:的离差平方和。表达式如下:“组内离差平方和组内离差平方和”反映了各处理组内随机波动的大小,对反映了各处理组内随机波动的大小,对应应 的自由度为(的自由度为(nk-k)。)。21)(XXnSSkiiB211)(ikinjijWXXSS(四)(四)F检验法检验法 单因素方差分析需要借助单因素方差分析需要借助F检验方法进行有关检验,其目检验方法进行有关检验,其目 的在于推断处理间的差异是否存在。的在于推断处理间的差异是否存在。 以以MS表示均值平方(表示均值平方(Mean of
40、square),将),将“组间离差组间离差平平 方和方和” 和和“组内离差平方和组内离差平方和” 分别除以各自的自分别除以各自的自由度,可以得到由度,可以得到“组间均值平方组间均值平方” 和和“组内均值平组内均值平方方” 。在此基础上,可以构建在此基础上,可以构建F统计量:统计量:BSSWSSWMSBMS1kSSMSBBkknSSMSWW), 1(kknkFMSMSFWB(五)单因素方差分析的步骤(五)单因素方差分析的步骤根据假设检验的基本原理,单因素方差分析可以描述为如下根据假设检验的基本原理,单因素方差分析可以描述为如下4个步骤:个步骤:1. 提出假设。提出假设。 不全相等不全相等2. 选
41、取检验统计量选取检验统计量,并在原假设,并在原假设 成立的条件下计算统计成立的条件下计算统计 量的值。量的值。 3. 对于给定的显著性水平对于给定的显著性水平,决定临界值。,决定临界值。 通过查通过查F分布表,可以得到分布表,可以得到 。4. 对假设做出判断。对假设做出判断。 若若 ,则拒绝零假设;,则拒绝零假设; 若若 ,则接受零假设。,则接受零假设。kH 210:kH,:211 0HWBMSMSF ), 1(kknkF), 1(kknkFF), 1(kknkFF(六)多重比较(六)多重比较 多重比较又称为事后比较。在方差分析中,如果方差分析多重比较又称为事后比较。在方差分析中,如果方差分析
42、的整体检验的的整体检验的F值未达显著水平,表示没有任何配对处理值未达显著水平,表示没有任何配对处理间的均值差异达到显著水平,此时就不用进行事后比较;间的均值差异达到显著水平,此时就不用进行事后比较; 如果方差齐性检验的如果方差齐性检验的F统计量达到显著性水平统计量达到显著性水平(p0.05), 表示至少有两个处理间的均值差异达到显著性水平,但具表示至少有两个处理间的均值差异达到显著性水平,但具 体哪几个配对组均值间的差异达到显著,必须进一步进行体哪几个配对组均值间的差异达到显著,必须进一步进行 事后比较才能知道。事后比较才能知道。 在满足方差同质性的条件下,在满足方差同质性的条件下,SPSS提
43、供了提供了14种事后比较种事后比较 方法,其中最常用的有方法,其中最常用的有LSD法、法、Tukey法和法和Scheffe法。法。 在样本方差不相等时,即违反了方差同质性的假定,此时在样本方差不相等时,即违反了方差同质性的假定,此时 原则上需要进行数据转换。但原则上需要进行数据转换。但SPSS提供了提供了4种直接的事种直接的事 后比较方法后比较方法,而无需进行数据转换。而无需进行数据转换。(七)范例详析(七)范例详析 以以基于社会人口统计学特征的游客满意度差异分析基于社会人口统计学特征的游客满意度差异分析以宁德世界地质公园白水洋景区为例以宁德世界地质公园白水洋景区为例为例,判断不同年为例,判断
44、不同年龄的游客群体对景区提供的住宿条件的满意度评价结果是龄的游客群体对景区提供的住宿条件的满意度评价结果是否存在显著差异。否存在显著差异。项目项目属性属性人数人数百分比(百分比(% %)年龄年龄186014.9318-30193483741-50338.2151-6071.746071.74小计小计402100.00 本项调查考虑的游客年龄群体分为本项调查考虑的游客年龄群体分为6组,分别是小于组,分别是小于18岁、岁、18-30岁之间、岁之间、31-40岁之间、岁之间、41-50岁之间、岁之间、51-60岁之岁之间和大于间和大于60岁,因而适宜采用单因素方差分析方法
45、进行有岁,因而适宜采用单因素方差分析方法进行有关检验。关检验。1. 提出假设提出假设 根据假设检验的基本原理,我们可以提出如下假设:根据假设检验的基本原理,我们可以提出如下假设: :不同年龄的游客对白水洋景区提供的住宿条件的满:不同年龄的游客对白水洋景区提供的住宿条件的满 意度存在显著差异。意度存在显著差异。 :不同年龄的游客对白水洋景区住宿的环境卫生:不同年龄的游客对白水洋景区住宿的环境卫生 的满意度存在显著差异。的满意度存在显著差异。 :不同年龄的游客对白水洋景区住宿的舒适性的:不同年龄的游客对白水洋景区住宿的舒适性的 满意度存在显著差异。满意度存在显著差异。 :不同年龄的游客对白水洋景区
46、住宿的价格的满:不同年龄的游客对白水洋景区住宿的价格的满 意度存在显著差异。意度存在显著差异。2HaH2bH2cH22. SPSS求解过程求解过程本例中自变量为不同的年龄,因变量为满意度,由于自变量本例中自变量为不同的年龄,因变量为满意度,由于自变量有有6组,且属于间断变量,而满意度是根据组,且属于间断变量,而满意度是根据Likert 5点量表进点量表进行调查的结果,可视为连续变量,因而这里不能采用独立样行调查的结果,可视为连续变量,因而这里不能采用独立样本本T检验的方法进行检验,而应采用单因素方差分析方法进检验的方法进行检验,而应采用单因素方差分析方法进行有关检验,以判断不同年龄的游客群体对
47、景区提供的住宿行有关检验,以判断不同年龄的游客群体对景区提供的住宿条件的满意度是否存在显著差异。条件的满意度是否存在显著差异。1)数据输入与检验变量选择。)数据输入与检验变量选择。将将402个游客对白水洋景区提供的住宿的环境卫生、住宿的个游客对白水洋景区提供的住宿的环境卫生、住宿的舒适性和住宿的价格舒适性和住宿的价格3个满意度指标的评价结果,以及所对个满意度指标的评价结果,以及所对应的游客年龄群组的调查数据输入应的游客年龄群组的调查数据输入SPSS 17.0软件。选择菜软件。选择菜单单“分析(分析(A)比较均值(比较均值(M)单因素单因素ANOVA”,开启,开启“单因素方差分析单因素方差分析”
48、对话框。对话框。2)选择进行)选择进行“单因素方差分析单因素方差分析”的变量的变量从对话框左侧的变量列表中将从对话框左侧的变量列表中将“住宿的环境卫生住宿的环境卫生”、“住宿住宿的的舒适性舒适性”和和“住宿的价格住宿的价格”,导入右侧的,导入右侧的“因变量列表因变量列表(E)”框框。以对话框左侧的变量列表中的。以对话框左侧的变量列表中的“年龄年龄”为控制变量,将之为控制变量,将之导导入右侧的入右侧的“因子(因子(F)”框。框。3)对组间平方和进行先行分解并检验)对组间平方和进行先行分解并检验单击单击“对比(对比(N)”按钮,弹出按钮,弹出“单因素单因素ANOVA:对比:对比”对对话话框。框。(
49、a)“多项式多项式”复选框:决定是否对组间平方和进行分解,复选框:决定是否对组间平方和进行分解,并进行结果检验。并进行结果检验。(b)“度(度(D)”下拉框:可以选择从线性趋势到最高五下拉框:可以选择从线性趋势到最高五次项曲线进行检验。次项曲线进行检验。(c)“系数(系数(O)”编辑框:定义精确两两比较的选项。编辑框:定义精确两两比较的选项。这里按照分组变量升序给每组一个系数值,注意最终所有这里按照分组变量升序给每组一个系数值,注意最终所有的系数总计应为的系数总计应为0。(d)本例此项不做设置,单击)本例此项不做设置,单击“继续继续”按钮,返回按钮,返回“单因单因素方差分析素方差分析”对话框。
50、对话框。4)选择进行各组间两两比较的方法选择进行各组间两两比较的方法单击单击“两两比较(两两比较(H)”按钮,弹出按钮,弹出“单因素单因素ANOVA:两两:两两比比较较”对话框。对话框。(a)“假定方差齐性检验假定方差齐性检验”复选框:当各组方差齐性时可复选框:当各组方差齐性时可选择的检验方法有选择的检验方法有14种,其中最常用的有种,其中最常用的有LSD和和S-N-K法。法。(b)“未假定方差齐性未假定方差齐性”复选框:当各组方差不齐时可用复选框:当各组方差不齐时可用的两两比较方法有的两两比较方法有4种,其中以种,其中以Dunnetts C法比较常用。法比较常用。(c)“显著性水平显著性水平
51、”编辑框:定义两两比较时的显著性水编辑框:定义两两比较时的显著性水平,通常为平,通常为0.05。(d)本例对此项暂不做设置,留待方差齐次性检验后再根)本例对此项暂不做设置,留待方差齐次性检验后再根据方差是齐性还是异方差再作选择,单击据方差是齐性还是异方差再作选择,单击“继续继续”按钮,按钮,返回返回“单因素方差分析单因素方差分析”对话框。对话框。5)定义相关统计选项以及缺失值处理方法定义相关统计选项以及缺失值处理方法单击单击“选项(选项(O)”按钮,弹出按钮,弹出“单因素单因素ANOVA:选项:选项”对话对话框。框。(a)“统计量统计量”复选框组:提供一些附加的统计分析项目。复选框组:提供一些
52、附加的统计分析项目。本例选择本例选择“描述性(描述性(D)”和和“方差同质性检验(方差同质性检验(H)”。(b):):“均值图(均值图(M)单选框:用各组均值制图,以直观)单选框:用各组均值制图,以直观了解它们的差异,本例选择此项。了解它们的差异,本例选择此项。(c):):“缺失值缺失值”单选框:定义分析中对缺失值的处理方单选框:定义分析中对缺失值的处理方法。包括法。包括“按分析顺序排除个案(按分析顺序排除个案(A)和)和“按列表排除个按列表排除个案(案(L)”两项。为了充分利用数据,本例选择前者。两项。为了充分利用数据,本例选择前者。(d):完成设置后,单击):完成设置后,单击“继续继续”按
53、钮,返回按钮,返回“单因素方单因素方差分析差分析”对话框。对话框。6)执行分析与结果输出执行分析与结果输出 所有设置确认无误后,单击所有设置确认无误后,单击“确定确定”按钮,执行单因素方按钮,执行单因素方差分析,并输出分析结果。差分析,并输出分析结果。N均值均值标准差标准差标准误标准误均值的均值的 95% 置置信区间信区间极小极小值值极大极大值值下限下限上限上限住住宿宿的的环环境境卫卫生生1.00603.4333.74485.096163.24093.62572.005.002.001933.2902.79632.057323.17713.40321.005.003.001023.3922.7
54、5984.075243.24293.54142.005.004.00333.3333.64550.112373.10443.56222.005.005.0073.2857.75593.285712.58663.98482.004.006.0073.1429.69007.260822.50473.78112.004.00总总数数4023.3383.76388.038103.26343.41321.005.003. SPSS分析结果解读分析结果解读1)描述性统计)描述性统计不同年龄群体游客对景区提供的住宿条件满意度评价结果描述性统计不同年龄群体游客对景区提供的住宿条件满意度评价结果描述性统计 N均
55、值均值标准差标准差标准误标准误均值的均值的 95% 置信置信区间区间极小极小值值极大极大值值下限下限上限上限住住宿宿的的舒舒适适性性1.00603.5167.79173.102213.31213.72122.005.002.001933.3368.72568.052243.23383.43982.005.003.001023.4706.69945.069263.33323.60802.005.004.00333.1515.66714.116132.91503.38811.004.005.0072.8571.37796.142862.50763.20672.003.006.0073.2857.7
56、5593.285712.58663.98482.004.00总数总数4023.3731.72715.036273.30183.44441.005.00N均值均值标准差标准差标准误标准误均值的均值的 95% 置信置信区间区间极小极小值值极极大大值值下限下限上限上限住住宿宿的的价价格格1.00603.1500.75521.097502.95493.34511.00 5.002.001932.9223.82864.059652.80463.03991.00 5.003.001023.0882.83373.082552.92453.25201.00 5.004.00333.1212.69631.121
57、212.87433.36812.00 4.005.0073.0000.57735.218222.46603.53402.00 4.006.0072.71431.11270.420561.68523.74341.00 4.00总数总数4023.0124.81283.040542.93273.09211.00 5.00Levene 统计量统计量df1df2显著性显著性住宿的环境卫生住宿的环境卫生.4495396.814住宿的舒适性住宿的舒适性2.6975396.021住宿的价格住宿的价格1.0105396.411就就“住宿的环境卫生住宿的环境卫生”检验变量而言,检验变量而言,Levene统计量的统
58、计量的F=0.449,对应的对应的P=0.8140.05;就;就“住宿的价格住宿的价格”检验变量而言,检验变量而言,Levene统计量的统计量的F=1.010,对应的,对应的P=0.411。二者均未达到。二者均未达到0.05的显著的显著性水平,均应接受方差相等的零假设,表示两组样本的方差不性水平,均应接受方差相等的零假设,表示两组样本的方差不存在显著差异,均未违反方差同质性的假定。存在显著差异,均未违反方差同质性的假定。就就“住宿的舒适性住宿的舒适性”检验变量而言,检验变量而言,Levene统计量统计量F=2.697,对应,对应的的P=0.0210.05)和)和1.308(p=0.2600.0
59、5),均未达到设置的显著性水平),均未达到设置的显著性水平0.05,因而均接受关于均值相等的零假设,表明不同年龄,因而均接受关于均值相等的零假设,表明不同年龄的游客对景区的游客对景区“住宿的环境卫生住宿的环境卫生”和和“住宿的价格住宿的价格”满意满意度不存在显著差异。因此研究假设和无法获得支持,从而度不存在显著差异。因此研究假设和无法获得支持,从而无需进行事后比较。无需进行事后比较。 就就“住宿的舒适性住宿的舒适性”因变量而言,整体检验的因变量而言,整体检验的F值为值为2.306(p=0.0440.05),达到设置的显著性水平),达到设置的显著性水平0.05,因而拒,因而拒绝关于均值相等的零假
60、设,表明不同年龄的游客群体对景绝关于均值相等的零假设,表明不同年龄的游客群体对景区区“住宿的舒适性住宿的舒适性”满意度的评价结果存在显著差异。满意度的评价结果存在显著差异。3)多重比较结果)多重比较结果 就就“住宿的环境卫生住宿的环境卫生”和和“住宿的价格住宿的价格”因变量而言,因因变量而言,因ANOVA分析结果表明分析结果表明F统计量均未达到显著,均接受关于统计量均未达到显著,均接受关于各组均值相等的零假设,因而无需进一步进行事后比较。各组均值相等的零假设,因而无需进一步进行事后比较。 就就“住宿的舒适性住宿的舒适性”因变量而言,因变量而言,ANOVA分析结果表明分析结果表明F统计量达到统计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论