版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
传播研究方法第四部分数据分析第十四讲假设与推论统计中国青年政治学院赵菁2015年12月17日《传播研究方法》第十四讲复习——统计学:是什么?统计学:两个作用描述性统计:用某种方法对资料进行总结,使之更便于使用。例:回收了200份问卷,如何总结概括资料?【百分数、均值、标准差…】当处理两个以上变量的相互关系时,描述性统计特别有用。【相关系数、多元统计分析】归纳性统计(统计推论):根据从总体抽取的样本对总体进行概括;根据反复观察制定普遍性定律。《传播研究方法》第十四讲复习:理解平均数平均数(average):集中趋势量度(measuresofcentraltendency)均值(mean)中位数(median):一系列数据的中点。众数(mode):出现次数最多的数值。《传播研究方法》第十四讲复习:理解平均数何时用什么?【众数、中位数、平均数】依赖于所描述的数据类型如果数据属性是分类的,而且数值只属于一种类型,使用众数;如果数据中包含极值,而且不想扭曲平均数(按均值计算),则使用中位数;如果数据不包括极值,也不是分类数据,就使用均值。《传播研究方法》第十四讲复习:理解变异性变异性(variability):散布/离散程度,对不同数值之间的差异性的测量。每个数值和特定值的差异程度均值变异性的三种量度:极差、标准差、方差《传播研究方法》第十四讲四、理解变异性计算极差(range):数据分布中的最大值减去最小值计算标准差(standarddeviation,缩写为s或SD):标准化了的与均值的偏差,与均值的平均距离计算方差(variance):标准差的平方《传播研究方法》第十四讲复习:用图表说话频数分布(frequencydistribution):记录和展现特定数据出现次数的方法。在建立频数分布时,数值通常依据一定的组距分组。组距(dassinterval):一个值域范围《传播研究方法》第十四讲五、用图表说话建立直方图《传播研究方法》第十四讲建立直方图(Histogram)《传播研究方法》第十四讲建立直方图(Histogram)《传播研究方法》第十四讲建立直方图(Histogram)《传播研究方法》第十四讲频数分布数据分布相互区别程度的四个方面:平均值变异性偏度峰度(kurtosis)《传播研究方法》第十四讲频数分布——平均值数据分布相互区别程度的四个方面:平均值分布E均值>分布D均值>分布C均值>分布B均值>分布A均值分布A均值分布B均值分布C均值分布D均值分布E均值《传播研究方法》第十四讲频数分布——变异性数据分布相互区别程度的四个方面:变异性均值相同,变异性不同;分布A的变异性<分布B的变异性<分布C的变异性<分布D的变异性<分布E的变异性分布A分布B分布C分布D分布E《传播研究方法》第十四讲频数分布——偏度数据分布相互区别程度的四个方面:偏度(skewness)正偏(右侧尾比左侧尾长);负偏(左侧尾比右侧尾长)分布A:正偏分布C:负偏分布B:无偏分布A分布B分布C《传播研究方法》第十四讲频数分布——峰度数据分布相互区别程度的四个方面:峰度(kurtosis)扁平Or陡峭分布A:扁平分布C:陡峭分布B:无峰度陡峭峰说明离散性或变异性更小分布A分布B分布C《传播研究方法》第十四讲复习:计算相关系数相关系数(correlationcoefficient):反映两个变量之间关系的量化指标【动态性质】。二元相关:两个变量的相关变量变化方向相同,为正相关(positivecorrelation);变量变化方向相反,为负相关(negativecorrelation)皮尔逊积距相关(PearsonProduct-momentcorrelation):考察两个连续变量之间的关系相关系数r;rXY:变量X和Y之间的相关系数《传播研究方法》第十四讲复习:计算相关系数相关系数(correlationcoefficient):变量X的变化变量Y的变化相关关系类型数值例子X值增大Y值增大正相关正值,【.00-1.00】你用于学习的时间越多,考试成绩就会越高。X值降低Y值降低正相关正值,【.00-1.00】你在银行存的钱越少,所得利息就越少。X值增大Y值降低负相关负值,【-1.00-.00】你运动越多,体重就越轻。X值降低Y值增大负相关负值,【-1.00-.00】你完成考试的时间越少,所犯的错误越多。!相关关系讨论的是一个群体的两个变量之间的关系,反映的是通则,而不是对应任何一个特定的个人。《传播研究方法》第十四讲
观察散点图的大致趋势,人的年龄的与人体脂肪含量具有什么相关关系?
年龄与脂肪的散点图,从整体上看,它们是线性相关的;这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关。《传播研究方法》第十四讲复习:计算相关系数有关相关系数:相关系数的绝对值反映相关的强度。相关系数-0.7比相关系数0.5表示的相关强度;相关系数反映两个变量共同变化的程度。如果一个变量值不发生变化,那么就不存在共同的变异性,即,两个变量之间的相关系数为0【如,年龄和逻辑推理能力,年龄均为25岁】。如果限制或控制一个变量的值域范围,这个变量和其他变量之间的相关系数相对于这个值没有限制的情况来说会更【如,计算阅读理解成绩与年级之间的相关】。变异性产生影响,不应该人为的限制变异性。大小《传播研究方法》第十四讲本讲概要描述统计:计算信度和效度正态曲线假设:检验你的问题显著性的含义——推论统计两个群体的t检验——不同群体的均值检验两个群体的t检验——两个相关群体的均值检验方差分析(One-wayANOVA)《传播研究方法》第十四讲一、利用SPSS计算信度和效度重复信度/前侧-后测方法(Test-retestmethod):重复同样的测量处理信度问题。如果预期获得的信息不该有变化,那么重复测量就应该得到相同的结果。如果两次测量的结果有出入,且差异较大,那么测量方法就一定有问题。复本信度(Parallel-formsReliability):以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。《传播研究方法》第十四讲计算重复信度:计算皮尔逊相关系数《传播研究方法》第十四讲计算复本信度:计算皮尔逊相关系数假设研究记忆,看一眼给定的10个单词并尽可能记住,然后在20秒内记忆、10秒钟休息,之后背诵这些单词。建立复本:测试内容相同:符合研究任务要求的另一组单词,不同于第一组。《传播研究方法》第十四讲计算复本信度:计算皮尔逊相关系数《传播研究方法》第十四讲内在一致性信度:克隆巴赫系数内在一致性(internalconsistencyreliability):确定测试中的项目是否彼此一致,都只表示一个维度、一个结构或一个关注的领域。4+4=?5-?=36+2=?8-?=31+1=?4+4=?这三只小猪中哪一只最肥?6+2=?8-?=3这匹狼到底要干什么?较高的内在一致性《传播研究方法》第十四讲内在一致性信度:克隆巴赫系数内在一致性(internalconsistencyreliability):确定测试中的项目是否彼此一致,都只表示一个维度、一个结构或一个关注的领域。克隆巴赫系数(Cronbach’s):对内在一致性系数的测量;计算逻辑:计算每个测试者在每个项目上的得分和总得分之间的相关系数,并与所有单个项目得分的变异性比较;测试中每个项目的得分与总分的变化越一致,这个系数的值就越大。这个系数值越大,就越可确信这个测试是内在一致的,或在测量同一个事物。《传播研究方法》第十四讲使用SPSS计算内在一致性信度《传播研究方法》第十四讲使用SPSS计算内在一致性信度《传播研究方法》第十四讲使用SPSS计算内在一致性信度《传播研究方法》第十四讲使用SPSS计算内在一致性信度《传播研究方法》第十四讲《传播研究方法》第十四讲利用SPSS计算效度效标效度:说明问卷得分与某种外部准则(效标)间的关联程度,用问卷测量得分与效度准则之间的相关系数表示。——相关法结构效度:又称构想效度,是指问卷对某一理论概念或特质测量的程度,即某问卷测验的实际得分能解释某一特质的程度。——因素分析法《传播研究方法》第十四讲利用SPSS计算效度:例如:小学生智力量表,共30个题目:1-6题为想象力;7-12题为思维力;13-18题为观察力;……计算校标效度:分别使用这个智力量表和一个得到公认的智力量表(效标)进行施测。分别计算出两个智力量表的总分。分析二者的相关,如果相关很高,则说明这个量表具有较高的效标效度。《传播研究方法》第十四讲50位同学阅读理解成绩频率分布直方图01020304050阅读理解成绩频率组距515253545552468二、正态曲线《传播研究方法》第十四讲xy0
200位同学阅读理解成绩频率分布直方图《传播研究方法》第十四讲阅读理解成绩频率组距o2468样本容量增大时频率分布直方图正态曲线
可以看出,当样本容量无限大,分组的组距无限缩小时,这个频率直方图上面的折线就会无限接近于一条光滑曲线---正态曲线.钟型曲线《传播研究方法》第十四讲生活中的正态分布人的身高高低不等,但中等身材的占大多数,特高和特矮的只是少数,而且较高和较矮的人数大致相近,这从一个方面反映了服从正态分布的随机变量的特点。矮个中等身材高个不聪明中等聪明聪明少数人多数人很小的概率很小的概率《传播研究方法》第十四讲正态分布的特性1均值中位数众数对称性渐进性xy与x轴围成的面积为1均值μ,标准差σ《传播研究方法》第十四讲正态分布的特性2
——正态曲线下的面积xy均值μ,标准差σ34.13%34.13%13.59%13.59%2.15%2.15%.13%.13%正态总体几乎总取值于区间之内,而在此区间以外取值的概率只有0.26%。通常认为这种情况在一次试验中几乎不可能发生。【3σ原则
】《传播研究方法》第十四讲最中意的标准值:z值要对有不同均值μ和标准差σ的正态分布进行比较,需要一定的标准。Z值(zscore):标准值,偏离均值的标准差个数。【不同分布的z值具有可比性】Z:z值X:具体的数值S:数据分布的标准差
:数据分布的均值x0标准正态分布:μ=0σ=1《传播研究方法》第十四讲最中意的标准值:z值168143求原始数值为143、标准差为12的z值《传播研究方法》第十四讲168143曲线下面积为0.0188只有1.88%的个案小于143《传播研究方法》第十四讲最中意的标准值:z值168143求阴影区面积1930.0188*2=0.0376《传播研究方法》第十四讲练习:计算图中的阴影区面积80901050.203-0.019=0.185阴影区面积为18.5%,有18.5%的个案位于90-105分之间《传播研究方法》第十四讲三、假设:检验你的问题从某一研究问题中得出待检验的假设;从总体中选择样本,检验研究假设;首先要建立零假设(nullhypothesis),作为研究的起点9年级学生的ABC记忆考试的平均成绩和12年级学生的平均成绩没有差异;由社区长期照料老人的效果和由家庭长期照料老人的效果没有差异。《传播研究方法》第十四讲三、假设:检验你的问题研究假设;变量间有关系的明确表述;每一个零假设都有一个对应的研究假设。无方向研究假设:反映群体间的差异,但是差异的方向不确定。有方向研究假设:反映群体间的差异,而且差异的方向是确定的。《传播研究方法》第十四讲三、假设:检验你的问题研究假设;变量间有关系的明确表述;无方向研究假设:反映群体间的差异,但是差异的方向不确定。9年级学生的ABC记忆考试的平均成绩不同于12年级学生的平均成绩《传播研究方法》第十四讲三、假设:检验你的问题研究假设;变量间有关系的明确表述;有方向研究假设:反映群体间的差异,而且差异的方向确定。12年级学生的ABC记忆考试的平均成绩比9年级学生的平均成绩高。研究假设的目的:直接检验的研究假设是研究过程中的重要一步。通过比较检验的结果与随机预期的结果(零假设)来确定这两个中哪一个是所观察到的群体间差异的更好的解释。《传播研究方法》第十四讲例,研究白人家庭和黑人家庭提供给孩子的支持数量;零假设:白人家庭和黑人家庭提供给孩子的支持数量没有差异;无方向的假设:白人家庭提供给孩子的支持数量不同于黑人家庭提供的支持数量;有方向的假设:白人家庭提供给孩子的支持数量高于黑人家庭提供的支持数量。《传播研究方法》第十四讲三、假设:检验你的问题单尾与双尾:单尾(one-tailedtest):反映有方向假设,假定了特定方向的差异。12年级学生的ABC记忆考试的平均成绩比9年级学生的平均成绩高。双尾(two-tailedtest):反映无方向假设,假定差异没有特定的方向。9年级学生的ABC记忆考试的平均成绩不同于12年级学生的平均成绩x0《传播研究方法》第十四讲三、假设:检验你的问题研究假设和零假设的区别:零假设表示两个变量之间没有关系;研究假设表示两个变量之间有关系。零假设对应总体,研究假设对应样本【推论】。由于总体不能直接检验,零假设只能被间接检验,而研究假设能够被直接检验。零假设是暗含的假设,研究假设是明确表达的。《传播研究方法》第十四讲四、显著性差异——推论统计显著性的概念研究假设举例:参与学前项目的孩子与没有参与的孩子在学习成绩上具有显著性差异。显著性:两个群体的态度之间的任何差异是由于系统因素而不是偶然性因素的影响。(假如我们控制了可能影响两个群体之间差异的所有其他因素,余下的解释青少年态度差异的唯一因素就是学前经验的影响。我们能肯定结论吗?我们能100%肯定结论吗?)《传播研究方法》第十四讲四、显著性差异——推论统计显著性的概念研究假设举例:参与学前项目的孩子与没有参与的孩子在学习成绩上具有显著性差异。显著性:两个群体的态度之间的任何差异是由于系统因素而不是偶然性因素的影响。不能100%肯定,错误的可能性始终存在。所研究的样本是否能够很好地代表总体?设计实验中是否遗漏某些因素?《传播研究方法》第十四讲四、显著性差异——推论统计显著性的概念大多数涉及假设检验的科学研究中一定存在一定数量的不能控制的误差——即,偶然性因素。如果推断考试成绩的差异是由于经历的不同,就得接受一定的风险。风险水平就是我们愿意执行的统计显著性水平(significantlevel)。【p<.05,20次中有一次所发现的任何差异不是由于假定的原因,而是由于其他未知的原因引起的。】《传播研究方法》第十四讲四、显著性差异——推论统计统计显著性(statisticalsignificance)零假设为真的情况下(两个样本间没有差异)拒绝零假设(差异存在)所要承担的风险水平。(TypeIerror)可能的选择接受零假设拒绝零假设零假设的真实性质零假设是真实的对啦!零假设是真实的情况下接受了零假设,而且群体之间没有差别。犯了第I类错误,在群体之间没有差异的情况下拒绝了零假设。(以希腊字母α表示)零假设是虚假的犯了第II类错误,接受了虚假的零假设。(以希腊字母β表示)很好,在群体之间存在差异的情况下拒绝了零假设。《传播研究方法》第十四讲四、显著性差异——推论统计统计显著性(statisticalsignificance)零假设为真的情况下(两个样本间没有差异)拒绝零假设(差异存在)所要承担的风险水平。(TypeIerror)例如,显著水平是.01(p<.01),意味着:显著水平是.05(p<.05),意味着:在任何一个零假设检验中,只有1%的可能性是零假设为真,而我们拒绝了零假设。即,在群体之间根本没有差异的情况下得出群体之间有差异的结论。在任何一个零假设检验中,只有5%的可能性是零假设为真,而我们拒绝了零假设。即,在群体之间根本没有差异的情况下得出群体之间有差异的结论。《传播研究方法》第十四讲四、显著性差异——推论统计如何选择恰当的统计检验来确定群体之间的差异是否存在?选择统计检验方法的快速方法(速查表)《传播研究方法》第十四讲你是检验变量之间的关系还是检验两个群体在一个或多个变量上的差异我检验变量之间的关系分析几个变量?两个以上相关系数的显著性的t检验两个变量回归,因素分析我检验两个群体在一个或多个变量上的差异相同的参与者接受多次测试?是分析几个群体?两个群体非独立样本的t检验两个以上配对测量的方差分析不是分析几个群体?两个群体独立样本的t检验两个以上简单方差分析《传播研究方法》第十四讲四、显著性差异——推论统计显著性检验步骤零假设的陈述设置零假设的风险水平(显著水平,第一类错误)选择恰当的检验统计量计算检验统计量(实际值)(SPSS)使用特定统计量的统计临界值表确定拒绝零假设需要的值(SPSS)比较实际值与临界值(SPSS)如果实际值大于临界值,不能接受零假设如果实际值没有超过临界值,零假设是最有力的解释。《传播研究方法》第十四讲五、两个群体的t检验——不同群体的均值检验独立样本t检验要求被比较的两个样本彼此独立(在任何方面都不相关),没有配对关系;要求两个样本均来自正态总体;要求研究中的每一个参与者只接受一次测试;要求均值是对于检验有意义的描述统计量;《传播研究方法》第十四讲五、两个群体的t检验——不同群体的均值检验独立样本t检验例1:下列数据是帮助老年痴呆症患者记住日常生活秩序而设计的项目中能够记住的单词的数量。群体1使用视觉教学;群体2使用视觉教学和发声训练。那么,这两个群体的记单词的量是否有显著性差异?零假设:研究假设:(双侧无方向)设置零假设的风险水平:p<.05选择合适的检验统计量(流程表)《传播研究方法》第十四讲《传播研究方法》第十四讲《传播研究方法》第十四讲《传播研究方法》第十四讲方差齐性检验(F值):零假设:两个独立样本来自方差相等的两个总体v1=v2;P<.05,说明在该水平上否定零假设,两组方差差异显著,在t检验结果中应选择“假设方差不相等”一行的数据作为本例t检验的结果数据。双尾t检验的概率为.892,说明零假设是真实的情况下拒绝零假设的可能性非常高(89.1%)!结论:p>.05,零假设成立,两组没有显著性差异。《传播研究方法》第十四讲五、两个群体的t检验——不同群体的均值检验独立样本t检验例2:使用SPSS,写一个简短报告,说明家内治疗和家外治疗两个不同群体的效果是否相同?【以一个“10点”量表测量的治疗后病例的焦虑水平】零假设:研究假设:(双侧无方向)设置零假设的风险水平:p<.05选择合适的检验统计量(流程表)《传播研究方法》第十四讲《传播研究方法》第十四讲《传播研究方法》第十四讲《传播研究方法》第十四讲方差齐性检验(F值):零假设:两个独立样本来自方差相等的两个总体v1=v2;P>.05,说明在该水平上肯定零假设,两组方差差异不显著,在t检验结果中应选择“假设方差相等”一行的数据作为本例t检验的结果数据。双尾t检验的概率为.039,说明零假设是真实的情况下拒绝零假设的可能性不足4%(3.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年合作担保:合伙人责任分配协议
- 行业洞察与趋势预测能力培养计划
- 2024年三人股权分配协议
- 2024年土地使用权租赁合同模板3篇
- 2024年度跨境电子商务合作合同
- 商务会所厨师劳务聘用协议
- 体育馆应急照明安装合同
- 商业大厦防水施工合同
- 环保监测升降机租赁协议
- 买卖学校车位协议范本
- 简明法语教程自学手册-第13课
- 220千伏线路送电方案
- 化工原理课程设计年产25 万吨苯冷却器的工艺设计
- Unit 2 Extended Reading 导学案-高中英语牛津译林版(2020)必修第二册
- 中国血液透析用血管通路专家共识(第2版)解读
- LY/T 1755-2008国家湿地公园建设规范
- GB/T 25443-2010移动式点焊机
- 政工工作制度15篇
- 跨国公司管理(人力资源管理)课件
- 大线能量焊接用钢的现状与发展讲解课件
- 供应科6S管理成效课件
评论
0/150
提交评论