社会研究中的测量_第1页
社会研究中的测量_第2页
社会研究中的测量_第3页
社会研究中的测量_第4页
社会研究中的测量_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 社会研究中的测量本章将介绍社会研究中的测量,即掌握测量不同尺度、概念、变量和指标的区别和联系。第一节 测量的概念与过程一、测量的概念从某种意义上说, 测量是人们通过对现实世界细致的系统观察而把握某种现象存在程度的过程。 例 如,人们通过观察去把握一件物体的大小,用手去试试水温, 用尺子去丈量长度等等都是测量。 在人们 的日常生活中,测量是一种经常发生的行为,有时它甚至能决定人们该做些什么。测量在很大程度上构成了自然科学研究的基础, 许多科学研究都离不开借助测量工具进行的测量活 动。例如,生物学家借助显微镜观察微生物和细胞,天文学家用望远镜进行天体观测,等等。(简答题)测量活动在日常生活

2、和科学研究中都具有重要的作用: 第一,测量可以使人们客观和精确的把握各种自然现象和社会现象存在的状况。第二, 测量工具通常比人的感官更敏感, 因此通过一定工具而进行的测量往往比仅靠人自身感觉的 测量要精确得多。第三, 通过对自然和社会现象的测量,有时候还可以发现一些未知的物体和现象。 例如,一定的测 量工具可以帮助人们看到磁场这种用肉眼无法看到的东西。第四, 靠一定标准化工具测量的结果不会随特定观察者而变化。例如, 用磅砰称女儿的体重,决不 会因为爸爸力气大,女儿就轻些,妈妈力气小,女儿就变重了。第五, 测量还能帮助人们观察非物理世界的存在。例如, 在日常生活中, 你可能会听到朋友夸你的 女儿

3、很聪明,你的妻子很漂亮,批评你的生活态度太消极,对老板存有偏见等。关于社会和自然的测量分别针对不同的对象, 一个是物理现象, 另一个则是社会现象, 由此在测量 方法和工具上,存在着许多不同。社会研究者的工作要比自然科学家困难一些。(简答题:试述社会测量是一种科学测量。)与日常生活中的测量相比,社会测量更接近自然科学 测量,也是一种科学测量,它具备一切科学测量的基本要素。首先,它是按照一定程序的系统测量,每 一步都有详细的记录,是可重复的、客观的和能被检验的。其次,它不仅有明确的目的,而且还是在一 定理论背景下发生的。最后,它有精心设计的测量工具, 特别是有针对类似偏见这样的非物理存在, 发 展

4、出了特殊量表工具。社会测量中, 与自然科学测量最接近的是定量测量, 即针对表示某种社会属性的概念, 构造出相应 的测量工具,对之进行经验观察,并以数字形式表示观察结果。例如,在社会调查中,对于性别这一社 会属性,就可以用问卷对其进行测量,并以数字 1和 2 分别代表男性和女性。此外,社会研究中还有定 性测量,这方面的内容可进一步参考有关定性研究方法的书籍。二、测量过程(简答题)测量过程包括三个步骤:首先, 要把测量对象以概念形式表示出来, 或者说对测量对象形成概念化认识, 这就是“概念化” 过程;其次,针对需要测量的概念,构造相应的测量工具,这属于“操作化”的内容; 最后,用测量工具对测量对象

5、进行经验观察,这是“资料收集”的任务。 在社会测量过程的第一步是对测量对象形成一定的概念。例如, 要测量经济发展、 贫困程度等方面的情况,就应该首先有“经济增长率”、“贫困发生率”等概念。在社会测量过程的第二步是对概念进行操作化加工, 将它们变为可测量的变量。 先是将概念操作化 成指标,然后再将指标设计成在调查中可以用语言表达的提问。例如:举办奥运会在测量过程中, 另一项工作是相伴而行的, 这就是测量质量并进行评估, 即根据一些标准来判断对 社会现象的测量是否成功。 测量的成功与否, 主要靠信度和效度两项技术性指标来评判, 所谓信度是指 使用相同测量工具重复测量同一个对象时, 得到相同研究结果

6、的可能性, 指的是测量的可靠性; 而效度 则是指测量工具在多大程度上反映了概念的真实含义,指的是测量的准确性。第二节 概念化与操作化概念化和操作化是测量的两个关键环节, 前者对概念进行名义定义, 从理论层次对概念的含义加以 说明;后者对概念进行操作定义,从经验层次形成测量概念的工具性指标。一、概念化概念化是社会测量的第一个环节, 是对概念的含义和应用范围给予清晰说明的过程, 即在理论层次 上对概念进行名义定义。(简答题)之所以要进行概念化,主要出于以下两个原因:首先, 概念是人们主观上对同一类事物或现象的抽象概括。在日常生活中, 用来指称事物的概念的含义经常是模糊不清的。 例如: 说“某人有文

7、化”,其中“文化”概念的含义就不够清晰,既可以理解为这个人是识字的,也可以认为他受过良好的教育。其次,有些测量对象纯粹是一种理论建构。如智商、偏见、失范和异化等。但在现实中,又观察不 到明确的对应物,也就是说,它们的存在本身就是一种概念定义。在社会测量中,概念的抽象程度是不同,有些概念比较具体。如性别、年龄、婚姻等。反过来,有 些概念则比较抽象和隐晦。如社会阶层、偏见、同情心、士气等。例如: 一个鞋厂是怎么销售鞋子的。 当他想打通一个渔岛的市场时, 先派了销售部门的经理去渔岛 作考察。一周后销售部门经理给总部发回电报,称那里没有市场, 渔民都不穿鞋。 销售部门经理回到工 厂后被撤职。第二次又派

8、了一营销人员去做调查, 营销人员一周后发回电报,说这里是一个市场,渔民 长期不穿鞋捕鱼, 我们可教会他们穿鞋。 第三次派了营销部门经理去做调查, 销售部门经理一周后发回 电报, 说这里是一个潜在市场, 我们可以告诉他们穿鞋对身体的好处, 而且这里盛产香蕉, 我们可以购 买他们的香蕉,从而使他们有钱来买我们的鞋子。对于比较抽象复杂的概念, 必须先弄清楚概念各个层面的具体含义, 然后再对概念按顺序地进行定 义。另外还要注意,越是抽象概念,越容易对概念的定义产生歧义。二、操作化1. 操作化的意义把概念抽象的名义定义进一步具体化, 使其转化成能从经验上进行观察和测量的变量和指标, 这个 过程通常被称为

9、操作化。通过操作定义, 概念转换为变量形式, 即转变成了能有不同取值的概念。 可以直接观察的变量又称 为指标。变量和指标并没有实质性的区别, 都是从经验层次上对概念含义的说明, 只是综合层次略有差别而 已。研究者在研究设计时,更多地使用变量这种说法。在测量领域中,则更多地使用指标这一说法。例如: 磨坊玩具的销售。是几个同窗好友相会,然后在无意中发现好友家有张图,最后就购买了这张图,申请了专利,一段时间后,磨坊就投放了市场,得到了盈利。由概念到指标, 是一个从抽象到具体的过程, 因此, 每一个概念都可能会有不止一个指标与之相对 应。例如, 对于文化程度这样一个简单的概念来说, 就可以用“受教育的

10、年数”和“取得毕业证书的等 级”两种指标来表示。在这种情况下,就需要一个择优规则来决定哪些指标更能代表概念。2. 测量层次在量化测量中, 测量指标的精确度是用测量层次来衡量的, 按精确度由低到高, 测量分为定类测量、 定序测量、定距测量和定比测量四个不同的测量层次。(1)定类测量:是根据属性的不同对人或事件进行分类。例如,您当前处于何种婚姻状态?答案 可能会是“未婚”和“已婚”。在调查问卷或表格中可以用 1表示“未婚”, 2 表示“已婚”。(2)定序测量:不仅对属性进行分类,而且还根据属性强度的不同对人或事件进行顺序排列。 例如,您的健康状况如何?答案可能会是“非常好”、“不错”“尚可”或“不

11、好”。可用 1 和、 2、 3 、 4 来表示。(3)定距测量:是以相等的固定间距来确定属性强度的实际距离。摄氏温度、标准化智力测验属于定距测量。(4)定比测量:是在确定了间距数字后,通过确定有实际意义的零点,将属性强度间的比例关系 用间距数字间的比例关系表示出来。如收入、年龄都符合定比测量的要求。表6-1几种测量尺度的比较尺度特征疋类测量定序测量定距测量定比测量分类(=M)VVV次序( V )VVV距离(+)VV比率(X -)V第三节指数与量表一、指数与量表的概念在日常生活中,如果你听到朋友夸某个女电影明星:“太漂亮了”,但你恰好没看过她演的电影, 那你就很难想像出她究竟漂亮到什么程度。因为

12、漂亮是个很抽象的概念。气质与漂亮一样,也是一个很抽象的概念,说某人气质好,往往是从这个人的谈吐、仪表、待人接物、修养造诣等多方面得出的印象。将“气质”所包含的各个方面的情况加以分别测量,然后将各方面测量的结果综合起来,最后用一个统一的分数来表达一个人的气质。在实际的社会测量中,量表就像一把有刻度的尺子一样,用来测量人们某种社会现象的态度、意愿以及某种社会特征存在的程度。例如,当需要测量人们对某一事物是否赞同的时候,可以采用一个五级量表:1=完全赞同 2 =比较赞同 3=无所谓 4 =不太赞同 5=完全不赞同在实际测量中,由多个指标构成的指标群,通常被整合为某种指数。量表和指数都是对抽象概念进行

13、复合测量,即基于一项以上资料的测量。虽然量表测量得到的是从小到大的连续分值,但从测量层次看,量表测量仍属于定序测量层次, 因为量表得分之间不存在标准等距。例如,在漂亮的测量中,你心目中7分和8分的差别。同样的理由,指数测量也应该属于定序测量层次,但是,在实践中,许多研究者从便于统计分析的角度考虑,都将指数测量作为定距测量或定比测量层次的测量来使用。最后,从使用频率看,指数比量表运用得更加频繁。二、建立指数(简答题)指数的建立包括以下几项技术:首先,选取指标的方法,这需要对指标进行表面效度检 验和相关性分析;其次,对指标分值进行加权的技术;最后,处理缺失值的方法。1. 指标的选取,建立指数的第一

14、步是选取符合标准的指标。2. 指标的加权,在按一定的标准选定指标后,进一步要考虑每个指标在指数构成中的分量如何,也就是考虑加权问题。加权是给指数中的某些重要指标赋予特殊的分量。假定你对大学综合质量感兴趣,希望构造一个大学综合质量指数。你分别从重点、非重点和大专院校中挑选了三所大学进行调查研究,最后决定采用6个指标来代表大学的综合质量。表 6 2 ( P111)3. 处理缺失值几种处理缺失值的常用方法。3%5%之间,可以考虑删除那些含有缺失值的被第一,如果数据中缺失值占的比重不大,如在访者。第二,如果指数有多个指标,可以考虑用已有数据的平均值来代替缺失值。第三,在大样本和指标较多的情况下,还可以

15、用随机方法给缺失值赋值。三、量表的类型 量表主要用来测量人们的感觉或主观判断, 它的测量逻辑是假定有相同主观感觉的人, 会在一个由 弱到强的连续线段的相同位置,标出自己的感觉。应用范围较广的李克特量表和语义差异量表。1. 李克特量表美国心量学家李克特在 20世纪 30分代,将答案从两种选择扩展成了 4种:“非常同意”、 “同意”、 “不同意”、“非常不同意”。清楚的顺序回答形式,是李克特量表最大的优点。如:(1)对“社会研究方法”这门课的教学质量,你的总体评价是:优秀 良好 一般 较差 很差( 2)总的说来,我经常觉得自己是个失败者。总是这样 常常这样 有时这样 很少这样 从未这样 (3)您对

16、飘柔洗发水的感觉是:很不喜欢 比较不喜欢 稍有不喜欢 稍有喜欢 比较喜欢 很喜欢 李克特量表可以在很多不同的场合和情况下使用, 针对不同的陈述内容, 答案的用词有所变化。 答 案类别应保持在 48 个之间,最好能包含类似“不知道”、“未决定”和“没意见”等中性类别。在实际测量中,一般总是针对某个议题的不同层面,设计出不同的陈述,分别用李克特量表进行 测量。 然后将每一个陈述的测量得分进行加总,用加总后的综合得分, 来代表对该议题的测量结果。 这 种形式的测量又被称为李克特总加量表,简称为总加量表或李克特量表。2. 语义差异量表语义差异量表是 20 世纪 50 年代发展出来的, 主要用来测量人们

17、对观念、 事物或他人的感觉。 由于 人们通常愿意用形容词来描述自己的感觉,而形容词又多具有反义词,如好与坏、慢与快、多与少等。 因此, 以形容词正反语义为基础建立的量表, 被称为语义差异量表。从语义上看, 形容词大致分为三大 类:评价(好与坏)、力度(强与弱)和行动(主动与被动),其中,最经常使用的是评价。例如,在 市场研究中, 了解消费者对某种产品的感觉; 在精神治疗中, 判断病人如何理解他自己; 在舆论调查中, 了解大众对某项公共议题的看法。表 64( P124)第四节 测量质量的评估一、信度 信度是指使用相同指标或测量工具重复测量相同事物时,得到相同结果的可能性。 社会研究中常用的几种信

18、度:1. 再测信度再测信度又称为稳定性信度, 是用同一种测量工具, 在两种不同场合对同一群受试者前后测量两次 所得到结果的一致性程度。 就同一个问题先后在不同的场合对他们进行两次测量, 然后计算两次测量分 数的相关系数, 相关系数越大, 说明两次测量的一致性程度越高。 相关系数反映的是测量分数的稳定性 程度,故称为稳定性信度。再测信度是最简单、 最直接评估信度的方法。 如幼儿园希望了解儿童口头表达能力, 分别在 5 月和 7 月,进行了两次内容相同的测试。如果这个测试是可靠的,或者说具有再测信度,两次测试结果应该 是接近的,即在 5月份得分低的孩子在 7 月份得分仍然低,高的也仍然高。2. 复

19、本信度 复本信度是在一个测量中采用两个或两个以上的复本来对同一群研究对象进行测量时所得到结果的一致性程度。例如对同一班的学生在某门考试中采用AB卷,如果学生们不论做 A卷或B卷所得到的分数都大致相同的话, 那这两套题的复本信度就较高。 复本信度是等值性信度的一种, 它比再测信度的 工作量大, 因为同一个测量工具要构建两个完全等值的复本, 两个复本要包含相同数量、类型、 内容和 难度的题目。3. 折半信度 即只用一个测量工具对同一组一群受试者实施一次测量,但将奇数题和偶数题分开计分, 再计算奇数试题和偶数试题分数之间的相关系数,即所谓的折半信度。根据斯皮尔曼布朗公式:例如,你设计了一份有 10

20、个问题的问卷,来测量人们对女性歧视的看法。你计算出的折半信度为于是,整个测试的实际信度为:折半信度虽然能克服构造复本的困难, 但也有着内在的不足之处, 因为没有一种理论推导严格证明 其有效性。 特别是对同一组问题, 可能会有多种组合方式, 从而使得对折半信度的计算带有一定的随意 性。例如, 对女性歧视的看法的问题中, 你既可以按奇偶数将 10 个问题分为两组, 也可以从 10 个问题 中随机地抽出 5 个进行分组。二、效度效度是指测量工具能够测出其所要测量的特征的正确性程度。 效度越高, 即表示测量结果越能显示 其所要测量的特征。 例如,大学考题基本不会用 100 以内的加减法问题来测量大学生

21、的数学能力。 与计 算相关系数来测定信度不同, 效度无法进行客观计算, 只能通过主观评估, 下面介绍社会研究中常用的 表面效度、内容效度和效标效度。1. 表面效度 表面效度是指测量结果与人们头脑中的印象或学术界形成的共识之间的吻合程度,如果吻合程度 高,则表面效度就高。表面效度虽然是最容易评估、也是最基本的效度类型,但它并没有被学术界广泛接受, 一方面, 是 因为它的评估比较容易受到测试者个人因素的影响, 另一方面, 除了一些极端情况以外, 在实际测量中 采用的每一种测量方法, 或多或少总有一些表面效度。因此, 很难判定哪个测量不具备表面效度,这样 也就无法有效地运用表面效度来评估测量质量了。

22、2. 内容效度内容效度是指测量在多大程度上涵盖了被测量概念的全部内涵。 例如,在“社会阶层”这个概念的 定义中,通常包含教育程度、收入程度与职业等数个层面。又如,一份测验英语能力的试卷,如果只有 语法、 词汇和阅读的测试项目, 就不能说它具有较高的内容效度, 因为该试卷还缺少听力和写作的测试 项目。内容效度的测定也是通过主观判断来实现的, 但由于有概念定义作为客观依据, 因此, 随意性比表 面效度小。3. 效标效度效标效度又称准则效度, 是指测量结果与一些能够精确表示被测概念的标准之间的一致性程度。 又 可将效标效度分为预测效度和同时效度两种类型。预测效度是指测量结果与测量对象在一段时间以后的表现 (预测标准) 之间的相关程度, 相关程度 越高,则预测效度也越高。例如,为了评估某项大学生学习能力测试的预测效度,可以在新生入学时, 选取一些大学生进行测试, 获得他们学习能力的分数; 然后经过一学期的学习, 对这些大学生的学业成 绩和表现做出评估,通常以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论