第二讲-社会调查数据的分析设计、方法与工具-任强_第1页
第二讲-社会调查数据的分析设计、方法与工具-任强_第2页
第二讲-社会调查数据的分析设计、方法与工具-任强_第3页
第二讲-社会调查数据的分析设计、方法与工具-任强_第4页
第二讲-社会调查数据的分析设计、方法与工具-任强_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二讲

社会调查数据的分析设计、方法与工具任强2016年7月12日一、“问题”为导向的研究做过调查?使用过调查数据?调查数据的必要性使用调查数据需清楚些什么?非实验数据给社会科学研究提出挑战!对总体的描述也很重要——但依然有侧重点、倾向性,主要特征社会、个人的复杂性——“问题”为研究对象的必然性Gary

Marx,

1967,

《美国社会学评论》:宗教:黑人民权意识的镇定剂还是催化剂?一种观点认为信教的黑人相比不信教的黑人的民权意识要弱,因为宗教使前者超凡脱俗,而不是世俗化。一般宗教使人们更倾向于保守。另一观点认为信教黑人的民权意识更强,因为黑人的教堂是民权意识的主要传播场所,而且宗教也是普遍的人文主义价值的一个重要源泉。也可能宗教与民权意识之间根本没有关系。如何才能做出正确的判断?在黑人中做一项概率抽样调查想法:想法驱动收集数据的类型和收集的过程,等同于假设、或理论信息或数据:来自总体的概率抽样。编码、变量因变量、主要自变量、控制变量研究设计的基本要素:虚假相关:分析问题之间关系或逻辑关系:宗教和民权意识:教育部分虚假相关:分析问题之间关系或逻辑关系:干预变量:分析问题之间关系或逻辑关系:父亲教育和儿子收入:儿子教育干预变量:分析问题之间关系或逻辑关系:干预变量:分析问题之间关系或逻辑关系:抑制变量:分析问题之间关系或逻辑关系:--相加效应和交互效应:成比例和不成比例直接标准变化分析问题之间关系或逻辑关系:维度与概念分析问题之间关系或逻辑关系:标准共和党自由共和党保守民主党标准民主党维度与概念分析问题之间关系或逻辑关系:标准共和党自由共和党保守民主党标准民主党共和党民主党维度与概念分析问题之间关系或逻辑关系:标准共和党保守民主党自由共和党标准民主党保守党自由党维度与概念分析问题之间关系或逻辑关系:标准共和党标准民主党保守民主党自由共和党党派忠诚分子中间分子比较是核心研究设计问题:例子:研究护理人员,因为有一个护理人员样本研究大学生,因为有一个大学生样本等等。。。。问题是什么?面临的问题是不能够研究一个常量!这种情况下,结论都是暗含着参照组的,但往往是错误的结论。二分比较很敏感——任何因素都可能解释此差异。小规模比较——证明相似性比差异性更有帮助。社会科学研究:不同时点、空间都不同,其他地方发生的可以验证是否在其他地方也存在(一般现象而非特殊现象)谢氏三原理/谢三条研究设计问题:变异性原理社会分组原理社会情景原理总体分组、总体和历史时期研究设计问题:为了判断一组预测变量

和某个结果变量

之间的关系是否在某一总体的所有分组中都存在,或者组间是否存在差异,我们估计三个预测方程

某些跨时期比较对估计问题很敏感研究设计问题:不同时期之间的数据可能不独立!类别与想法吻合,且类别相互排斥研究设计问题:研究问题:留守少儿与其他孩子的区别?留守少儿为什么与随迁少儿相比?迁移社区环境?真正能做因果推断的是如何比较的?来源:Ren,Qiang,andDonaldJ.Treiman.2016.“ConsequencesofParentalLabourMigrationinChinaforChildren’sEmotionalWellbeing”,SocialScienceResearch,Vol.58:46-67.类别与想法吻合,且类别相互排斥研究设计问题:来源:Ren,Qiang,andDonaldJ.Treiman.2015.“LivingArrangementoftheElderlyinChinaandConsequencesforTheirEmotionalWell-being.”,ChineseSociologicalReview,Vol.47(3):255-286.类别与想法吻合,且类别相互排斥研究设计问题:自然实验研究设计问题:Almond,

2006,

“胎原学说”多层分析研究设计问题:内生性、样本选择偏误及其它影响正确因果推论的因素研究设计问题:干预效应:如助产士被安排在健康情况最差的农村,在对助产士对健康的影响的评估会因没有控制这种非随机指派而产生有偏估计。解决方法是测量所有可能影响结果的变量——是不可能的。工具变量回归、样本选择偏误、Heckman选择模型、匹配、倾向分匹配等等。结构方程模型研究设计问题:缺失值问题多重填补法研究设计问题:合理使用多重填补法的基础是对缺失值的合理假设,即被填补变量的缺失值是“随机缺失的”(missingatrandom,MAR)(Rubin,1987;Little等,2002)。也就是说,某一模型中控制了其他变量之后,存在缺失值变量的真实值与缺失值之间不存在相关关系。

多重填补法研究设计问题:例子:存在较多缺失值的“与子女亲近程度”变量。在1362个缺失值中,有182个是没有存活孩子。一种可能性是与子女根本没有往来的老人在访员或其他人面前出于“面子”而不愿意回答此问题。虽然没有直接方法评估这种猜测是否可能,但是可以采取间接方法测试:如果没有回答亲近程度问题的老人与那些回答了此问题的老人相比明显地幸福感较低、对生活不满意、抑郁程度严重,我们可以基本推测“与子女亲近程度”变量的缺失值可能反映了不与子女亲近的情况。鉴于这种猜测,下面会看到,与子女亲近程度与老人的幸福感和满意度呈正相关,与抑郁程度呈负相关。

结果显示那些没有回答“亲近程度”变量的老人幸福感、满意度较强,抑郁程度较低。因此,我们得出结论与子女亲近程度不高的老人不太可能回答“亲近程度”问题的猜测是不成立的。因为我们没有其他有关此变量不是随机缺失可能性的假设,我们将它视作随机缺失,并对缺失值运用多重填补法。

虽然抑郁程度变量的系数统计上不显著,但方向是负的。缺失值问题多重填补法研究设计问题:用抑郁得分、居住方式、性别、年龄、住房是否困难、家户人数、城镇还是农村、农业/非农业户口、是否有当地户口、家户中成年劳动力数量(18-59岁)、家户中成年男性劳动力数量、家户中成年人(18以及以上)的平均年龄、家户中成年人的平均受教育年数、是否有劳动力外出和汇款(3分类)、区域-居住地变量(3分类)、是否有躯体障碍、是否在婚、是否丧偶、是否有家庭产业、识字水平、存活子女数、以及性别与婚姻交互项、性别与丧偶交互项等变量

概率抽样的重要性研究设计问题:只有知道总体中每个个体入样的概率,统计推论的原则才适用。许多研究违背此原则,抽取“方便的”或“随意的”样本。“有代表性的”地点样本不能代替概率样本。为设计一个能推论到研究总体的样本付出额外代价是非常值得的。超总体研究设计问题:将结论推论到总体之外。如截面数据。汇合多次调查数据当超总体概念可以被合理接受时,可以将多次截面数据回合使用。——所研究对象不随时间变化。如果有随时间变化的变量,可以加入虚拟变量,用交互项的设计进行研究。养成良好的专业素养研究设计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论