社会调查中二分数据的转换与解读——以《中国青少年网瘾调查报告》中的数据分析为例_第1页
社会调查中二分数据的转换与解读——以《中国青少年网瘾调查报告》中的数据分析为例_第2页
社会调查中二分数据的转换与解读——以《中国青少年网瘾调查报告》中的数据分析为例_第3页
社会调查中二分数据的转换与解读——以《中国青少年网瘾调查报告》中的数据分析为例_第4页
社会调查中二分数据的转换与解读——以《中国青少年网瘾调查报告》中的数据分析为例_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、万方数据柯惠新,黄刚等:社会调查中二分数据的转换与解读 959以顺序级为主。通过对量表中的多个定序变量进行简擎累加,或利用因子分析等手段、,可近似计的要求较高,往往需要有很强的理沧基础,以特定的理沧概念或理论框架为指导:同时这种方法的实地访问时间较长、访问难度和访问经费也相对较高。因此,长问卷法常用于研究周期较长、经费相对充裕的学术性研究。 2短问卷法;问卷以简单的驾8增遵?瞒争霸鲁鳅攀酋墨蕴采;:穗奄馐薹夏瑜落菡&嗡灞窦堪罐搏:地区市场一上薹斡鳕西磊离瞧雒”越蚴鞋葛;喀州哮博稃固罐濞青舀坛轻警萋埽譬巷鬓篓羹蛰F囊黔象篓薷墅私疆罂;墨曼茅辇羔攀霉姜0事i巍焉嚆旭囊碡窝鲤匏市民等提供及时的蔬菜产

2、品质量状况和污染水平信息。11 2蔬菜产品污染指数的定义 假设有市场上某个时间某蔬菜产品的抽样检测数据,共抽了n个样品,其中不合格品数为工是一个 随机变量,x恰为r的概率为:Px= rl-c:矿”(1一日)7(1)其中,r =0,1,2, n;Opl,日为此二项分布的合格率,即为蔬菜产品合格率。 在给定目 的先验分布7r(日)后,根据贝叶斯公式口(日l r)=P(rl口)口(日)J0(rp)口(日)相可以算出后验分布F(日l r),由此可求得参数,即蔬菜产品合格率的贝叶斯估计值a。定义蔬菜产品污染指数如下:定义1: 蔬菜产品污染指数仃就为l与蔬菜产品合格率的贝叶斯估计值a的差即=1一a11 3

3、蔬菜产品污染指数的估计由蔬菜产 品污染指数的定义可知,先求出蔬菜产品合格率的贝叶斯估计值a,则易求蔬菜 产品污染 指数尸,。根据历史数据和专家经验等先验信息的不同,可以选择不同的先验分布对 参数进行估计。(1)先验分布为均匀分布 受Bayes假没的启发,可以利用专家经验来确定一种先验分布。如果知道p在(O,1)内,其它一无 所知,按Bayes假设取(o,1)上的均匀分布u(o,1)作为日的先验分布是合理的,假如有专家信息,可根据专家经验给出口的一个(B较保守)的下界吼,0巩1,然后把(巩,1)上 的均匀分布作为目的先验分布就更恰当、合理。定理1: 在二项分布中,若目的先验分布为U(巩,1),O

4、巩l(吼己知),则目的Bayes估计为 a:等罟舞端其中 k(n+2一r,1+r)足参数为(2)的不完全她n函数。(2 )先验分布为贝塔分布若日 的先验分布为共轭先验分布k栅分布:m(a,口),其密度函数为)4_18(a,卢) (3)口(万方数据万方数据柯惠新,黄刚等:社会调查中二分数据的转换与解读96l对多项多选题的处理也可遵此法则。把共有z项的多项多选题的每个选项均当做单独的二分变量束录人后,也可将得到的f个二分变量综合成新的定距变量S。综合的方法主要有两种:1、当m道题(或共有Z项的多项多选题)的地位平等(或者说对该概念的重要性近似时), 直接将每题(项)累加即可(每题项赋值1分):r=

5、工+五+ +L(或s=x,+置+x。);此 时,r(或s)的取值范围为0到m(或Z)。r(或s)越大,表示符合该概念特征的程度越大。2、当m道题(或共有z项的多项多选题)的地位不平等(或者说对该概念的重要性不同时),需要将各个二分变量赋予不同权重后进行累加:r=Exl+鼍+ +W:L(S=暇盖I+如+ +lxI)(表示权重,孵=l, l0m,或l0z);此时,r(或s)的取值范围为0到m(或z)。r(或s)越大,表示符合该 概念特征的程度越大。23网瘾调查中二分数据的转换 在网瘾调查中,我们结合相关理论文献,运用上述两种转换二分变量的方法,生成了下列新指标,其中x表示问卷中第i个问答题对应的(

6、二分)哑变量,x。表示问卷中第i个多项多 选题的第J个选项对应的(二分)哑变鼍。新指标l:网瘾者身份识别变量一。在网瘾调查中,我们通过阅读相关的文献,用定义综合性二分变量的方法,界定核心指标“网瘾者”身份识别变量匕的测量方法。“网瘾者,身份识别变量H=矗芸霍高:;曼主:君主1茹:。,新指标2:网瘾程度变量y2。问卷中,二项单选题形式出现的第五、第六和第七题其题面 内容基本上是并列的。它们分别从不同侧而去了解被访者是否出现与网络成瘾相联的行为和 心理态度特征。于是,采用定义综合性定距变_蕈的方法,我们构成网瘾程度指标。“网瘾程度”变昔K=x,+瓦+马 其中ly23,1分为轻度网瘾、2分为中度网瘾

7、、3分为重度网瘾。浚指标既可以作为定类变量(分为轻度、中度、重度)分析,也可以作为定距变孱(网瘾程度得分)与其他指标进行丰I 关分析或多元统计分析。新指标3:网瘾倾向者身份识别变量匕。问卷中的第八题和第九题在一定程度上可以反 映青少年有成为网瘾的倾向,但还没有真正成瘾的状态。我们同样采用定义综合性二分变量 的方法,来构建“网瘾倾向者”身份识别变量y2这个指标。“网瘾倾皑蝴识别短毪=蓁筹:葛篓羔新指标4:上网目的特征。问卷第四题是关于青少年上网行为的问题。而不同的上网行 为可以反映不同的上网目的。由此我们采用定义综合性定距变量的方法,生成两个表示不同 上网目的特征的指标L,和y42。 i娱乐性特

8、征变量K。=丘+如(0y4。3)实用性特征变县y42=墨。+五,十蜀。(oy4:3) 新指标5:网上活动丰富性。网上行为的种类数量可以反映网上活动的丰富程度。由此,我们也还用第四题生成网上活动丰富性指标,得分越高,表示从事网上活动越丰富。 网上活动丰富性变量y5=瓦+如+如+b(1匕7) 通过对二分数据的转换,我们在问卷原有的10个变量之外,新生成了网瘾者身份识别、网瘾倾向者身份识别、网瘾程度。上网目的特征和网上活动丰寓性等五个指标(6个变量)。如万方数据鹩2数璐麓诗与薷褒第瑟卷繁6辫2蝴每嚣粜说,在新指标生成之前,我们只能对网瘾用户的人翻统计特征和上网圈的及具体上网活动进褥攒漆;释么,生藏一

9、系巍激攥囊;后,我嬲囊对毒步年耀癔形成熬嚣攒教耨晌瑶素逡稽搽嚣 莉研究。3黻鑫镯壹孛:势鼗捞豹瓣读31社会调瀣巾数据解读的意义 燃计学是一收集和分析数据的科学翻艺洙。艨用于社会调鲞中的缝计学除了收集、整怒溅始菠糖资辩掺,还簧遴虫!l=对统l资辑螽形藏瓣数据送霉亍解读,簌中虢缮信塞,援讨在复杂的社会现象表象下的社会规律,为人们谯不确定愦撒下作出科学决策掇供支持。 不步统计人贸认为,怼数据进舒了缝诗分析黛,囊己的任努就基本络寐了。我钌认为,这是滋矮不够嚣。鼗据并尊炎燕藏薤蘩爨,更苓凳潮静k程餐数据如梁魏薄了骜辱骜实嚣意义, 藏投怒一一堆数字辩已,数掰的是身浇鳃不了太多簿闽题。要选敷疆窭褥谢徐值,就

10、努颓重裁辫 数攒的黼读,才能挖掘数据背后的意义。灏A勰读数据,一方掰黯嚣寻找统计以多熬嫒沧支持,对数搓联溪域瓣理象或阍题皴氆理 论谯的解释;辩一方面,镒赘缩合其健鞠荚的社忿蠛象,对数据所展现的城浆或闷趱做出常谡 性的解释,劳檄掭社会现鬻埘闽题的麓决提出钟对性的建淡。我们正魁从腿瘾的相关理论文 辩斑塞,对涮癔溅壹麓数锻避纷了深A懿分据秘辩浚,筹结音我鹫青少年鹾鹞嚣蜜壤琵,为 褫少簿戆勰题提壤,蠢参考蛰毽鹣建议。32丽瘾调餐审二分数据的分析jcf】莉述,我们转化并生成H“网瘾者”和“劂稳倾向者”身份淑别的两个新变量。按“阈稳 裁纛”瓣不弼,我翻将“弼瓣瓣”缓努免“轾凄楚瓣港“、“中囊阚藏誊”秘“黎

11、瘦疆藏者”。这撵 我们熬褥到两个综合性的=分变量和一个综合性的窳距变量(“阏瘾程发”得分)。当然,后者 在分拼中电可以按照定序菸糕定类变量来使用。逡撵,我们就将网瘾形成蟪翟分为晃弼癔颧离+瓣瘛褒辩一轻魔瓣惑一一孛度秘爨一羹整瓣蟋邋萎个获菲瓣瘾(裁掰个簖段)戮箍癔瓣麓鼹黔段,著疆考察在辫巍彩或懿零褥鼢段串, 宵步年网民在上网目的和上嘲活动特正方面的变化燃律。我们按这鬣个阶段,将被访的青少 年分为赢组(类别),翅成丁一个瓤的自变壁“隧瘾澎成过程”,分别以。E则秘静变量搬嘲上活 动率鬻性变鼙巍隧变量,避褥了方差努褥。戈网瘾倾向 辩斑鲠商“嬲楚影或避蓬”K=轻度疆戆中度阱穗 重度网瘾缨皋显示,簸乎趟癔

12、澎娥不藤瓣段l擘学步攀潮辩,蒸主题翻瓣考鬟藩麓舜(觅燕1),拦蜜 用憔鞘的上(F假为74,2醚,概值为O00;相关系数r值为一O135,概德为0ooO),贾阏瘾倾 向密襻分最高(1,230,薰发嘲_蘑菩摄低(o72);搬臻j羲性墨纳上剐好章蜉艇(F值为7,。116,瓣”蘧舞O9。0;壤曩系数,德海莰躜,薰镶海疆0:戈弼瘫睡辩簧褥势疑骶(1,ls,震爱瘸纛眷最籀5鼙)。建说骥,辩瘾形成遘器审簌乐瞧翳鹣垦逐溪壤强静戆势,实掰挂鹭麓整逐潢 下降的趋势;且姣乐性活动翱实用性活动之问的藏别在逐渐加太,分德从无网瘾倾向者的万方数据柯惠新,黄刚等:社会调囊中二分数据的转换与解读 963O05扩大歪重度两瘾者

13、的O87。 从上网活动丰富性程度看(见图2),非网瘾者从事的活动种类较为丰富,网瘾者从事的活动则较为攀一(F傻炎12。033,概蠖先ot000)。当将嘲瘾颤晦考的网络活动糖类放在一越进行诧较时发现,与研究者最初静簸设不同的是,在弼瘾形成的过程中,活动种类并不是逐渐下 降,而是有一些起伏。当用户有网瘾倾向(2+59),但还没有真正上瘾之时,网上活动的车寓性 高于无网瘾倾向者(249)和真藤的网瘾者(236)。-Vu。-150囊。一一1OOr-一一一一-一I OSOOOO0SO无襄囊鬟藏爨囊壤lIl糍痿舞囊l争寰赛囊差度嚣囊l一一一壤乐瞧嚣辩l,18l,蓐l137l138l169f-_囊用性目的l

14、+23O09o8 To,04Io,21鼷熏姓一安豫牲一OO?0。50o。ITlollO。83醴i两瘫形戒过程中上秘目的的变纯寰1网瘾形成过狸与上网目的的相关分析娱乐性爨瓣实燃健匿的娱乐一实粥108($)一135()i67($)网稳j骺成过程0000O000O000159881S98815988注:表承这舞氇8l瓣显著挂本乎;。表表达到0。岱静显著璇零平辇2虿犀篷声聪上活袭丰誊瞧辩毙较万方数据万方数据拇惠耨,赞剐等:社会调查中二分数据的转换与解读 965多种用途,特别是那些与现实生活紧密相荧的实用性网络活动。 4缝沦每讨论影响足否存在差异。对于这一问题,目前有两种观点可以进行理沦解释:一是产晶性

15、质论;另外一个是反应模式论。熄问卷法是卒土会问题调搬中常用的调奁放法,收集的数据多为二分数据,但是统计分析人 员仍然可殴扶中挖掘塞丰富蕊深入鲍馈惑。对于二分数提的挖撅翻剥用,我饲试为瑗下四个产鑫性质论获为蘩ll惹垂我援念秘囊实鑫我糍念臻拿更毒效,敬决于产瑟(筑晶簿)鳆性爱 或者方露E羔驯雾篓确;特征。zi矗han和Hong(1991)的研究认为对予在公共场合使厢的产品或者黼牌来说,理 想自 我概念对品牌选择的影响比实际自我概念更大”o:对于在私下场合使用的产品或者品牌?苦棼叁萄墙馐警融夔銎氢蔼精罂蔷雾璧 来说 。实际自我概念对品牌选择的影响比理想自我概念更大。因为当一个品牌是程公共场合霞餐最喾

16、 使赐竣嚣消费拜重,潢赞蠹羲望通过使用该产磊或晶膊来彝缝人表达鑫我;瑟当在袒对隐私的馕形下 使褥一个瑟薄辩,消费者就没霄必要告知毡入。此外,铷ester(2O)静研究发现对于功 能性产品来说,消费满会将产品形象姆真实自我概念比较;而对于象征性产品或与社会地位相 关的 产品来说,消费者则会使用理想自我概念来进行比较。艇应模式沦认为哪种自我概念鼹有效,取决于殿废模式(脯ponse M。de)。Si蝴(1985)螅醑究发溪墨消费者瓣广告孛静菸瓣凌者产晶送行谬傍时,其理想蠡我概念会毙奏实鑫我概念 更起 作用w。这是因为人类的行为受到两种基本动机的影响”,。一方面,人们总是试图去维 持和 保护原有的自我

17、概念,也就是自我维持动机:另一方面,人们义总是希望去提升自我概念, 也就怒自我提井动机。这两种动机在某些情况下则哪能会发生冲突。例如,如果一个人被要 求去谬竣禁令襄臻事物(爨魏广告孛躲品簿,毽镬霹毙会雯喜欢郄令羧搀舞鑫我形象的鑫 牌, 辩不是维持自我形象的晶牌。爨为“评价”是一种表达情感的彳予为,在评价道程中形成了 对目 桥的渴望,这时,自我提升动机将比自我维持动机在评价过程中有着更大的影响力。被评 价对象是否能将消费糟的自我形象搬升到理想状态,在很大程度上影响消费者对它的评价和 选择 。因姥,消费考会更可能喜欢女撼与理想自我概念一致的晶膊,蕊不是与真爽彭我一致鳇”菇髀。从产 品性质的角度来看,本文的研究对象高端教育产品在中国现阶段具有公欺场合使用 的性质,同时还集功能性产品和象征性产品的特性于一身,它不仅町以为消费者提供基本的使 用功鼹,其品牌个性和形象更是消费嚣表达自我的强有力工具。因此,理想自我概念

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论