第6讲信息技术与研究方法-16210514218_第1页
第6讲信息技术与研究方法-16210514218_第2页
第6讲信息技术与研究方法-16210514218_第3页
第6讲信息技术与研究方法-16210514218_第4页
第6讲信息技术与研究方法-16210514218_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第6 6讲讲 信息技术与研究方法信息技术与研究方法本讲提纲v科学研究和研究方法科学研究和研究方法v信息技术在社会科学研究中的应用信息技术在社会科学研究中的应用v基于信息技术的研究方法实例基于信息技术的研究方法实例v数据挖掘技术简介数据挖掘技术简介引言研究性学习1 科学研究与研究方法科学研究与研究方法-什么是研究? 凡运用科学方法产生新知识的具有创造性或创新性的活动叫科学研究。-联合国科教文组织什么是研究方法? 在科学研究过程中收集、整理、分析数据和呈现结果的手段和方法称作研究方法。研究的分类研究自然科学研究数学物理社会科学研究社会学政治学自然科学研究中的研究方法1计算2实验3模拟4社会科学中

2、的研究方法研究方法量化研究方法实验准实验问卷调查质化研究方法文本分析访谈量化研究方法v所谓量化研究,系指资料为数字形式之实证研究所谓量化研究,系指资料为数字形式之实证研究(Keith, 2005),它是探究事物的量的规定性的),它是探究事物的量的规定性的认识活动,主要用数位、符号、图表、数学语言认识活动,主要用数位、符号、图表、数学语言来表达、解释、说明教育现象的数量特征、数量来表达、解释、说明教育现象的数量特征、数量关系和变化规律(温忠麟、邢最智,关系和变化规律(温忠麟、邢最智,2001)。)。v通常采用通常采用实验法实验法、准实验法准实验法和和问卷调查法问卷调查法。量化研究示例调查问卷分析

3、结果總的來說,我很喜歡這個遊戲9.9%44.6%31.0%9.4%5.2%0.0%10.0%20.0%30.0%40.0%50.0%非常同意同意一般不同意極不同意分析结果质化研究方法v所谓质化研究,系指以研究者本人作为研究工具所谓质化研究,系指以研究者本人作为研究工具,在自然情境下,采用多种资料收集方法,对研,在自然情境下,采用多种资料收集方法,对研究现象进行深入的整体性探究,从原始资料中形究现象进行深入的整体性探究,从原始资料中形成结论和理论,通过与研究对象互动,对其行为成结论和理论,通过与研究对象互动,对其行为和意义建构获得解释性理解的一种活动(陈向明和意义建构获得解释性理解的一种活动(陈

4、向明,2000)。)。v通常采用通常采用访谈访谈、观察观察、文档分析、录像分析等手、文档分析、录像分析等手段进行。段进行。质化研究示例访谈提纲分析结果2 信息技术在科学研究中的应用信息技术在科学研究中的应用-信息技术在科学研究中可能的应用数据收集数据整理数据分析结果呈现撰写报告SPSS社会科学统计软件包vSPSS (Statistical Product and Service Solutions)v可以进行统计描述(平均值等)、相关分析、可以进行统计描述(平均值等)、相关分析、方差分析等各种分析方差分析等各种分析v在社会科学、自然科学、医学等各个领域应用在社会科学、自然科学、医学等各个领域应

5、用甚广甚广SPSS工作界面变量视图资料视图资料登录SPSS推荐教材vSPSS for Windows 统计分析(第统计分析(第3版)版)v作者:卢纹岱作者:卢纹岱 v电子工业出版社电子工业出版社Nvivo质化研究分析软件vNVivo 是澳洲是澳洲 QSR 公司发行用于质性研究分析公司发行用于质性研究分析的软件。它通过一个强大的智能应用程序将质的的软件。它通过一个强大的智能应用程序将质的分析和观察带到了一个全新的层面。能够帮助研分析和观察带到了一个全新的层面。能够帮助研究者管理、定型和分析几乎任何语言的任何信息究者管理、定型和分析几乎任何语言的任何信息,它能提供世界上最广泛的研究分析方法。,它能

6、提供世界上最广泛的研究分析方法。Nvivo主界面Nvivo推荐教程vNVivo帮助手册帮助手册网络调查研究方法v所谓所谓“网络调查法网络调查法”(Web Survey,Web-based survey, E-survey, Internet Survey,等,等等),即以各种基于互联网的技术手段为研究工等),即以各种基于互联网的技术手段为研究工具,利用网页问卷、电子邮件问卷、网上聊天室具,利用网页问卷、电子邮件问卷、网上聊天室、电子公告板等网络多媒体通讯手段来收集调查、电子公告板等网络多媒体通讯手段来收集调查数据和访谈资料的一种调查方法。数据和访谈资料的一种调查方法。v网络调查法主要分为三大类

7、:网络调查法主要分为三大类: E-mail调查、 网页问卷调查(Html Form) 下载式交互程序调查(downloadable Interactive Survey Application)网络调查示例网络调查研究方法的特点v调查反馈的调查反馈的快速性快速性v研究设计的独特性研究设计的独特性v调查过程的互动性调查过程的互动性v调查时间的灵活性调查时间的灵活性v问卷设计功能的问卷设计功能的多样性多样性v调查问卷和过程的可视化调查问卷和过程的可视化v有效降低人工编码和录入有效降低人工编码和录入误差误差v减少访谈员的干扰减少访谈员的干扰v能够快捷地实施能够快捷地实施跨国跨国调查调查网络调查系统示

8、例计算机实验方法v计算机实验方法计算机实验方法,简单地简单地说就是把表征实际系统说就是把表征实际系统的计算的计算(或称或称“数学数学”) 模型在电子计算机上进模型在电子计算机上进行运行行运行, 以期通过对这种以期通过对这种运行过程和结果的研究运行过程和结果的研究来达到对实际系统规律来达到对实际系统规律性的认识性的认识系统定义建立数学模型设计计算机模型运行计算机实验结果分析计算机实验方法在社会科学研究中的应用v经济模拟经济模拟v历史模拟历史模拟v社会模拟社会模拟v战争模拟战争模拟v电子股市v阿瑟和荷兰德通过在计算机中创建一个阿瑟和荷兰德通过在计算机中创建一个人工股市人工股市,来回答金融领域中使人

9、们困惑了几十年的一系,来回答金融领域中使人们困惑了几十年的一系列问题。列问题。v对于这个电子股市,人们可以通过操纵交易人的对于这个电子股市,人们可以通过操纵交易人的策略、股市参数以及所有其他在实际交易中不能策略、股市参数以及所有其他在实际交易中不能做的事情来扮演上帝。做的事情来扮演上帝。密执安宏观经济分析模型v根据计量经济理论,使用反馈控制技术建立起来根据计量经济理论,使用反馈控制技术建立起来的大规模非先行随机模型,的大规模非先行随机模型,v经济学家不仅利用它能够分析、评价美国政府过经济学家不仅利用它能够分析、评价美国政府过去的经济政策,更重要的是它还能评定、修改和去的经济政策,更重要的是它还

10、能评定、修改和制定现在与将来的政策。制定现在与将来的政策。历史模拟实验v苏联历史学家选择了古希腊伯罗奔尼撤战争时期苏联历史学家选择了古希腊伯罗奔尼撤战争时期(公元前公元前431404 年年) 希腊奴隶制社会作为课题,希腊奴隶制社会作为课题,进行历史社会过程的模仿性模拟实验。进行历史社会过程的模仿性模拟实验。v他们把残缺不全的数字材料组成一个系统,用语他们把残缺不全的数字材料组成一个系统,用语言编制这一历史过程的数学模型,在电子计算机言编制这一历史过程的数学模型,在电子计算机上模拟被研究过程,实验所得出的数字校正了过上模拟被研究过程,实验所得出的数字校正了过去关于军事开支、居民所占有的奴隶数目等

11、方面去关于军事开支、居民所占有的奴隶数目等方面的材料。的材料。3 基于信息技术的研究方法实例基于信息技术的研究方法实例-例一:计算机与红楼梦研究计算机应用于文艺作品的起源v七十年代中期,英国剑桥大学的两位师生因运用七十年代中期,英国剑桥大学的两位师生因运用计算机侦破伪造计算机侦破伪造莎士比亚莎士比亚的奇案而震动了西方文的奇案而震动了西方文学界。学界。v他们对一家出版商出版的莎士比亚新作品,用计他们对一家出版商出版的莎士比亚新作品,用计算机对它的修辞和结构进行分析和比较。发现莎算机对它的修辞和结构进行分析和比较。发现莎士比亚一向不采用的修辞和用语出现了,句型和士比亚一向不采用的修辞和用语出现了,

12、句型和结构也同惯用的方法不一样。由此向法院起诉并结构也同惯用的方法不一样。由此向法院起诉并胜诉。胜诉。v这项研究成果引起了国内外学者的重视,纷纷利这项研究成果引起了国内外学者的重视,纷纷利用计算机来分析研究别的古典文学作品,导致计用计算机来分析研究别的古典文学作品,导致计算机闯进算机闯进“红学红学”研究园地。研究园地。 计算机应用于红学的尝试v1980.6 美国学者陈炳藻先生宣读了一篇美国学者陈炳藻先生宣读了一篇从词汇从词汇上的统计论上的统计论红楼梦红楼梦的作者问题的作者问题。v1986年,陈教授发表了年,陈教授发表了电脑在文学上的应用:电脑在文学上的应用:红楼梦红楼梦与与儿女英雄传儿女英雄传

13、两书作者用词的比两书作者用词的比较较。之后发表了。之后发表了电脑红学:论电脑红学:论红楼梦红楼梦作作者者。v主要利用词频分析推论出红楼梦前八十回和后四主要利用词频分析推论出红楼梦前八十回和后四十回同一作者。十回同一作者。探讨怡红夜宴图程序v彭昆仑等人用计算机定量研究彭昆仑等人用计算机定量研究红楼梦红楼梦版本来版本来解决一些疑难问题,成功地运用计算机程序模拟解决一些疑难问题,成功地运用计算机程序模拟出具有深刻艺术韵味的出具有深刻艺术韵味的“怡红夜宴图怡红夜宴图”。寿怡红群芳开夜宴红楼梦多功能计算机自动检索系统v1985年以来,深圳大学研制成功年以来,深圳大学研制成功红楼梦红楼梦多功多功能自动检索

14、系统。能自动检索系统。v利用它得到许多精确数字:利用它得到许多精确数字: 如红楼梦全书的精确字数是731017个; 书中使用不同的汉字4462个,使用最多的是“了”,达21176次; 全书有1623个不同的四字格成语,用得最多的是“不在话下”; 书中采用了二十四种修辞手法,用得最多的是“比喻”,共408条。你有什么感想?例二:网络游戏参与者动机研究研究背景和目的v希望希望对玩家的亲身感受进行深入分析,对玩家的亲身感受进行深入分析,v力求揭示和归纳出人们参与网络游戏的真实动机力求揭示和归纳出人们参与网络游戏的真实动机,v以便将来能够有的放矢地应用到教育游戏的设计以便将来能够有的放矢地应用到教育游

15、戏的设计和和开发中。开发中。 研究设计研究材料 v新浪网在新浪网在20042004年年7 7月举月举办了办了“健康玩家健康玩家 健康健康游戏游戏”大型有奖征文大型有奖征文活动活动。v在首页推荐了在首页推荐了100100多篇多篇文章文章,并分为了支援,并分为了支援、中立和反对三类。、中立和反对三类。v本文从每类文章中随本文从每类文章中随机选择了机选择了1010篇,共篇,共3030篇文章作为研究材料篇文章作为研究材料。 研究设计研究方法v本文首先采用量化研究中的本文首先采用量化研究中的词频分析方法词频分析方法(Word Frequency Analysis) 使用CSW分词组件,结合VB和Acce

16、ss数据库实现。v然后采用质化研究中的文本分析方法然后采用质化研究中的文本分析方法(Textual Analysis) 使用Nvivo进行编码和分析。 研究设计研究过程v词频分析方法和内容分析方法实际上是词频分析方法和内容分析方法实际上是交替进行的。 首先进行了初步的词频分析,将重要的相关的词根据出现次数进行排序; 然后在这些词的启示下,对文章进行编码、整理和分析; 在文本分析的过程中,我们又根据分析的初步结果,对出现的词进行分类汇总,进行二次词频分析。 词频分析结果 v表表1 出现频率排名前出现频率排名前20位的词位的词排名词次数排名词次数1自己18811喜欢272玩17012梦273生活1

17、0313社会244世界8614练级245朋友8315娱乐216人生5516角色197快乐5317真实188一起4318乐趣189虚拟2719同学1810需要2720兄弟17文本分析结果 v休闲娱乐动机休闲娱乐动机 游戏带给了我们什么?我们每天工作学习,在这之余我们还需要休息,睡觉是身体上的休息,而游戏可以说是精神上的休息了。 v社会交往动机社会交往动机 于是时常孤独的我开始在另一个世界中寻找自己的朋友。 v成就动机成就动机 当我高呼“天下纷争,舍我谁争”后,我建立了一个又一个的帮派,成为了万人之上的霸主,受万人的敬仰 v权力动机 为了在所在的伺服器里称霸,为了不受欺负,我在不惜一切代价的去练级

18、、做任务,得到最好的装备 文本分析结果v逃避与刺激动机逃避与刺激动机 痛苦源自于生活,在网路中寻找快乐是我的天性 v角色扮演动机角色扮演动机 发现在这个网路游戏里面我可以扮演一个我想扮演的角色,在里面没有年龄的界限,没有现实生存的压力 v深层动机 为了知道后面的剧情,我每日每夜的练习,努力加快打字速度 v其他动机 在游戏带给人愉悦之外,还给人传输了许多知识,有趣味的智力游戏开发了玩家的智力 词频分析结果 v表表2 词频分类汇总结果词频分类汇总结果类别包括词次数休闲娱乐玩 快乐 娱乐 玩着254社会交往兄弟 MM 朋友 聊天 交流 一起 同学198成就或权力自己188成就梦 练级 英雄 升级 装

19、备 等级 梦想 成功 实现131深层兴趣美好 画面 任务 乐趣51角色扮演角色 人物 RPG49逃避刺激杀 疯狂 PK 战 44权力拥有11讨论和结论v表表3 网络游戏玩家参与动机网络游戏玩家参与动机动机说明休闲娱乐动机满足人们身心放松、休闲娱乐的需要,可分为如下几种: 放松 快乐社会交往动机满足人与人交往的需要,可分为如下几种。 交流,情感,结交朋友,群体归属,合作,竞争,利他,自尊成就动机满足人们争取成功,实现自我的需要。权力动机满足人们希望影响或控制他人且不受他人控制的需要,可细分为如下几种。 影响, 控制角色扮演动机满足人们希望扮演另一个角色,以便体验另一种人生,更好的认识自我、想象自

20、我的需要。逃避与刺激动机满足人们逃避现实、发泄压力、追求刺激的需要,可细分为如下几种。 逃避, 发泄, 刺激深层动机满足人们的好奇心、迎接挑战、战胜自我的深层需要,可细分为如下几种: 幻想, 好奇, 控制, 挑战其他动机满足人们认知、赢利等其他方面的需要,如:认知, 赢利例三:虚拟环境中的问题解决能力研究研究背景与目的v问题解决能力是现代社会非常重要的一种能力问题解决能力是现代社会非常重要的一种能力v许多学者认为利用游戏化虚拟学习环境可以提高许多学者认为利用游戏化虚拟学习环境可以提高学生解决问题的能力等高阶能力。学生解决问题的能力等高阶能力。VISOLE介绍vVISOLE:Virtual In

21、teractive Student-Oriented Learning Environment(虚拟互动学生为本学(虚拟互动学生为本学习环境)是一种让学生在交互式虚拟环境中自主习环境)是一种让学生在交互式虚拟环境中自主学习知识的学习模式学习知识的学习模式.v每组学生可以在其中创建一个农场,通过对农场每组学生可以在其中创建一个农场,通过对农场的经营和管理,来综合学习地理、农业、环境、的经营和管理,来综合学习地理、农业、环境、经济等学科知识,并培养解决问题等相关能力。经济等学科知识,并培养解决问题等相关能力。农场狂想曲介绍短片(5mins)研究目的v通过分析同学的游戏记录(游戏中的操作)通过分析同

22、学的游戏记录(游戏中的操作)v并结合游戏日志、访谈等资料并结合游戏日志、访谈等资料v深入了解他们的问题解决过程及策略深入了解他们的问题解决过程及策略研究方法Replay(重播)功能研究方法v本研究就以重播功能记录的本研究就以重播功能记录的游戏操作游戏操作为主线,为主线,v结合同学撰写的结合同学撰写的游戏日志游戏日志(BLOG)、访谈、观)、访谈、观察察BBS帖子等资料,帖子等资料,v对他们的问题解决过程和策略进行深入分析。对他们的问题解决过程和策略进行深入分析。研究结果v例一:如何应对资金赤字的情况例一:如何应对资金赤字的情况 某同学首先出售掉两只绵羊 其次专注地照顾马上要有收成的小麦,v例二

23、:如何应对作物死亡例二:如何应对作物死亡 某同学三次种植葡萄 某同学连续多次种植黄瓜研究结果v具体来说,则包含了如下问题解决策略具体来说,则包含了如下问题解决策略 试误、随意 目的、全面、重点、冒险、从简单入手 娱乐、指数化关于本研究方法的反思v“Replay + Blog等资料等资料” 的方法可以方便地得到的方法可以方便地得到丰富和客观的数据。丰富和客观的数据。v该方法在其它基于该方法在其它基于Web的研究中也适用。的研究中也适用。v将来结合将来结合“数据挖掘数据挖掘(Data Mining)”技术,技术,应用前景更广阔。应用前景更广阔。4 数据挖掘技术简介数据挖掘技术简介-数据挖掘的定义v

24、技术上定义技术上定义 数据挖掘(DM:Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。v商业上的定义 数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。数据挖掘的步骤数据挖掘与传统分析方法的区别v数据挖掘与传统的数据分析(如查询、报表、联机应用分析)的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。v数据挖掘所得到的信息应具有先未知,有效和可实用三个特征。数据挖掘的应用领域

25、v应用领域应用领域 银行、电信、保险、交通、零售(如超级市场)等商业领域v所能解决的典型商业问题:所能解决的典型商业问题: 数据库营销、客户群体划分、背景分析、交叉销售、客户流失性分析等等数据挖掘的典型示例v超市中的数据挖掘超市中的数据挖掘,小孩尿布和啤酒,小孩尿布和啤酒的关系的关系vIBM推出推出Advanced Scout软件,应用软件,应用于于NBA球队球队数据挖掘的主要功能 数据总结分类聚类估计与预测关联和序列发现数据总结v也可称为描述也可称为描述(Description) ,目的是对数据进行,目的是对数据进行浓缩,给出它的总体的综合描述,实现对原始数浓缩,给出它的总体的综合描述,实现

26、对原始数据的总体把握。据的总体把握。v常用的数据描述的方法是统计学的传统方法,如常用的数据描述的方法是统计学的传统方法,如计算数据项的总和、均值、方差等基本描述统计计算数据项的总和、均值、方差等基本描述统计量;或绘制直方图、折线图等统计图形。量;或绘制直方图、折线图等统计图形。 分类v分类(分类(Classification)就是研究已分类资料的特)就是研究已分类资料的特征,分析对象属性,据此建立一个分类函数或分征,分析对象属性,据此建立一个分类函数或分类模型,然后运用该模型计算总结出的数据特征类模型,然后运用该模型计算总结出的数据特征,将其他未经分类或新的数据分派到不同的组中,将其他未经分类

27、或新的数据分派到不同的组中。这常用来对资料作筛选工作。这常用来对资料作筛选工作。 聚类v聚类(聚类(Clustering)是指当要分析的数据缺乏描)是指当要分析的数据缺乏描述信息,或是无法组成任何分类模式时就采用聚述信息,或是无法组成任何分类模式时就采用聚类的方法,将异构母体区隔为较具同构性的群类的方法,将异构母体区隔为较具同构性的群(Cluster),即将组之间的差异识别出来,并对个,即将组之间的差异识别出来,并对个别组内的相似样本进行挑选,实现同组数据相近别组内的相似样本进行挑选,实现同组数据相近,不同组数据相异。,不同组数据相异。估计与预测v估计(估计(Estimation)是根据已有的

28、资料,对某一)是根据已有的资料,对某一参数或数值进行估计。来获取数据其他未知属性参数或数值进行估计。来获取数据其他未知属性之值。之值。v预测(预测( Prediction)是根据对象属性、过去的观)是根据对象属性、过去的观察值和有关资料对该属性的未来值进行预测,估察值和有关资料对该属性的未来值进行预测,估计预测使用的技巧主要是回归分析、时间数列分计预测使用的技巧主要是回归分析、时间数列分析及人工智能、神经网络方法。析及人工智能、神经网络方法。关联和序列发现v关联和序列发现(关联和序列发现(Correlation and Sequence Discovery)数据库中的数据一般都存在关联关)数据库中的数据一般都存在关联关系,即变量之间存在某种规律,关联就是要找出系,即变量之间存在某种规律,关联就是要找出某一件事或某一资料中会同时出现的东西。某一件事或某一资料中会同时出现的东西。v由于我们并不知道数据库中数据的关联是否存在由于我们并不知道数据库中数据的关联是否存

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论