【经典思政论文】试论大学生研究中的数据挖掘_第1页
【经典思政论文】试论大学生研究中的数据挖掘_第2页
【经典思政论文】试论大学生研究中的数据挖掘_第3页
【经典思政论文】试论大学生研究中的数据挖掘_第4页
【经典思政论文】试论大学生研究中的数据挖掘_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE6试论大学生研究中的数据挖掘[摘要]运用数据挖掘理论和技术对大学生研究数据进行深度挖掘和解读,有不可忽视的必要性,即在有关大学生研究的既有海量数据中挖掘出有价值的信息和知识,并进一步提取规则、模式等。大学生研究中的数据挖掘还涉及到怎样挖掘等问题,因此需要引起人们的关注和多学科协同努力。[关键词]大学生研究数据挖掘数据堆积信息短缺数据挖掘问题是近年来国内学界中颇为诱人的一个话题,尽管多年来人们一直在进行着相关的数据筛选和挖掘实践,但在观念上和称谓上确认数据挖掘概念和技术,则是近年来的事情。数据挖掘通常又称数据中的知识发现,是在大型数据库、Web和其它数据流中提取代表一定信息及知识的模式、规则等。在对大学生研究的过程中,同样存在着数据挖掘的问题,因此议论有关数据挖掘的必要性、数据挖掘的内容以及怎样进行数据挖掘等问题,是一桩颇有意义的事情。一、大学生研究中进行数据挖掘的必要性运用数据挖掘理论和技术对大学生研究数据进行深度挖掘和解读,有不可忽视的必要性。面对着现今大量实证研究呈低水平简单重复状况、精细研究难以深入、不少数据相互矛盾、大量一般性统计数据令人眼花缭乱、遮蔽视野而使人看不到更远更宽阔的领域,等等,都体现着数据挖掘的价值和意义。所谓数据挖掘,是指从大型的数据库中提取那些蕴含的、前所未知的、潜在有用的信息和知识,并从中发现一定的规则、趋势、模式、规律性等。数据挖掘是有一定前提的,那就是在日臻成熟的数据库技术的支撑下,大量数据存在于数据库中,然而人们似乎正被这些海量的数据所淹没,并且在海量的、又相互矛盾的数据面前变得不知所措。这就需要对数据进行辨析、整理、筛选,从中发现有价值的信息和知识。数据挖掘的过程通常表现为在一定的数据库基础上进行数据预处理,即对数据进行清理、集成、变换、归约等,然后建立数据仓库,在运用一定的数据挖掘技术进行数据选择处理,开展模式评价,最后形成一定的知识。1.从数据堆积的视角看数据挖掘的必要性这里所谓的数据堆积,主要指在大学生研究过程中,人们为了证明自己研究的合理性和正当性,通过各种途径与方式搜集大量有关大学生思想行为状况的信息、资料、统计数据等,但由于对这些海量的数据资料一时无法运用甚至无能解读,仅仅在使用其中一小部分数据资料的情况下,将大量数据资料不加整理而随意闲置甚至废弃的状况。那么这些数据有什么主要特点呢?首先,这些闲置起来的数据内容丰富广泛,主要涉及:大学生思想政治状况调查;大学生学习状况调查;大学生压力状况调查;大学生就业状况调查,大学生心理健康状况调查;大学生社团活动状况调查,大学生上网状况调查,大学生消费状况调查,大学生社会实践状况调查,大学生婚恋状况调查,大学毕业生创业状况调查,贫困大学生状况调查,特殊群体大学生调研等等。而在这些方面的调查数据中,还包含着更具体问题的调查数据,如大学生课外阅读状况调查、使用手机状况调查、网络话语调查等等。这些对大学生各种不同状况所作调查的数据,不仅有一定的时空界域性,反映着特定社会环境或情境下的部分大学生的思想行为状况,而且具有单义性和多义性,即有些数据反映了大学生某些方面的特点,有些数据则反映出大学生的多方面特征及其相互关联性,如大学生一定的压力状况可能与学习、就业、交友等问题有着紧密的关联性,它们又影响到大学生的思想政治状况。但目前的研究分析基本上都是以单义性的数据为基础,缺乏对各方面调查数据的综合性分析。使得大学生研究中资料数据的丰富性与运用数据的单调性之间的矛盾比较突出。其次,数据形成的方式与途径多种多样。第一、由政府部门和政府机构出面组织的大量专题问卷调查获得海量数据,这种问卷调查既有国家层面、如教育部自1992年以来每年在全国若干省市举行的大学生思想政治状况滚动调查(截止到2009年7月已举行过18次大型滚动调查),又有地方教育行政机构组织的相关专门调查,以及国家级和省市级层面设置的哲学社会科学类、教育类科学研究项目中有相当数量的大学生问题实证研究课题等。它们累积了大量的研究数据和统计资料。第二,近年来各高校自主开展的大量问卷调查,访谈调查,也收集了大量的数据和情况。并且这方面的调查主体十分丰富,主要有以下机构与人员,如学工部门、辅导员、导师、思想政治理论课教师、专业课教师,等等。第三,社会传媒机构对一些突出事件、典型案例所作的专题解读,也形成一些数据资料。还有一些社会民调机构这些年也开展了大量有关大学生状况的网上调查、电话调查等,积累了丰富的数据,如零点研究咨询集团、爱调研网、知己知彼网、搜狐教育频道等。第四,社会各方包括个人所积累的一些多媒体数据与资料。第五,各高等学校教务部门、招生机构、就业指导机构、学生事务管理如奖、勤、贷机构汇集的大量原始统计数据和数值记载。可以认为,这些数据数量浩大,但大量没能在本学界得到充分利用,其中所蕴含的有价值信息和知识也就没有得到及时开发整理,从而存在着信息短缺现象。2.从信息短缺看数据挖掘的必要性可以发现,一方面我们遭遇到海量的数据堆积闲置,另一方面我们又感受到相关的研究信息十分匮乏。第一、长期以来缺乏建立统一的数据仓库或数据“银行”的意识。可以认为,这些年来人们尽管搞了大量的实证调查,产生了海量的调查数据,但这些数据基本是流散在各处,从历时态的纵向看,没有同类数据的长期积累(除教育部思想政治工作司编辑有《新时期高校师生思想政治状况研究》(1998——2006年)、上海《思想理论教育》杂志曾经编辑有《高等学校师生思想政治状况滚动调查资料选编》1992——1997上海卷等之外),从共时态和历时态相统一的横向看,更没有不同类别数据的长期汇集,以致这些数据仿佛是散落在一块田地中的几万颗豆粒一样,要把它们搜集起来十分困难。更主要的是,即便保留的调查数据,也大量表现为已经SPSS处理过了的二次形态数据,大量的原始数据很难搜集。即便是大量各级科研项目的结项要求中,也从未提出过实证研究课题结项时必须提交全部原始数据的明确要求。由于长期以来缺乏相应的制度安排,加上长期以来养成的粗放型、大而化之的科研方式的影响,以及短视症、缺乏长期打算的眼界局限,使得大学生实证研究数据仓库(数据银行)建设问题一直无人问津。迄今为止,全国没有建立统一的大学生研究数据仓库,也没有地域性的数据仓库。这些年来可能有一些个人或组织建立有自己的数据库,那基本上属于自己在搞科研的过程中小打小闹的产物。第二、数据的利用率很低。在海量的大学生研究数据堆积中,人们真正利用的数据仅仅占少数,并且即便对这些少量数据的开发利用,往往也是即时性的一次性开发利用,而不是多次深入挖掘多次利用或者是组合性利用。不难看到,这些年来的大学生实证研究可以说投入了大量财力物力和人力,但这些实证调研基本上处于低水平重复状况。一般来看,在开展研究的早期,数据采集者为了探索或验证某些假设,想尽各种方式和通过各种途径搜集到许多数据和信息,但这些花费大量时间和精力所得到的调查数据,常常仅仅用来作一次性的频数分析和一般的相关性分析,仅仅为了完成某个报告,事成之后,绝大部分的数据被束之高阁,甚至被遗忘。由于这种调查研究基本都是非累积性研究,因此之后的几乎每次调研都要做自己的一套问卷及访谈方案,这种低水平的重复研究,即耗损了许多资源,又使研究无法深入拓展。第三、一些重大问题的研究由于实证调研存在很大难度而缺乏大量的数据资料的支撑。如大学生精神世界的发展问题,精神生活的质量问题、价值观的形成和发展过程,大学生信仰的构成及变化,民间信仰对大学生的影响,等等。二,如何进行数据挖掘成为一个严峻挑战当前一方面是新信息和新数据之铺天盖地,另一方面是多年来零乱堆积的老数据浩如烟海,使得人们在海量的数据面前不知所措。如何在这些海量数据中挖掘出有价值的信息和知识,成为人们关注的一个重要问题。其实,在讨论如何进行数据挖掘问题前,除了必须明了诸如为什么要进行数据挖掘、挖掘什么等几个相互关联的逻辑环节外,还要解决一个更本真的问题,即我们怎样才能真正了解大学生的真实的思想状况?也就是说,解决逻辑前提是十分重要的问题,这个逻辑前提主要关心如下的目标:通过怎样的途径和方式才能获得有关大学生思想状况的真实数据?通过这些数据又能揭示怎样的社会事实?从这些社会事实中又可以得出怎样的大学生思想政治教育的对策?1.人们目前试图把握大学生思想状况的主要途径和方式大学生生活在动态复杂的社会环境中,同时又处于相对隔离的大学校园生活中,这种开放和相对隔离相统一的生活环境,使得大学生的思想形成变化的外部条件具有一定的特征。人们试图把握大学生的思想状况,自然离不开了解这些外部环境的特征及其影响,同时,了解大学生思想状况又离不开一定的途径和方式。就目前的状况看,人们了解和把握大学生思想状况的主要途径和方式大约是;第一、辅导员。他们是对大学生进行日常思想政治教育和相应管理服务的骨干力量,和学生有着密切和广泛的接触,如果工作深入和细致的话,能够比较及时且又深入地把握大学生的思想“脉搏”,他们随时都在对大学生“望闻问切”。但是也要看到,辅导员管理学生人数的众多,辅导员的日常管理事务的不断增多以及维稳任务的时常凸现,以及新的管理服务模式的初见端倪,使得辅导员的工作难度越来越大。辅导员能够及时了解大学生一些表面的思想情绪,但无法把握大学生思想的深层东西。更何况现今的大学生受到西方学生文化的影响,他们对学生及时向辅导员汇报情况的举动之理解也出现变异,即西方高校文化通常将学生向教师汇报有关学生私底下的情况看作是“告密”,而告密者通常会受到广大学生的蔑视甚至孤立。在这种校园文化的影响下,我们的大学生现在也不会轻易向教师包括辅导员及时汇报学生中发生的许多事情,更不说有关学生的思想倾向问题了。第二、班主任。他们的主要任务是指导本科生进行思想修养和专业学习,包括学习态度、学习动机方面的干预和指导、学习方法的指导,甚至在开学初指导学生选修课程、辅修第二专业等等。为了保证班主任的精力投入,学校有关部门通常也规定给他们有一定的待遇倾斜如教学工作量补贴。从理论上说,班主任应该成为教师关心大学生的一种制度安排,他们也应该在思想政治方面关心大学生的成长。但目前的普遍状况是;这种制度在不少院校运作效果不明显,仅有少数班主任在尽心尽责地既从业务方面、又从思想方面关心和指导着大学生的全面成长。至于指望班主任及时了解大学生的思想政治状况,看来目前可能还属于一种理想状况。第三、思想政治理论课程及其教师。可以认为,思想政治理论课程是开展大学生思想政治教育的主渠道,这个主渠道也应该成为了解和把握大学生思想状况的主要来源或途径。但目前这种思想信息的收集功能并不明显,其中很大原因是任课教师的责任意识和积极性尚未得到充分发掘。面对着大班课教学的沉重压力,科研考量指标的优先性,以及学生对思想政治理论课程设置的漠然心理,使得教师只能在课间模糊地感受到学生们的情绪反应,学生对政治理论解释力的费解导致他们对这些理论的感受是迟钝和无趣的。在这种情景下,教师也探究不到学生对理论究竟有什么明确的反应。第四、专业课教师。可以认为,在现今的大学校园中,专业课教师对大学生影响最为明显和深刻。但不可忽视的事,这种影响也正在发生着流变,其中主要原因是:大课教学、学生众多,使得教师无法一一认得学生;现今教师各方面的压力徒增,如科研、教学、社会服务、指导论文、社会调查、各种会议、各种填表,等等,使得教师疲于奔命,下课即走,没有多少时间也没有多少精力与学生沟通交流,从而使专业课教师也变得不大关心学生而且不大了解学生了。加上缺乏相应的师生交流平台和相关机制,使得师生间的交流越来越少,有的也就是一种形式上的点缀而已。第五、指导教师。这里是指本科毕业论文或研究生毕业论文的指导老师。这种导师由于与学生有着较为密切和经常的沟通,所以在各方面对学生有一定程度的了解,从而成为把握大学生思想状况的一个重要途径。但不容忽视的是:导师与辅导员的工作重心毕竟是有区别的,尽管导师重视大学生德育应是导师职责的一个重要方面,但导师的主要职责毕竟是业务指导,他们可以关心学生的思想政治方面的成长,特别是关注学生道德品质的养成,但不会十分关注学生的政治态度问题,充其量是告诫学生要注意政治倾向性问题而已。导师可以成为了解大学生思想状况的一个不可忽视的途径,但目前缺乏通过这一途经归拢信息数据的制度安排。也就是说,这方面思想信息的收集主要诉诸于导师本人的自觉自为,而不是某种制度安排的产物。第六、各种各样的社会调研活动。随着上述途径在搜集大学生思想信息方面的功能不断式微,人们不得不诉诸于大量的社会问卷调查。这些年来,随着人们对实证研究、特别是定量研究的价值偏好,许多机构和研究者都高度重视大规模的书面问卷调查,这种调研对获得大学生面上的思想政治状况有很大的裨益,但不久人们就发现了这种调查的不足,即缺乏对大学生思想深层东西的考察,于是近年来逐步兴起了对大学生的深度访谈研究,以及深入细致的案例分析。这种将面上问卷调查和个体访谈相结合的方式,使得大学生研究所能获得的信息数据大大增加。但人们还是意识到目前的社会调查方法还有不断改进的巨大空间,其中最突出的问题是大量调查呈低水平重复状况:调查内容丰富多样,但调查口径和方式大相径庭,因此从表面看调查所获得的数据海量庞大,但实际功效却相互断裂,不能兼容;调查内容比较直白,问卷问项不够明确,选择答案种差不明显,使得被调查者容易拟假而使调查失真,等等。于是人们急切希望将通过各种途径和方式搜集起来的各种研究信息和数据汇集起来,进行有效的数据挖掘,以达成对大学生思想状况的“全息照相”。2.明确数据挖掘的主要内容。即数据挖掘究竟是挖掘什么?一言以蔽之,当然是挖掘有价值的信息,这些信息有助于人们更好地了解“社会事实”及其规律与趋势。正如涂尔干所认为的那样,社会学研究不能把人的主观感觉作为研究对象,而是以社会事实为对象。因此在研究中要抛弃预设概念,抛弃平常对事物形成的日常观念,不能以观念代替社会事实,这种社会事实与社会现象有区别。而了解社会事实又应该有其进一步的深入目标,那就是试图把握一定的规律性、趋势等。因此仅仅驻足于事实本身是不够的,因为在社会科学研究中,为了寻找支撑一个观点的社会实例是不难做到的,甚至要同时寻找两个大相径庭的社会实例也轻而易举。因此,人们需要积累有关事实的大量数据,即不仅要用事实说话,更善于凭大量准确可信的数据说话。但数据有时候也会有误,因此就又需要一定的理性和价值判断。于是,事实、数据、理性、价值判断等就构成了数据挖掘的基本要素。即通过一定的数据,提取有用的知识,包括有关规则、模式、规律性等。3.怎样做到有效数据挖掘?这个问题十分复杂,内含着一连串难题。对大学生研究中的数据挖掘来说,首要的问题是如何搜集或聚拢二十几年来各方方面面开展的有关大学生状况的调查数据、统计报告?这些数据目前散布在不计其数的单位和个人手中,眼下连如何搜集这些数据的技术路径都不甚明了,更不说搜集主体明确、搜集责任分解、如何保管和运用搜集起来的数据资料等一系列问题。其次,即便能够收集归拢到一定数量的原始数据或二次成型数据,但由于这些数据在研究重点、研究问题的等值性、概念预设、所选择的研究变量、规范性以及标准方面都可能存在着一定甚至很大的差异,很可能使这些辛辛苦苦搜集得来的数据沦为“鸡肋”。仅以标准性要求看,就涉及到分析单位、衡量尺度、参照系、数据统计口径、时间维度等要素,如果不同的调查得出的数据在标准性方面存在一定差异(更不说大相径庭)的话,那么这些数据就丧失了起码的价值。换言之,由于这些

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论