(课程与教学论专业论文)粗糙集理论在高中物理教学研究中应用的探索.pdf_第1页
(课程与教学论专业论文)粗糙集理论在高中物理教学研究中应用的探索.pdf_第2页
(课程与教学论专业论文)粗糙集理论在高中物理教学研究中应用的探索.pdf_第3页
(课程与教学论专业论文)粗糙集理论在高中物理教学研究中应用的探索.pdf_第4页
(课程与教学论专业论文)粗糙集理论在高中物理教学研究中应用的探索.pdf_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着数据库的不断增长,自动从数据库中获取有用的知识成为人们日益迫切的需 要,粗糙集理论( r o u 曲s e t s ) 就是在这样的背景下不断发展起来的一种用于不精确、不 确定性数据挖掘与处理的新型数学理论,粗糙集理论也凭借其独特的优势而在k d d 领 域中有越来越重要的地位。 粗糙集理论是波兰数学家z p a w l a k 于1 9 8 2 年提出的一种数据分析理论,它的主要 思想是:在保持信息系统分类能力不变的前提下,通过知识约简导出问题的分类或决策 规则。将粗糙集理论应用于数据挖掘的优越性就是它无需提供所需处理的数据集合 之外的任何先验信息,利用数据集上的等价关系对知识的不确定程度进行度量,从而避 免了对知识的主观评价f 如证据理论中的信念函数,模糊理论中的隶属度函数) 所带来的 误差,恰恰是这一点,使粗糙集理论在数据挖掘中具有更强的生命力。 本文针对粗糙集理论研究背景和研究现状,将对以f 内容进行研究:首先介绍了粗 糙集理论的理论基础,包括信息系统、等价类、不可分辨关系和上下近似集等,还详细 介绍了粗糙集的约简和核的概念;其次应用粗糙集理论分析了理科教师课程能力问卷, 主要分析了目前中学理科教师自身素质与未来新课程标准实施情况的关系,得出了有价 值的结论,为今后新课程标准顺利实施提供了有效的途径,也为拓展粗糙集的应用领域 做h 了探索;最后对粗糙集理论与其它教育评价中常用的数学方法概率论与数理统计和 模糊数学进行了比较研究。 关键词:数据挖掘;粗糙集;决策表;属性约简;教学评价 a b s t r a c t d a t am i n i n gh a sb e e na nu 蜷e n tn e e db e c a u s eo fi n c r e a s i n gs i z eo fc u r r e n td a t a b a s e s r o u 曲s e tt h e o r y ,an e wm a m e m a t i c a lt h e o r yf o rm i n i n ga n dp r o c e s s i n gi 1 1 】p r e c i s ea n d u n c e n a i nd a t a , h a sg o t 酽e a ti m p r o v e m e n tu l l d e rt h i sb a c k g r o u n d r o u 曲s e tt h e o r yh a sa l s o b e c 锄eam a i nm e 幢l o df o rk d dd u et oi t s1 l i l i q u ea 打a n t a g ei nk n o w l e d g ed i s c o v e 艰 r o u 醢s e ti sak i n do fd a t a 蛆a | y s i st k o r yw h i c hw a sp u tf o 黼a f db yp o l ez p 毪w l a ki n 1 9 8 2 i t sm a i n 也o u g h ti s :k e e p i n gt h ec o n s t a n tp r e m i s eo ft h ei nf o r m a t i o ns y s t e m c l a s s i f i c a t i o na b i l i 饥m ep r o b l 锄sc l a s s m c a t i o no rd e c i s i o nm l ei sd e r i v e db yk n o w l e d g e r e d u c t i o n 1 1 1 e 印p l j c a t i o no fr o u 曲s e ti nd a t am i n i n gh a so b v i o u s l ys u p e r i 确t yi td o e s n t n e e dt op r o v i d ea n yk n o w l e d g eo u t s i d eo f t l l ed a t aw h i c hn e e d st ob ep m c e s s e d ,m a k e su s eo f t l l ee q u a lv a l u er e l a t i o n st om e a s u r et b ei n d e t e h n i n a t i o nd e g r e eo fk n o w l e d g e ,a n ds oa v o i d s t o 也ee r r o rw h i c hi sb f o u g h ta b o u tb ys u 巧e c t i v ee v 酊u a t i o no f k n o w l e d g e 1 n 也i st e x t ,w eg a 也e r e dt kb a c k g r o u n da n dm ep r e s e n tc o n d i t i o 堇lo ft h er o u g hs e t r c s e a f c h w ew i l lc a r r yo nm er e s e 眦ht ot h ef a l l o 谢n gc o n t e n t s :a t 辑r s i ,i ti n t r o d u c e dt h e t h e o r yf o u n d a t i o no ft 1 1 er o u g hs e t ,i n c l u d i n gt h ci n f o m l a t i o ns y s t e m ,t h ee q u i v a l e n c ec l a s s , t b eu n d i 脑r e n t j a t e dr e l a n o n ,t h e1 0 w e ra n du p p e ra p p m x i m a t es e t sa i l de t c t h e n ,w e i n t r o d u c e dm ei d e ao ft h er e d u c t i o no fm er o u 曲s e ta 1 1 dt h ec o n c e p to ft h ec o r ew eu s et h e r o u 酶s e tt oa n a l y t h ec u r r i c u l u ma b i l i t yq u e s t i o i l n a i r e so f 像eh i 醇s c | l o o ls c i e n c et e a c 量l e r s , m a i na 1 1 8 l y s i st h ef e l a t i o nb e t w e e n 嘲es c i 熊c et e a c h e r s 唾娃a l i t yi nr e c 熊ty e a r sa l l dc a r 壬y i n g i n t oe x e e u t i o no ft h en e wc u 翻c u l ms t a j l d 捌,a i i dg e 牡i n gw o r t h yc o n c l u s i o n t h i st e x t p r o v i d ea na v a i l a b i l i t ya p p r o a c ht ot h ee x e c u t i o n “幽en e w c u r r i c u l u ms t a l l d a r d a n di td o e s s o m ev a l u a b kr e s e a r c ha b o u th o wt ou s e 幽er o u g hs e t a t l 聃t ,w ec o m p a r c d 1 er o u g hs e t w i t hs o m eo t l l e rm a t h c m a t i c sm e t h o d si n 血ee s t i m a t eo fe d u c a t i o n ,f o re x 砌p l e ,t 量l et e a c h i n g m o d ea n dt h em z z ym a t h e m a t i c s 。 k e yw o r d s : d a t am i n i n g ,r o u 曲s e t ,d e c i s i o nt a b l e ,t h e o r ) ra t t i l b u t e , t c a c l l i n g e v a l u a t 主o n i i 独怠l 性声明 本人声明所呈交的学位论文魑本人在导师指导下进行的研究工作及 取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写过的研究成果,也不憩含为获得东 北师范大学或其他教育机构的学位或证书面便用过的材料。与我一同工 作的掰志对本研究所做的任何贡献均已在论文中作了明确的说明并表示 谢意。 学位论文作者签名: 学位论文版权使用授权书 本学位论文作者完全了解东北师范大学有关保留、使用学位论文的 援定,即:东北厢范大学有权保掰并向国家有关部f 1 或极构送交学位论 文的复印件和磁盘,允许论文被查阅和借阅。本人授权东北师范大学可 以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影 印、缩印或其它复制手段保存、汇编学位论文。 ( 绦密的学位论文在解密后遗耀本授权书) 学位论文作者签名 曰朔 学位论文作者毕业后去向: 工作单位: 通讯地址: 逛话: 邮编: 一、绪论 ( 一) 粗糙集理论研究的意义和背景 当今,社会已经进入了网络信息时代,计算机与网络信息技术的飞速发展使得各个 领域的数据和信息急剧增加( 信息爆炸) ,如何从大薰的、杂乱无章的、强干扰的数据 ( 海量数据) 中挖掘潜在的、有剥用馀僮豹售感( 有用知识) ,这给人类的智能信息处 理能力提出了前所未有的挑战,由此产生了人工智能研究的一个崭新领域数据挖掘 ( d m ) 和数据库知蓼: 发瑗( 固d ) 。数据挖掘楚一个多学科领域,它从多个学科吸取营 养,这些学科包括数据库技术、人工智能、机器学习、模式识别、统计学、高性能计算 和可视化技术等。数据挖粥是一个新兴的具有广泛应阁前景的研究领域。 在传统的数据研究中,很大一部分的数据分析与处理的工作由具有专业知识的专家 和用简单的数据表示工具( 例如:电子表格、电子图表等) 和分析方法( 例如:统计等) 来完 成,这种做法费时费力,面且效率较低,只能获得这些数据的表层信息,而不能获得数 据属性的内在关系和隐含信息,即不能获得人们比较感兴趣的知识,因此研究高效智能 豹知识获取方法具有很大的现实意义。” 在知识工程研究中,一直存在篇信息的含糊性等问题,含糊性有三种,术语的模糊 性,如“大,j 、”;数据的不确定性,如“由磉声引起的”:知识自身豹不确定性,如规则 前后间的依赖关系并不是完全可靠的。人工智能的基础理论之一经典逻辑不足以 解决这些不确定性问题。 粗糙集理论( r o u 曲s e t ) 正是在这静情况下逐步建立并发展起来的。1 9 9 1 年,p a w l a k 发表了专著r o u g hs e t :t h c o r e t i c a la s p e c t so fr c a s o l l i n ga b o u td a t a 奠定了粗糙集理论 豹基础,从丽掀起了粮糙集豹磷究志潮。1 9 9 2 年,在波兰召开了第一届匿际粳糙集研讨 会,在以后的各届的研讨会上,都有力地推动了粗糙集理论的发展。目前,在d m 和 k d d 诸多方法中,粗糙集理论与方法对于处理复杂系统不失为一种较为有效的方法, 因为他与概率方法、模糊集方法和证据理论方法等其他处理不确定性问题理论的最显著 的区剐怒它无需提供问题所处理的数据集合之外的任何先验的信息,如统计中要求的先 验概率和模糊集中要求的隶属度。所谓粗糙集方法,怒基于个机构( 或一组机构) 关 于一些现实和它分辨某些特点、过程、对象等的能力知识,该方法以对观察和测景所得 数据进行分类的能力为基础。粗糙集理论不仅为信息秘学弱认知科学提供了新豹搴 学逻 辑和研究方法,而且为智能信息处理提供了有效的处理技术。近几年来粗糙集理论已应 。m i a 。d u o q j 柚,w a l l gj u e a ni n f o m a t i o nr e p r e s e n 协t i o no fc o n c e p t sa 1 1 do p c r a t i o n si nr o u g l ls c tt h c o r y 叫j o u m 8 lo f s o f t w a r e ,1 9 9 9 , o f 2 、:1 1 3 - 1 1 6 “w p z i a r k o r o u 出s e t s 咖f u z 珂s e t sa n dk m o w l e d g cd i s c o v e 可,1 9 9 4 ,8 7 * 9 6 1 用于机器学习、知识发现、决策支持与分析、专家系统、智能控制、模式识别等领域 粗糙集理论已成为信息科学最为活跃的研究领域之一。 ( 二) 粗糙集理论的发展及国内外研究现状 粗糙集理论是波兰数学家z p a w l a k 于1 9 8 2 年提出的一种数据分折理论。在该理论 刚刚问缴的几年,由于理沦还不成熟,因而并未受到重视,所以最初关于粗糙集理论的 研究主要在波兰,研究地域仅限于东欧一些国家。到1 9 9 0 年前后,由于该理论在数据 豹决策与分析、模式识羽、机器学习与知识发瑶等方瑟的成功应用,逐渐弓| 起了越界各 国学者的广泛关注。1 9 9 1 年z p a w i a k 的专著粗糙集关于数据推理的理论( r o u 曲 s e t s 一硅e o f c 垃c 啦a s 辨c t so fr e a s o l l i n g a b o u td a e ) 的问世,标志着粗糙集理论 及其应用的研究进入了活跃时期。 目前,国外对粗糙集理论的研究和应用发展得都比较快,尤其是1 9 9 2 年r + s l o w i n s 】i 主编的关于睾r 糙集应用及其相关方法。比较研究的论文集的出版,雄动了国际上对租糙 集理论和方法的深入研究。1 9 9 2 年在波兰召开了关于粗糙集理论的第一届国际学术会 议,这次会议讨论了褪糙集理论豹基本思想及其应逶。以后每年都徭开一次以褪糙集理 论为主题的国际研讨会。1 9 9 3 年在加拿大召开了第二届国际粗糙集与知识发现研讨会, 这次会议极大地推动了国际上对粗糙集理论与应用的够 究,其主题楚粗糙集、f l l z 巧集 与知识发现。1 9 9 4 年在美国召开了第三届困际粗糙集与软计算研讨会,这次会议广泛地 探讨了粗糙集与模糊逻辑、神经劂络、进化计算等的融合问题。 粗糙集理论及应用的几位主安倡导者,在1 9 9 5 年第l l 期a c m 通讯上撰文,概括 性地介绍了目前人工智能应用新技术之一的粗糙集理论的基本概念,及其在知识获取和 规器学习、决繁分板、知谖发臻等领域瓣獒体研究壤丑帮进展,将粗糙集列为新浮现的 计算机科学的研究课题。尤其是1 9 9 5 年召开的第四届模糊理论与技术国际研讨会,在 这次会议上,针对粗糙集与模糊集合的基本观点与相互关系展开了激烈的讨论,较大戢 促进了糨糙集的研究。1 9 9 6 年在日本东京召开了第5 届国际粗糙集研讨会,这是第一次 在亚洲地区召开的范围广泛的粗糙集研讨会。1 9 9 9 年1 1 月在日本、2 0 0 0 年1 0 月在加 拿大又召开了第1 届和第2 届“糨糙集和计算的当前趋势”学术会议,来自波兰、美国、 加拿大、日本、挪威、俄罗斯、乌克兰和印度等国家的研究人员参加了会议,会议阐述 了当蘸粳糙集、模糊集的研究瑗状和发震怒势,指熬将着重在软计算、数据黪、人工智 能和近似推理等理论和应用方面发展。目前,许多关于人工智能、模糊理论、信息管理 与知识发现等国际会议上经常可以看到涉及粗糙集的论文。当前许多重要的剿际学术会 议都把粳糙集理论的研究列入主要内容之一。 在国内,对粗糙集理论的研究和应用还处在探索阶段。1 9 9 6 年王联、苗夺谦等在模 式识剐与人工智能发表了关予r s 理论与应用论述,介绍了耀糙集理论的主要原理、基 。rs i 洲i n s k i r o l 塔hs e tr e a s i n g 曲o u tu n c e r t 8 i nd a t a 羁 2 2 92 4 3 2 本算法和在知识发现、决策分析等方面的应用,开始了国内粗糙集理论的研究和应用。; 1 9 9 8 年曾黄麟编写的粗集理沧与应瘸是国内第一本关于粗糙集理论的专著。;常犁 云等对属性德约简算法做出了改进,提高了样本分类的正确率;粗糙集理论已应用到各 个领域,如医疗数据分析、水泥窑生产控制算法、故障榆测、金融、电力、地理学等都 己取得了一定的成果;习前粗糙集理论在教育量化领域也有应用,2 0 0 1 年瞥黄麟、傅成 华首先将粗糙集方法应用到课堂教学评价子系统研究中,开拓了粗糙集理论虚用的新领 域;此后也有研究,簇都是将擒性约篾舞法应用在教学溪鬟评 鑫系统中,对教师豹授课 质量作出评价;郝乃澜、王双维应用粗糙集进行r 物理实验教学中教师因索对教学效果 的影焖。事实上,以上只是粗糙集成功擞用例子中很小的一邦分,粗糙集理论对于机器 学习、知识获取、决策分析、数据库的知识发现、专家系统、决策支持系统、归纳推理、 矛盾归结、模式识别、模糊控制及其他各个方面的应用,它都为之提供了一种很有效的 新的数学方法。可见,糙集理论及其广泛应用越来越受到重视。 ( 三) 本文的主要工作 目前对粗糙集理论的研究主要有两个方向,是对理论本身的研究,二是对粗糙集 理论的应溺研究,本文的研究属于后者。本文营先系统豹分绍了褪糙集理论的基本翔识; 其次研究了粗糙集理论在教育爨化中的应用,得出了有用的结论;最后对粗糙集理沦与 其它教弯译馀中常用豹数学方法概率论与数理统计和模糊数学进行了比较研究。本文较 为系统的研究了粗糙鬃理论在教育量化中的应用。论文结构如下: 第一章绪论:主要介绍了粗糙集理论的产生、发展以及研究现状。 第二章瓤糙集理论基础:介绍了粗糙集理论的基本知识:知识盼含义、不可分辨关系 和粗糙集的基本概念。并在此纂础上介绍了知识库的约简和信息系统的属性约简。 第三章糕糙集理论在物理教育量纯中豹应用研究:应用程糙集理论分析了理科教师 课程能力问卷的部分内容,主要研究的是影响新课程实施的教师因素分析和理科新课程 实施情况预测,效果良好。 第四章与其它教育量化方法的比较:对粗糙集理论与教育量化中常用的数学方法概 率论与数理统计和模糊数学比较分析,并列举了三种理论在教学质量评估中的应用案 例。 第五章结论:展望粗糙集理论的应用前景,并提出了一些在应用该理论过程中值得 思考的润题。 。王珏,苗夺谦,周育健关于r o u g hs e t 理论与应用的综述 j 模式识别与人工智能1 9 9 6 ,9 ( 4 ) :3 3 7 3 4 4 。曾黄麟粗集理论及其应用 m 重庆大学出版社,1 9 9 5 ,2 1 - 4 3 3 二、粗糙集理论的基础知识 要解决比较复杂的问题需要大量的知识以及处理这些知识的机制。粗糙集理论是一 种新的处理模糊和不确定性知识的数学工具。其主要思想就是在保持分类能力不变的前 提下,通过知识约简导出问题的决策或分类规则。下面将阐述粗糙集理论的基础及其思 想,作为后面章节的理论准备。 ( 一) 知识与分类 在信息系统中,人们首先碰到的就是对知识的理解和表达。一般认为,知识是人类 实践经验的总结和提炼,具有抽象和普遍的特性,是属于认识论范畴的概念。知识直接 与真实或抽象世界有关的不同分类模式联系在一起,任何一个事物都是由一些知识来描 述的,利用物种不同的属性知识描述,可以对物种产生不同的分类。 设u o 是我们感兴趣的对象组成的有限集合,称为论域。任何予集x u 称为u 中的一个概念或范畴。为规范化起见,我们认为空集也是一个概念。u 中的任何概念族 称为关于u 的抽象知识,简称知识u 上的一族划分,称为关于u 的一个知识库,它构 成了一个特定论域u 的分类。 设r 是u 上的一个等价关系,u ,r 表示r 的所有等价类构成的集合, x r 表示包 含元素x u 的r 等价类。一个知识库就是一个关系系统k = ( u ,r ) ,其中u 为非空 有限集,称为论域,r 是u 上的一个等价关系族。 若p r 且p a ,则n p ( p 中所有等价关系的交集) 也是一个等价关系,称为 p 上的不可分辨( i n d i s c e m i b i l i t y ) 关系,记为i n d ( p ) ,且有 【x 】。( p 1 = 川x 】。 ( 公式2 1 ) 这样,u i n d ( p ) 表示与等价关系族p 相关的知识,称为k 中关于u 的p 基本知识, i n d ( p ) 的等价类称为知识p 的基本概念或基本范畴。事实上,p 基本范畴是拥有知识p 的论域的基本特性,即知识的基本模块。 例如,给定一个玩具积木集合u = x l ,x 2 ,x 8 ) ,并假设这些积木有不同的颜 色( 红、黄、蓝) ,形状( 方、圆、三角) ,体积( 大、小) 。因此,这些积木都可以用 颜色、形状、体积这些知识来描述。例如一块积木可以是红色、小而圆的,或黄色、大 而方的等。我们可以按颜色、形状、体积等属性对这些积木进行分类。 4 ( 二) 不精确范畴,近似与粗糙集 令x 互u ,r 为u 上戆一个等徐关系,当x 能表达成某些r 基本范畴豹并辩,称 x 是r 可定义的;否则称x 为r 不可定义的。r 可定义集也称作r 精确集,而r 不可 定义集也称为r 非精确集或r 粗糙集。 对于粗糙集可以近似地定义,我们使用蹲个精确集,即糨糙集的上近似 ( u p p e r a p p r o x i m a t i o l l ) 茅西下近似( l o w e f a p p f o x i m a t i o n ) 来描述。给定知识库k ( u ,r ) ,对 于每个子巢x 至u 和一个等价关系r i n d ( k ) ,定义两个子集: 翌x = u y u ,r l y 量x ( 公式2 2 ) rx = u y u r i yn x 彩) ( 公式2 3 ) 分别称它们为x 的r 下近似集和r 上近似集。 集合脒。( x ) = rx 一璺称为x 的r 边界域;p 呱( x ) = 媵称为x 的r 的 正域:佩( x ) = u r x 称为x 的r 负域。盟然有 r x 印o s r 暖) u 嚣k ( 的 ( 公式2 4 ) 垦x 域p o s 。( x ) 是由那些根据知识r 判断肯定属于x 的u 中元素组成的集合; r x 是那些根据知识r 判新可能属于x 的u 中元素缀成的集合;丑k ( 茗) 是那些撮据翔 识r 既不能判断肯定属于x 又不能判断肯定属于x 的u 中元索组成的集合;e 嗥( x ) 是那些根据知识r 判断辫定不属于x 的u 中元素组成的集合。 集合的不精确性是由于边界域的存在两弓| 起的,集合的边秀域越大,其精确性越低。 为了更准确地表达这点,我们引入了精度概念。由等价关系r 定义的集合x 的近似 精度为: ( 翔:幽“ 嘲 ( 公式2 5 ) 其中并o , i 表示集合x 的基数。 精度用来反映我们辩集x 的知识的了解程度。显然,o ( ) 1 当呱( x ) = 1 时, 我们说集合x 是r 可定义的;当( x ) 1 时,我们说集合x 憋r 不可定义的。 当然,也可以罔其它_ 鑫度来定义集合x 豹不粳确程度,比如,用x 的r 粳糙度 风( 司来定义: 风( 舅) = 1 一( x ) ( 公式2 6 ) x 的r 粗糙度与精度恰恰相反,它表示关于集合x ,知识r 的不完备程度。除了用 数值( 近似程度的精度) 来表示粗糙集的特征外,也可以根据上下近似的定义来表达粗 糙集的另一个有用的特征,即拓扑特征。 f 面定义四种不同的重要粗糙集: 如果r x g 且r x u ,则称x 为r 粗糙可定义; 如果i u ( _ g 且r x u ,则称x 为r 内不可定义; 如果r x a 且r x = u ,则称x 为r 外不可定义; 如果r x = a 且r x = u ,则称x 为r 全不可定义; 这个划分的直观意义如下:如果集合x 为r 粗糙可定义,则我们可以确定u 中 某些元素属于x 或x ;如果x 为r 内不可定义,意味着我们可以确定u 中某些元 素是否属于x ,但不能确定u 中任一元素是否属于x ;如果x 为r 外不可定义, 我们可以确定u 中某些元素是否属于x ,但不能确定u 中任一元素是否属于x ; 如果x 为r 全不可定义,则我们不能确定u 中任一元素是否属于x 或x 。 粗糙集的数字特征表示了集合边界域的大小,但没有说明边界域的结构;而粗糙集 的拓扑特征没有给出边界域大小的信息,它提供的是边界域的结构。因此在粗糙集的实 际应用中,我们需要将边界域的两种信息结合起来,既要考虑精度因素,又要考虑到集 合的拓扑结构。 粗糙集理论还对集合类关于近似空间的分类问题定义了上近似和下近似。令 f = x 1 , x 2 ,x n l 是u 的一个分类或划分,这个分类独立于知识r ,子集x i 是划分f 的类f 的r 下近似和上近似分别定义为: 酗2 些。,坠:,群。 r f 2 r x l ,r x 2 r x 。) 有两个量度来描述近似分类的不精确性,第一个量度为根据知识r ,f 的近似分类 精度: l 酗i 州d 2 赫 第二个量度为根据知识r ,f 的近似分类质量 i 酗i 以聊2 却r ( 公式2 7 ) ( 公式2 8 ) 近似分类的精度描述的是当使用知识r 分类对象时,可能的决策中正确决策的百 分比;分类的质量表示的是应用知识r 能确切地划入f 类的对象的百分比。 将粗糙集的概念与普通集合论相比较,可以看出粗糙集的基本性质,如元素的成员 关系、集合的等价和包含等,都与不可区分关系所表示论域的知识有关。因此,一个元 素是否属于某一个集合,不是该元素的客观性质,而取决于我们对它的了解程度;同样, 集合的相等和包含也没有绝对的意义,而取决于我们对所研究问题中集合的了解程度。 ( 三) 知识约简与知识的依赖性 知识约简是粗糙集理论的核心内容之一。所谓知识约简,就是在保持知识库分类能 力不变的条件下,删除其中不相关或不重要的知识。当了解一个论域中的样例的时候, 我们可以通过知道其属性值来对样例进行处理。但是在现实情况中,有时我们不知道一 个样例的所有属性值,只能根据部分属性值来进行判定;有时我们需要确定一个论域中 是否每个属性的重要程度是一样的,因为度量不同属性值的代价可能不同。在专家系统 中,也会遇到类似的权重问题,重要性高的属性在作决策时被赋予大的权重。通常我们 只能根据经验来选择权重,这依赖于人的先验知识。根据上节中介绍的知识r 对集合 簇f 近似分类的质量( f ) 这一概念,我们可以对论域样本属性的重要程度进行度量, 而不依赖于人的先验知识。 令r 为一个等价关系簇,p r ,如果i n d ( r ) = i n d 限- p ) ,则称p 为r 中不必 要的;否则称p 为r 中必要的。如果每一个p r 都为r 中必要的,则称r 为独 立的,否则称r 为相关的。 设q p ,如果q 是独立的,且i n d ( q ) = i n d ( p ) ,则称q 为p 的一个约简( 简 式) 。显然,p 可以有多个约简( 简式) 。p 中所有必要等价关系组成的集合称为p 的核, 记作c o r e ( p ) 核与简式( 约简) 有如下关系: c o r e ( p ) = n r e d ( p )( 公式2 9 ) 其中,! d ( p ) 表示p 的所有简式( 约简) 。可以看出,核这个概念有两方面的用处: 首先它可以作为所有约简的计算基础,因为核包含在所有的简式之中,并且计算可以直 接进行;其次可解释为在知识约简时它是不能消去的知识特征集合。 不可区分关系r a ,b ,c ,d 可以看作每一个属性a a ,b ,c ,d ) 的不可分关系r a ) 的重 叠。这样,并不是所有的属性在“叠加”r 啪,c ,d ) 时都是必需的。一个约简是一个最小子 集b 互a ,a = a ,b ,c ,d ) ,使r b = r a 。在本例中,约简是 a ,b ) , b ,d ) 和 c ,d ) 。 在应用中,一个分类相对于另一个分类的关系十分重要。令p 和q 为u 中的等价 关系,q 的p 正域记为p o s p ( q ) ,即 p ( 悻( q ) = ,旦。 ( 公式2 1 0 ) 7 q 的p 正域是u 中所有根据划分u p 的信息可以准确地分类刹关系q 的等价 类中去的对象集合。 令p 和q 为等价关系族,r p ,如果 p 傩恻p ) ( 删d 固) ) = p 傩( p 一( r ) ( 踊d ( 9 ) ( 公式2 1 1 ) 则穆r 为p 中q 不必要的:否则r 为p 中q 必要的。为箍单起见,也用 尸。昂( q ) 代替p n s 。( 胁口( q ) ) 。如果p 中的每个r 都为q 必要的,则称p 为q 独立的。 设s 量p ,s 为p 的q 简式当且仅当s 是p 的q 独立的丑 p ( ) 黑( q ) = | p ( ) 量q ) p 的q 简式简称为相对简式,p 中所有q 必要的初等关系构成的集合称为p 的q 核,简称为相对桉,记为c o ,( p ) 。 相对核与相对约简的关系如下: 。o r ( p ) = n 冀哦( p ) ( 公式2 1 2 ) 其中尼凹b ( j p ) 是所有p 的q 筒式构成的集合。 知识的依赖性可形式化地定义如下:令k = ( u ,r ) 是一个知识麾卫q 互r 。 知识q 依赖于知识p ( 溆作p 等q ) 当且仅当i n d ( p ) i n d ( q ) ; 知识p 与知识q 等价( 记作p i q ) 当且仅当p 等q 且q j p ; 知识p 与知识q 独立( 记作p q ) 当显仪警p 等q 与q j p 均不成立。 当知识q 依赖于知识p 时,我们也蜕知识q 是由知识p 导出的。有时知识的依 赖褴可能是部分驰,这意味着用知识p 只能导出q 的部分知识,部分可导出可以| ;拯知 识的正域来定义: 令k 一( u ,r ) 为一知识库,且p ,q r ,当 膏= 炜( 9 = i p o s ( 9 | m 我们称知识q 是k 度依赖于知识p 的,记作p j 。q 。 当k 一1 时我们称q 完全依赖于p ;当o k 1 时称q 粗糙依赖于p ;当婷o 游称 q 完全独立于p ,系数斥( q ) 可以看作q 和p 问的依赖度。 部分依赖性p j 。q 的量度k 不能完全反映u q 中类之间的分布k 情况,一些决 策类可能完全由p 描述,但另一些可能仅仅由p 部分描述。因此,我们需要使用个 系数邝( j ,) = f = f z f i j f ,u ,q ) 来表明通过知识p 能将u q 中每个类的多少个元素 被正确划分。 这样,两个值如( q ) 和斥( 盖) ( x u q ) 给出了知识p 关于划分u q 的分类 能力。 ( 四) 知识表达系统与决策表 知识表达在智能数据处理中占有十分重要的地位。知识表达系统的基本成份是研究 对象的集合,关于这些对象的知识可通过指定对象的基本特征和它们的特征值来描述。 形式上,四元组s = ( u ,a ,v ,f ) 是一个知识表达系统,其中 u :对象的非空有限集合,称为论域; a :属性的非空有限集合; 矿= u 圪,v 属性值域,圪是属性a 的值域; d 月 f : u a v 是一个信息函数,它为每个对象的每个属性赋予一个信息值,即 v 口4 ,x u ,( x ,) 圪。 知识表达系统也称为信息系统。通常也用s = ( u ,a ) 来代替s = ( u ,a ,v ,f ) 。 知识表达系统的数据以关系表的形式表示,关系表的行对应要研究的对象,列对应 对象的属性,对象的信息是通过指定对象的各属性值来表达。容易看出,一个属性对应 一个等价关系,一个表可以看作是定义的一个等价关系簇,即知识库,知识约简可以转 化为属性约简。 决策表是一类特殊而重要的知识表达系统,多数决策问题都可以用决策表形式来表 达。决策表可以根据知识表达系统定义如下: 设s = ( u ,a ,v ,f ) 是一知识表达系统,a = c u d ,且c n d g ,c 称为条件属 性集,d 称为决策属性集,v 是属性的值域,f 对象属性到值域的映射。具有条件属性 和决策属性的知识表达系统称为决策表。 在决策表中,不同的属性可能具有不同的重要性。为了找出某些属性( 或属性集) 的重要性,一般的方法是从表中去掉一些属性,再来考察没有该属性后分类会怎样变化。 若去掉该属性后相应的分类变化较大,则说明该属性的重要性较高;反之,说明该属性 的重要性较低。 令c 和d 分别为条件属性集和决策属性集,属性子集c c 关于d 的重要性定 义为: d 西( c ) = ( d ) 一( d )( 公式2 1 4 ) 在决策表中,最重要的足决策规则的产生。设s = ( u ,a ,v ,f ) 是一个决策表, 9 a = c u d ,c n d = g ,其中c 为条件属性集,d 为决策属性粲。令置和f 分别代表u c 与u d 中的各个等价类,d e s ( 置) 表示对等价类墨的描述,即等价类置对于各条件 属憔镶的特定取值;d e s ( ) 表示对等价类的描述,即等价类i 对于各决策属性位豹 特定取值。决策规则定义如下: ,:d e s ( 五) d ! 强( i ) ,n 置g 规则的确定因子( 五、y j ) = k n 置i 隅i ,o ( 置、1 ) l 。 当( 五、1 ) = 1 时,规则是确定的,当o o ( x ) o ( b ) 即教师豳素熏要程度捧痔为: 教师的科学观教炳的研究能力 教师的课程观 教师的信心 在这种方法中,不使用事先假设的信息,只利用表中仅有的数据计算是否所有的属 性都有相同的“强度”,如果不是,它们在分类能力上有何区别。众所周知,对于课程 的实施,教师的鑫身素质在一定程度上具有更重要的意义,为了找出菜些属性( 透素) 和属性集的熏要性,需要从表中去掉另外一然属性,再来考察没有该属性后分类会怎榉 变化,若去撺该属性会相应的改交分类,则说明该属性的强度大;反之说明该属性的强 度小,邸重要性低。可见,在该处瑗结采中教师的科学观这一属瞧强度大,即重要性商。 3 结论阐释 ( 1 ) 教师的科学观与新课程实施的相关性分析 对缩论进行进一步分析表明,对于调查教师对科学这一概念的理解,也就是闯卷的 第6 题,其中选择第四个选顼的人数是最多豹,占总人数的4 0 2 ,这些教耀认为科学 即是客观的知识体系,探索自然的活动也是探索自然的方法,这部分教师中有5 9 3 的 教师认为能实瑰或基本能实现课程标准所规定的耳标,所占的比例最小:认为科学 是客观的知识体系的教师中有6 4 7 的教师认为能或基本能实现标准;认为科学是探索 自然的方法的教师中有6 5 6 认为能实现或基本能实现;而认为科学是探索自然的活动 的教师中有6 7 6 的教师认为或基本能实现课程标准,1 | 舞占的陡傍最大,说明持这种 科学观的人中大多数是对新课程标准的实施持乐观态度的,这些教师选择了能适当描述 科学和技术的本质,这些教师认为自己农能力和信心去实现这个酲标,但持有这秭萃萼学 观的教师仅占总人数的1 7 9 。 ( 2 ) 教课程呼唤教师叛的科学观 这是一个值得我们去深思的结论,教师的科学观在很大程度上影响着未来课程标准 的实施,但这恰恰是我们未曾重视的一个方面。教师的科学观是主导因素,决定教学观, 并因 睦:决定教学改革的深度、广度,转变教师传统的科学魂,使教师接受新的科学教育 理念是实现课程改革的一个重黉保障。 从科学知识和概念教学的角度出发,泰拉伯( a s s a nh 。t a i r a d ) 指采“如果科学 教师不能认识科学事g k 的本质,那么他们将难以帮助学生获得科学概念的健全理解。发 现、探知教炳如何形成关于科学技术本质的概念具有特别重要的意义,这怒因为教师的 观念、概念和哲学对谍堂的影响远大于学校的课程计划,科学教师带入课黛的知识对学 生的学习具有关键性的影响。”鲁巴( p + a r u b b a ) 等人指出“科学教师对科学和技术 的本质以及二者在毫圭会中酶相互作用的理解将影响他们在 罨种程度主在其科学教学中 纳入s t s 内容、用何种手段纳入此内容的教学质量。”。玛丽亚凯莱丽( m a r i ak a l l e r y ) 认为,“教帮对科学弱伪稳学豹态度缀吲能不仅会影响他们传授给学生的知识内容,焉 且会影响他们将知识黑现出来的方式”。这表明教师一定要正确的掌握科学概念,才能 帮助学生去解释科学l l 勺零质及研究过程。 新课程要求教师虚该其有较高的科学素养,要求具有反思批判能力,研究开发能力 和创新意思。基础教育课程改革的培养弱标中明确指出:“新课程的培养目标应体现时 代要求。要使学生具有初步的创薪精神、实践能力、科学彝人文素养以及环境意识。” 教师没有敏锐的洞察力、丰富的想象力和大胆的探索精神以及打破传统教育模式的观 念、共有开拓避取意识和剑瑟求异能力豹品质,就不能把培莠学生的剑掰耪神和实践能 力落到实处。这些培养目标的实现主要靠教师来完成,所以是否能在理科教学中培养学 生的科学实践观,把学生培养成一个全蕊发展的人,教廊自身的科学观至关重要。 ( 3 ) 对教师科学观培养的建议 首先,针对一些教师持的传统的科学观不适应新课程改革发展的需要,就要转变教 师传统的科学观,转交教愿传统的科学褒念应蓄先改变霹教师豹培养计翅,过去的培养 计划过于重视科学课程,而对于科学哲学却没有留有一席之地,而且教授者也没有充分 认识列这类研究的重要性。这榉的计划培养出来憋薪教炳头脑中充满了科学知识,砸付 :郭塾成2 0 世纪9 0 年代以来欧美教师科学观研究综述 j 比较教育研究,2 0 0 4 ( 5 ) :l 一2 ”郭勉成2 0 世纪9 0 年代以来欧美教师科学观研究综述 j e 较教育研究,2 0 0 4 ,( 5 ) :争6 1 5 出的代价是对科学研究过程的忽略,进入课堂后这些教师又被要求使用传统课本并且强 调知识教学,进一步加重了这种情况,因此转变教师的传统的科学观已刻不容缓。 其次,教师要做课题和教学的实践研究,教师在科学研究的实践过程中自身会对科 学本质有更加深入的理解,如果教师们认为科学研究和教学实践与科学自身的形成有 关,他们就会根据自身的研究实践来建构对科学本质的认识。达到理论与实践的完美结 合,这种结合与当代科学观相当一致,也与当前新课程下教师进行科研,进行校本开发 的趋势相一致。 ( 二) 对理科新课程实施情况中教师自然属性的粗糙集分析 1 实例分析 对上述调查问卷教师自然属性作为条件属性集合,包括教师从教学校( 县或市) , 性别,教学年限,职称,课程类别及从教年级( 初中或高中) 决策属性是问卷的第2 题 “您认为目前教学是否能够实现课程标准所规定的目标:a 能,b 基本能,c 基本不 能d 完全不能”,目的是分析出条件属性中哪些属性最大程度地改变了决策属性的分类, 以此来确定哪些条件属性最重要,按照各属性得知识表达系统如下:一 蠢3 :厘趋錾据墨l 茁1 q 位2 编 c 号 bstxvz d 12132113 2 1232l12 3ll32123 42132ll3 51123122 61232113 71133l23 8l23l122 9l 2 23l1l 1 0 2 l 3 2 1 1 2 应用m a t l a b 语言编写了相应的计算程序,分析结果如下: p o s c ( d ) = ( 3 4 ,5 3 ,1 6 2 ) 3 9 ,4 7 , 1 8 ,6 4 , 1 6 0 ,1 6 8 , 2 4 ,6 0 ,6 3 , 2 3 ,1 0 3 , 6 6 ,8 3 ,9 2 ,9 5 ) , 1 3 5 ,1 4 5 ) , 1 3 3 ,1 7 2 ) , 1 4 4 ,1 7 1 ) , 1 1 1 ,1 2 4 ) , 8 1 ,1 1 4 ,1 2 0 ,1 3 1 ) , 1 1 7 ) , 1 5 3 ) , 1 2 8 ) , 8 8 ) , 9 0 , 1 6 7 ) , 1 0 7 ) , 4 3 ) , 5 9 ) , 5 4 ) , 1 4 8 ) , 1 0 8 ) , 1 4 1 ) , 1 5 8 ) , 4 8 ) , 1 5 9 ) , 8 6 j , 9 9 ) , 7 2 ) , 8 ) ,( 1 2 1 ) , 9 1 ) ,( 2 6 , 5 ) , 1 1 3 , 1 7 8 ) ,( 3 , 7 ) , 1 9 , 9 ) , 1 3 ) , 1 4 0 ) , 5 6 ) , 1 5 ) , 7 1 ) , 3 0 ) , 5 2 , 1 6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论