




已阅读5页,还剩61页未读, 继续免费阅读
(计算机应用技术专业论文)形式化语言在报表系统中的研究和应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
形式化语言在报表系统中的研究与应用 上海师范大学硕士学位论文 形式化语言在报表系统中的研究与应用 摘要 信息系统在政府、企业管理中的作用越来越大,报表在信息系统中占有重要 地位。 信息系统的任务主要有:完成业务上的事务处理,为管理者和决策者提供全 面及时的信息服务。如何有针对性地加工数据库中的大量数据,是信息系统面临 的难题,报表是解决这个难题的重要手段。报表体现信息系统的价值。 目前国内外的报表系统在国内税务系统的应用存在一些问题。为了解决这些 问题,开发了e l i a n k 通用报表系统。采用报表格式与报表数据分离的设计思想, 即通过定义和维护报表格式为用户产生报表框架;根据运算规则自动采集和加工 数据库中的数据,产生报表数据:拼装报表框架和报表数据;最终形成报表。研 究和开发本系统是为了;实现通用报表的功能和性能,满足会计、统计的业务需 求。 本论文重点研究了此系统中的以下几个问题:e b n f 范式的定义;词法分析、 语法分析:赋值语句、审核语句、平衡规则的语义分析;赋值语句和审核语句的 计算;报表舍位平衡与误差均衡化。 关键字:形式化语言、词法分析、语法分析、中间语言、误差均衡化 彤。化语高n 撒表系统巾的研究l ,胧用 r e s e a r c ha n d a p p l i c a t i o no f f o r m a l l a n g u a g e i nr e p o r t s y s t e m s a b s t r a c t i n f o r m a t i o n s y s t e m s h a v ea n i n c r e a s i n g e f f e c to nt h e m a n a g e m e n t o f g o v e r n m e n t sa n de n t e r p r i s e s ,i nw h i c hr e p o r tp l a y sas i g n i f i c a n tr o l e t h em a i nt a s k so fi n f o r m a t i o n s y s t e m s a r ea s f o l l o w s :c o m p l e t i n g t h e t r a n s a c t i o n p r o c e s s i n g o nt h e o p e r a t i o n sa n da f f o r d i n gc o m p r e h e n s i v ea n dt i m e l y i n f o r m a t i o ns e r v i c e sf o rt h em a n a g e r sa n dd e c i s i o n m a k e r s h o wt o p u r p o s e f u l l y p r o c e s sl o t so f d a t ai nt h ed a t a b a s ei sah a r dn u tt oc r a c ki nt h ei n f o r m a t i o ns y s t e m s r e p o r ti sa ni m p o r t a n tm e a n st os o l v ei t r e p o r te m b o d i e st h ev a l u eo fi n f o r m a t i o n s y s t e m s n o w a d a y s ,r e p o r t - s y s t e m so f d o m e s t i cm a d o v e r s e a ss t i l lh a v es o m ep r o b l e m si n t h ea p p l i c a t i o no ft h ei n t e r n a lr e v e n u es y s t e m s t os o l v et h o s ep r o b l e m s ,t h ee l i a n k - g e n e r a l - r e p o r t - s y s t e mi sd e v e l o p e d i tw o r k sb ys e p a r a t i n gt h ef o r m a ta n dd a t ao f r e p o r t n a m e l y ,i tp r o v i d e st h ed e f i n i t i o na n d m a i n t e n a n c eo f r e p o r t sf o r m a ti no r d e r t op r o d u c ei t sf r a m e w o r kf o rt h eu s e r sa tt h es a m et i m e ,i tc a n a u t o m a t i c a l l yg a t h e r a n dp r o c e s st h ed a t ao fd a t a b a s ei nt h el i g h to ft h ec a l c u l a t i o nr u l e s ,t h e r e b yg e n e r a t e t h ed a t ao f r e p o r t t h e n ,i tp u t st o g e t h e rt h ef r a m e w o r k a n dd a t ao ft h er e p o r t a tl a s t , t h er e p o r tc o m e si n t ob e i n g t h es y s t e mi sr e s e a r c h e da n dd e v e l o p e df o rt h es a k eo f r e a l i z i n gt h ef u n c t i o na n dp e r f o r m a n c e o f g e n e r a l r e p o r ta n df u l f i l l i n gt h eo p e r a t i o n s r e q u i r e m e n to fa c c o u n t i n ga n d s t a t i s t i c s i nt h i s t h e s i s ,t h ef o l l o w i n gi s s u e s o ft h e e l i a n k g e n e r a l - r e p o r t - s y s t e ma r e r e s e a r c h e d :t h ee b n f f e x t e n d e db a c k u s n a u rf o r m ) d e f i n i t i o no f t h i ss y s t e m ,l e x i c a l a n a l y s i s ,s y n t a xa n a l y s i s ,t h e s e m a n t i c a n a l y s i s o f a s s i g n m e n t - s t a t e m e n t s a n d a u d i t i n g - s t a t e m e n t sa n db a l a n c e r u l e s ,t h ec a l c u l a t i o no fa s s i g n m e n t s t a t e m e n t sa n d a u d i t i n g s t a t e m e n t s ,k e e p i n g t h e r e p o r t b a l a n c ea n d e r r o r - e q u i l i b r i u m a f t e ri ti s r o u n d e do f f k e yw o r d s :f o r m a ll a n g u a g e s ;l e x i c a la n a l y s i s ;s y n t a xa n a l y s i s ;i n t e r m e d i a t e l a n g u a g e ;e r r o r e q u i l i b r i u m 形式化语言在报表系统中的研究与应用上海师范犬学硕士学位论文 1概述 1 1 业务背景和功能需求 信息系统在政府、企业管理中的作用越来越大,报表在信息系统中占有重要 地位。会计报表、会计分析、统计报表、统计分析都涉及到报表定义、报表运行、 报表数据管理、报表分析。研究和开发本系统是为了:实现通用报表的功能和性 能,满足会计、统计的业务需求。 信息系统的任务主要有:完成业务上的事务处理,为管理者和决策者提供全 面及时的信息服务。如何有针对性地加工数据库中的大量数据,是信息系统的难 题,报表是解决这个难题的重要手段。报表处理是信息系统的重要问题,在技术 实现上有一定的难度。报表体现信息系统的价值。目前国内外的报表系统在国内 税务系统的应用存在着一些问题。为了解决这些问题,开发了e l i a n k 通用报表 系统。其主要特性有: 提供简单高效的报表数据抽取运算语言,该语言支持中文对象引用。一 般情况,十至三十条语句能完成一张复杂报表。 在o r a c l e 8 数据库基础上,提供了配套的、成倍提高报表运行速度的解决 方案。 系统采用三层结构,增加了它的通用性、安全性和可维护性。并提供报 表系统的网络调用接口,为报表系统嵌入到其它应用中提供了可能和方便。 解决了其他报表系统未能完全成功处理的舍位平衡误差均衡化问题,提 供报表手工录入、重新运算和报表审核功能。 有配套的、强大的报表管理、查询和分析功能。 报表有复杂性、多样性。如快报;单栏、多栏报表;折半、折三、多折报表; 定长、不定长报表;开口、不开口报表;分页报表等多种形式。 报表数据的提取、引用;报表内数据和报表间数据的平衡关系;报表的舍位 平衡及误差均衡化;报表数据导入和导出等构成报表数据关系的各个要素。 该报表系统的目的是在税务电子化的背景下,采用三层体系结构,为o r a c l e 、 s y b a s e 、f o x p r o 等数据库环境提供一套完整的报表解决方案。 第1 页 形式化语言在报表系统中的研究与应用上海师范_ 犬学硕士学位论文 报表系统的功能需求有; 生成和展现固定报表:具有定义固定报表甲栏、丙栏、表头、附加项、公 式( 计算公式、校验公式) 等功能:生成的报表可转化为h t m l 、e x c e l 格式, 其格式可保存,作为模板使用;报表可以c s 、w e b 两种方式生成;报表平台 能连接不同数据源;报表的边框、单元格等元素可定制;报表内容能以图形方式 展现,展现方式( 颜色、坐标等) 可定制;报表的时间跨度可定制。 生成自定义报表:可从不同业务模块、不同的表选取内容生成报表;可将 多张报表合并成为一张新的报表;可通过计算生成报表新的行栏;定义报表的操 作简单、直观、易懂;报表格式保存、图形展现、报表格式元素等的要求与固定 报表相似:可对报表中规定的字段进行数据抽取。 报表的w c b 发布:w 西页面诸元素可定制;分离报表的发布权限和删除 权限;在报表发布的位置旁留有批示和评论空间:报表在w e b 页面上的排列次 序可定制:报表以w e bs e r v e r 与报表服务器分开的方式发布;报表的发布可按 部门分类;报表发布提供签发方式;提供带智能卡接口的用户登陆方式。 报表校验:表内校验、表问校验:定制舍入的粒度;当校验条件不满足时, 有直观的报警方式;报表内容修改后,自动检验是否满足校验条件;能保存和维 护校验关系;校验在报表生成之前进行,若不满足校验条件,不能生成报表。 定时按计划生成和发布报表:定时自动生成报表;生成后自动发布。 权限设置:权限分为g r o u p 和u s e r 两组:应用系统模块权限设黄;数据 源权限设置可定义到字段级;生成报表权限设置( 原始报表只能生成和发布,不 能修改,其他报表可以生成和修改) ;签发权限( 有些报表需经过签发才能发布) ; 报表查询权限由生成报表的人定义。 日志:记录生成报表的时间、所用时间、操作员;报表的每次发布、删除、 修改、签发( 包括签发人,时间,报表名) ;及其报表生成成功与否( 若是失败, 并记录其原因) 。 自动平表功能。 报表平台可扩展性:报表有开放的接口,与多种数据源兼容( 由o d b c 支 持) 。 支持并行数据处理( 由o r a c l e 支持 ;报表平台与多种操作系统、w e b 第2 页 彤式化语苦拒搬表系统中的斜究,应用l :海师范人学坝1 1 学位论文 s e r v e 兼容:支持数据仓库产品:支持访问文本数据的能力;提供灵活的作业调 度;具有动态生成图形能力。 1 2 1 会计报表 1 2 需求分析 会计报表是用特定表达方式,以会计账簿资料为主要依据,以货币为计量单 位,通过系列指标,集中反映会计报告期内资金活动情况的书面报告。各核算 单位必须严格按规定时间向上级税务机关编报各种会计报表,县级以上各级税务 机关应及时对下属单位上报的报表进行审核,将同类报表加以汇总,并编报犯总 报表。 税务会计报表根据反映内容不同,可分为:旬报表。又称电甸报,以旬为 报告期,用远程通信方式向上级税务机关上报本句各项税款入库情况的报表。 快报表。又称电月报,以月为报告期,用远程通信方式向上级税务机关上报各税 种和有关重点项f 1 入库情况的报表。资金平衡表。以月为报告期,反映资余运 动情况的报表。应征税金明细报表。以年、月为报告期,反映应征税款累计情 况的报表。入库税金明细报表。以年、月为报告期,反映税款入库情况的报表。 在途税金余额明细报表。以年、月为报告期,反映期术实有在途税款的报表。 欠缴税会明细报表。以年、月为报告期,反映期未实有欠缴税款情况的报表。 减免税金明细报表。以年、月为报告期,反映期末累计减免税金情况的报表。 提退税金明细报表。以年、月为报告期,反映期束累计提退税金情况的报表。 1 2 2 会计分析 会计分析以会计核算资料为主要依据,用科学的分析方法,对资金运动过程 及其结果进行综合、全面研究和评价,揭示工作成绩、问题,分析原因,并提出 改进措施,以加强管理,是核算的延续。积极开展会计分析,充分发挥会计的反 映和控制作用。 税务会计分析的主要内容: 应征分析。把分析期内实现的总量,分地区、税种与税基及应征税余e 2 , 额 第31 j 工 形式化语言在报表系统中的研究与应用上海师范大学硕上学位论文 对比,分析趋势。 欠缴税金分析。把分析期内应缴而未缴的税款,分地区、税种、类型,选 择纳税大户与税基、欠缴税金总额及应征税金总额对比,通过分析增长率、比重 率和应征欠款率,掌握欠缴税金各构成部分的变动情况及它们对欠缴税金总量的 影响程度,为及时控制和清理欠税提供依据。 减免税金分析。对分析期内的减免税款,分地区、税种及减免性质与税基、 减免总额及应征税金总额对比,掌握减免税金的变动趋势和影响减免税金变动的 主要因素。 在途税金分析。按地区,比较在途税金总额与应征税金总额,并结合税金 在途时间,对分析期内的在途税金进行分析,了解在途税金是否正常,是否有占 压税款现象,以便采取措施,加快税金入库速度。 提退税金分析。分析各地区、各税种和各种不同性质的提退税金的变化情 况、各构成部分对提退税金总量的影响程度以及提退税金占应征税金的比重变化 情况。 入库税金分析。入库税金是税金运动的终点,是应征税金减税金运动过程 中发生的减免税金、欠缴税金、待解税金、损失税金、在途税金和提退税金的所 得余额。保证各项应征税款及时足额入库,是管理工作的中心任务。所以,对入 库税金进行分析,实质上是对税金运动各环节的综合分析,是税务会计分析的核 心。它在评价税务管理工作和分析税收计划完成情况等方面有极其重要的意义。 入库税金分析除按地区、按税种进行分析外,还需进行因素分析,即将应征税金、 减免税金等各种税金作为影响入库税金的因素,分别分析每个因素对入库税金影 响的方向与程度,从而找出影响入库税金变化的主要原因。此外,常常把它与在 途税会比较,以分析在途税金的入库速度。 1 2 3 统计报表 税务统计报表按照统一规定的表格、项目、口径收集统计资料,是税务机关 搜集和整理统计资料的主要手段。税务统计报表的种类有:按统计时间不同。分 为月报、季报和年报;按统计范围不同,分为税源统计报表、收入统计报表和税 政统计报表;按编制方式不同,分为原始统计报表( 即直接依据原始凭证或统计 第4 页 彤一弋化语南在报表系统中的研究与应用j 海师范人学坝1 1 学位论文 台账而产生的报表) 和汇总统计报表( 即依据各f 属单位报送的统计报表汇总编 制的报表) ;按报送方式不同,分为书面报表和电子报表。 统讨寸艮表要求:资料完整:报表必须按规定的指标,全面、完整地编报, 不得漏填项目。数字准确:报表必须依据原始资料,按规定方法准确计算,如 实填报,不得弄虚作假;口径统一:报表必须按统一规定的口径编报,不得随 意更改。报送及时:报表必须在规定的时间向上级单位报送,以便上级单位统 一舡总。 统计报表的填列依据:各种原始统计报表应根据统计台账,并结合统计原始 凭证或统计汇总单进行计算填列;各汇总统计报表应根据其下属单位编报的同类 统计报表的同类项目的数据汇总填列。 1 2 4 统计分析 统计分析是运用统计资料对统计内容进行概括、评价、推断、预测的过程, 也是通过统计资利发现问题、揭示矛盾、总结原因并提出建议措施的过程。 税务统计分析的内容:分析收入进度、变化情况及发展趋势;分析政策的执 行情况、实施效果及存在的问题:分析征管工作的深度、广度、质量以及纳税人 的态度和依法纳税程度;分析税源增减变化情况和发展趋势。 税务统计分析主要方法:对比分析法:将相互联系的指标进行对比,计算 相对数。平均分析法:将同一性质的某类指标数据综合平均,计算平均数,分 析其总体情况。状态分析法:将某类指标按照时间序列进行分析,研究税收在 不同时期的发展水平。因素分析法:计算某类指标的分项数据对指标总量的影 响程度,从而得到分项指标对总量指标的作用方向、入小,便于抓住主要问题。 相关分析法。计算性质不同却相互联系的指标的相对值,了解其相互关系。 统计分析步骤:选题。统计分析的题目必须根据各个时期:【作的重点和需 要确定,选题要目的明确、内容清晰、针对性强。搜集和整理统计资料,根据分 析的内容和目的,确定搜集的资料的内容、口径和来源,并对搜集的资料运用科 学方法进行分类和综合。计算和研究。运用统计分析方法,对掌握的统计资料 进行计算剖析,透过表象,发现问题,抓住实质。做出结论,提出建议。根 据分析结果,做出实事求是的结论,并提出建议和措施。 第5 负 彤式化语苦d 报表系统中的_ | - 究与应用 f :海帅范人学坝l 学位论文 2系统架构 e l i a n k 通用报表系统通过3 层b s 体系结构实现,包括报表数掘库、报表 服务器和报表客户软件,结构如图2 1 所示。报表系统的核心是报表服务器e l i a n k s e r v e r ,负责报表数据存取、报表格式存取、报表访问安全控制等,为e l i a n k r e p o r t 等客户软件提供统一的、与数据库类型无关的调用服务。e l i a n kr e p o r t 提供给报表客户使用。e l i a n km a n a g e r 通过e l i a n ks e r v e r 所提供的服务,刘报表 系统进行管理。 图2 1e l i a n k 通用报表系统结构 2 1e l i a n ks e r v e r 其主要功能有:报表数据、格式存取,报表访问安全控制。它通过调用 组 标准s d k 为应用客户提供服务。其中包括: 报表格式和数据的存储管理:负责报表的格式、数据的一致性要求;报表 的格式和数据的存取、大容量报表数据的海量存储管理。 解释报表定义语言:负责解释报表格式规则、报表运算规则、报表审核规 则、报表台位平衡规则。 第6 页 形式化语言在报表系统中的研究与应用卜海帅范夫学硕l j 学位论文 报表运算处理:根据报表定义语言解释器对运算规则的解释,牛成报表数 据。 舍位平衡调整处理:根据报表定义语言解释器对舍位平衡规则的解释,实 现报表数据在四舍五入后平衡,并对其进行误差均衡化处理。 表内和表i 司审核处理:根据报表定义语言解释器剥表内、表间审核规则的 解释,实现报表数据的审核处理。 安全管理控制:负责系统安全管理。 2 2e l i a n kr e p o r t 其主要功能有:为客户提供统一的,与数据库类型无关的服务。通过w e b 浏览方式为客户提供服务,包括: 定义报表格式:提供定义报表的表头、表尾、行标题、栏标题、边框、属 性、业务模式等功能、还提供报表格式的预览功能。 定义报表运算规则:提供定义报表运算规则的功能。 定义报表审核规则和舍位平衡规则:提供定义报表审核规则、舍位平衡规 则的功能。 手:1 j 录入报表数据:提供手工录入报表数据的功能。 报表打印:根据定义的报表格式,打印报表。 转换报表数据输出格式:提供输出报表的数据、格式和样张的功能。能用 e x c e l 、h t m l 、d b f 、o r a c l e 等格式输出报表。 报表数据图形化处理:提供以图形方式展现报表内容的功能。 报表运算和动态参数调整:根据定义的报表格式、规则、属性、业务模式 运行报表。集成报表舍位平衡和误差均衡化、表内和表l 副审核、报表运行调试等 功能。 报表作业调度:根据作业调度模式,提供报表批量运行、打印;表内及表 间批量审核;报表批量舍位平衡及误差均衡化;报表格式、数据批最输出等功能。 2 3e l i a n km a n a g e r 其主要功能有:通过e l i a n ks e r v e r 所提供的服务,管理报表系统。通过w e b 第7 页 彤- 】_ l = 化语吉存撇表系统中的础究与应用 海帅范大学硎f 学位论义 浏览方式为客,1 t 提供服务。包括: 记载报表处理日志:根据系统设置的 同志记录级别,记载报表系统的运行日志, 提供六w ( w h o ,w h e n ,w h e r e ,w h a t , h o w ,w h y ) 同志记录,日志记录级别有正 常运行、系统管理、现场维护、程序调试等 四种级别。 报表安全管理:根据角色进行安全管 理服务,提供系统版本的安全管理。 报表计划定时生成和发布。 e l i a n k 通用报表系统的逻辑架构( 如图 2 2 所示) i 刚皤口l ie l j a n kr e p o r te l 。ia n km a n a g e f i 、 ,i le 【| i a n ks e r v e r 图2 - 2e l i a n k 通引报表系统逻辆絮构 2 4 e l i a n k 通用报表系统技术规格 环境要求: 标准t c p i p 网络; 标准w e b 服务器; 标准i e 4 以上浏览器。 功能指标: 任意单元格、任意行或栏及全表数据的采集定义: 表内表间的数据调用、审核及报表汇总运算; 标准的报表规则定义语言; 报表进行四舍五入后,表内单元格的误差范围小于等于1 ; 面向业务处理的属性定义方式;基础业务数据可以来自于o r a c l e 、 s y b a s e 、s q l s e r v e r 等数据库;报表数据结果能以e x c e l 、h t m l 、d b f 、o r a c l e 等方式输出: 开放的s d k 包: 报表内容的图形处理方式; 六w 四l e v e l 日志管理文件; 第8 贞 形式化语言在报表系统中的研究与应用上海师范大学硕士学位论文 完全基于w e b 浏览方式的用户界面; 自主知识产权。 2 5 主要功能 该系统是一个通用报表系统,适用于税务征收管理中常用的报表处理,产生 各类统计分析报表和统计台帐。主要功能包括报表数据的存储、查询;数据关系 的检查;报表格式的定义以及报表数据的计算等。采用报表格式与报表数据分离 的设计思想,即通过定义和维护报表格式为用户产生报表框架;根据运算规则自 动采集和加工数据库中的数据,产生报表数据:拼装框架、数据:最终形成报表。 2 5 1 报表数据的数据结构 用报表代码区分不同类型的报表,用所属期表示报表时间,用部门代码表示 报表编报部门( 指税务所、业务科室和市局等数据统计单位) 。因此,报表有三 个属性: i d :报表代码 d a t e :所属时期 d e p t :编报部门( 或税务局、所) 报表由数据和框架组合而成。报表数据由若干行或栏数据组成,每个数据元 素属于一个特定行和一个特定栏。即每个数据元素可由其所在的行、栏的位置确 定。分别对行、栏编号,设行、栏编号从l 开始,逐一递增。报表单元格可用它 在报表中所处的行号、栏号表示: h 行号l 栏号( 或列号) 报表框架由上表题、栏表题、纵表题、下表题和表层注释区五个部分组成。 拼装报表框架和数据就构成一张完整的报表。 1 ) 报表定义 报表定义部分的数据结构由报表描述、表头表尾定义、备注区定义、报表行 定义、报表栏定义、报表属性定义等组成。 2 )报表规则定义 报表数据的抽取和引用由报表规则号、报表运算规则等组成。 第9 页 形_ l 弋化语高相:撮表系统中的研究与应用一海帅范人学预l j 学位论文 3 )报表数据审核定义 报表数据审核出表内审核、表问审核等组成。 4 )报表数据的存放 报表数据的运行和存放由报表参数、报表数据仓库、报表运行缓冲区、动态 表头、报表其他定义等组成。 2 5 2 报表系统的功能结构 报表系统在功能上主要包括:报表定义、报表运行、报表数据管理和报表分 析四大部分。 1 )报表定义 报表定义是由技术人员根据所需格式,定义报表各部分,得到完整的表格框 架和业务关系。包括以下几个方面: 报表定义:栏标题定义、行标题定义、表头表尾定义、备注区定义、属性定 义。 运算规则:业务人员用产生报表数据的计算语言按自己的要求定义报表数据 的计算。 审核规则:为确保产生的报表数据的正确性,利用数据问的关系对表内或表 叫的数据进行检查或调整。 动态参数:进行报表的动态参数定义。 增加:创建新的表格。 复制:把一个表有关栏标题、行标题、表头、表尾、备注、属性、运算规则、 审核观则、动态参数等的定义复制到另一个表。 删除:删除表中部分定义。 2 )报表运行 业务人员根据数据间的逻辑关系,进行计算或检查的过程,有:动态参数处 理( 在相应的表中查询、增加、修改动态参数) 、报表运算( 输入编撤日期和编 报部门,根据运算规则,产生报表数据) 及报表审核( 输入编报同期和编报部门, 根据审核规则,对报表数据进行审核) 。 3 )报表数据管理 第1 0 贝 彤j 化语苦柏寸硅表系统中的研究ly 应用海帅范人学 】j ! i 。学位论空 包括:列出报表清单( 根据报表代码查询报表) 、删除数据( 根据报表代码、 编报闩期及编报部门删除数据) 、数据录入和报表输出。 4 )报表分析 报表具有以下特征:报表是对数据库中数据的再加工;报表数据一般是 统计数据;报表是用于管理和决策的;报表是分层次的、相互关联的;报 表数据来源一般都很复杂;报表体现管理。报表数据是企业非常有价值的数据。 闲此,提供对报表进行分析的功能尤其重要。 对报表数据进行分析和查询,包括以下功能:报表数据查询:报表汇总:报 表数据图形显示:报表数据分析;打印等。 第1 1 贞 形一化语苦存报表系统中的研究,应用海州j 范人学倾1 学位论文 3 规则定义形式化语言 本系统的关键字如表3 - 1 所示。 3 1 关键字 表3 - 1 本系统的关键字 符号表示的意义符号表示的意义 t 或t表头标识 $ 动态参数 h 或h行标识 = i 文字引用 l 或l栏标识 q t n数据拙取标记 行栏区间符 + 加号或i f 号 ,或分隔符减号或负号 拌 表示下限乘号或全表标识符 表示应用字段 除号 字段域或强制符 ( )左、右括号 :或:属性符 行栏数标记 赋值符或等号 1= 不等于 = 拌 表格引用符 大于 = &手工行列符 = 大于等于 b ,b报表标识符 i = i i = i = l ! = := “ := = 堑查些堕i ! :坐墨墨笙! 塑! ! 壅兰壁星 土塑些燮塑! 羔兰! 鱼墨 := = & 注释符3 - : ;:= i := 非零数字, 无符号整数,】 := 】 ) := n o t i n 0 t | n o t 时o t i n 0 t i n o t n o t i n o t := a n d i a n d l a n d i a n d l a n d l a n d t a n d l a n d := o r l o rb o r t o r := ( + i - ) ) := ( + i ) ) := i l l := ( k := ) n := h 一 := 1 := := ( 【 【 := := t i t 3 2 2b n f 范式的示例 例如文字语句:h 1 = ! s e l e c ts u m ( s h u i e ) f r o mk u i t jw h e r er u kr q 9 5 0 9 h 1 l i = ! 合计 赋值语句:h i i 。1 = b b ( bo o k y 0 8r $ 2m $ 41 1 2 l 1 ) 6 第15 负 形式化语占在撤表系统中的研究与应用 l 海帅扎人学坝l j 学位论文 l 4 = l 2 3 属性语句:h 3 :增值税纳税人状态2 ,3 ,4 ,5 ,6 不再举例说明其它各类型的语句。 3 3 形式化语言 形式语言与自动机理论来源于c h o m s k y 对自然语言的研究和a l g o i 6 ( ) 语苦的 语法描述方式m ,认为文法g 由终结符号集、非终结符号集、开始符号( 或称为 以别符号) 以及产生式集等四部分组成“2 “小“”1 。 终结符号是组成语言的基本符号,从语法分析的角度来看,终结符号是语言 不可再分的基本符号。 非终结符号又称语法变量,用来代表语法范畴。一个非终结符号代表 个确 定的语法概念。因此非终结符是类( 或集合) 记号,而不是个体记号。也司+ 以说 每个非终结符号表示一定符号串的集合( 由终结符号和非终结符号组成的符号 串) 。 开始符号是u - 一个特殊的非终结符号,代表语占中被称为“句子”的语法范畴。 产生式( 又称为产生规则或简称规则) 是定义语法范畴的一种书写规则,形 式如下:a 呻卢。箭头也可以用:= 表示,是符号表的f 则闭包+ 中的符 号,称为产生式的左部;卢是符号表的闭包中的符号,称为产生式的右部。 设是一个有穷符号表,它的每个元素称为。一个符号。上的一个字( 也 称为字符串) 是指由中的字符构成的一个有穷序列。其中不包含任何符号的序 列称为空字,记为占。用+ 表示上所有字的全体( 包括空字) ,称+ 为的 闭包。 的子集u $ n v 的连接( 积) 定义为: u v = 够l d u & v ) 即集合u v 中的字是由u 和v 中的字连接而成的。一般情况下u v v u 记vo :s 。因此,v + = v o u v lu v 2 u v 3 形j 化语占在撒表系统中的研究与应用1 ; g = 帅范大学砸i 学位论义 其中,v + 是v 的闭包。设v + = v v + ,称v + 的j f 则闭包。 文法键一个四元式( ,巧,p ,s ) ,其中是非空有限集,其元素称为终结 符;是非空有限集,其元素称为非终结符,巧n = 庐;s 为开始符号,是 个非终结符号:p 是产生式集合( 有限) ,每个产生式的形式为口j 。丌始符 号s 至少必须在某个产生式的左部出现一次。 假定g 是一个文法,如果符号串x 是从开始符号s 推导出来的。即s j x ,则 称x 是文法g 的句型。仅含终结符号的句型又称为旬予。文法占所产生的句子的全 体是语言,记为l ( g ) :l ( g ) = 口is 当口口巧) 对产生式施加不同限制条件,文法分为四种类型0 型、1 型、2 型和3 型。 定义1 o 型文法:设g = ( ,p ,s ) ,如果它的每个产生式a 斗是这样种结 构:口c ( u _ ) 且至少含有一个非终结符,而c ( u ) + ,则文法g 是 一个0 型文法。 1 型文法:设g = ( ,p ,s ) ,如果p 的每个产生式口_ 均满足川例 ( 其中h 、例分别为口、的长度) ,仅仅s 斗除外,则文法g 是一个j 型文 法或上下文有关的。 2 型文法:设g = ( ,p ,s ) ,如果p 的每个产生式口_ 满足:口是 非终结符,卢c ( u ) + ,则文法g 是一个2 型文法或上下文无关的。 3 型文法:设g = ( ,_ ,p ,s ) ,如果p 的每个产生式的形式都是口寸妒或 口_ 甜,其中口和都是非终结符,a 是终结符,则文法g 是一个3 型文法或正 规文法。 1 型文法又称上下文有关文法。对非终结符进行替换时务必考虑上下文,且 一般小允许替换成空串e 。 2 型文法又称上下文无关文法,对非终结符进行替换时不必考虑上f 文。 彤,化语南柏- 撇表系统中的研究与应用海师范人学坝1 。学位论文 3 型文法又称右线性文法。由于这类文法等价于正规式,所以也称_ i f 舰文法。 对于0 型文法,已经证明其识别问题是无解的。一般情况下,不可能在有限 的步骤内判别某个输入串是否为0 型文法的句子( 某些特殊的0 型文法可能有解) ; 对于l 型文法,其句子都是可识别的,不过所有已知的分析算法是指数级的时间 复杂度:2 型文法的句子都是可判别的,许多2 型文法的子集可以用线性叫削复杂 度的算法进行分析:3 型文法的句子可用等价的有限状态自动机在线性时间复杂 度之内以别。形式语言的成果为我们处理实际问题提供了普遍性的参考,在设计 文法时,应该充分考虑到分析算法的有效实现。 本系统定义的e b n f 范式是上下文无关文法,可转换成j e 规文法。 3 4 词法分析 同法分析的功能是识别源输入中的单词符号,将其输入字符串转换成语义相 关符号的序列【8 】。为了有效地实现所要求的功能,词法分析程序需要完成以f 几 件? 作:预处理输入串,滤掉空白符、回车符、注释等编辑性字符:识别出 每个尊词;将单词转换成内部格式,同时利用词法分析自动机检查单词是甭符 合词法要求;确定单词的类型。 执行词法分析的程序称为词法分析器或扫描器。 使用状态转换图是设计词法分析程序的种较好方法。状态转换图是有向 图。在该图中,结点表示状态,结点之间用有向弧上的标记( 符号) 表示在当前 结点状态f 可能出现的输入符号或符号类,而状态则由该结点转换到下一结点。 一张状态转换图包含若干个状态( 即若于个结点) ,其中至少有一个初态,科。- 1 i 个终态( 可能是0 个。终态用双圆圈表示) 。 本系统根据面向对象的程序设计思想,用个类封装了词法分机自动机的功 能。侧法分析表是该类的私有静态成员变量。该变量是一个结构体数组,包括一兰 个变量:当前状态值,输入字符,新状态值。因此,词法分析表记录了整个谰法 分析的状态图。修改词法分析表的内容,就可以构造适应不同解释程序的词法分 析自动机,实现高效率的软件重用和扩展性。 词法分析自动机l 勺部数掘流图如图3 1 所示。单词扫描模块从输入串中得到 单词;单词内部表达转换模块将该单词转换成内部表示的整型值数组;d f a 模块 彤,叫艺语高拍:撇表系统中的研究与心用 卜海师范人学删 i 学位硷殳 接受单词的内部表示,得到终 态值;单词类型值求取模块以 终态值和单词的第一个符号为 依_ 据求得单词的类型值,最后 得到单词及其类型值。 3 4 1 有限自动机 词法分析模块 图3 1 词浊分析模块固 有限自动机是一种识别装 胃,能准确地识别j e 规集,为词法分析程序的构造提供了方法和工具。 有限自动机是具有离散输入输出系统的数学模型。它有有限个内部状态 系统可根据当的所处的状态和画临的输入字 输入带 符决定后继行为。其当前状态包含已输入处理 的信息。 有限自动机模型如图b - 2 所示,包括三个 状态:初始状态、中间状态和终止状态。 在初始状态下,读头指向输入带的最左单 圉32 限盘动机模掣 变换 元,准备读入第一个字符。然后每读入一个字符,从当前状念进入下状态。当 读头读完所有字符后,状态进入终态,则输入带上的输入串被接受:否则,输入 串有错。 说明:终止状态可有若干个,而初始状态一般只有个。 可持j 状态转换图表示状态变换。 定义2 确定有限自动机( d f a ) 是五元组:m = ( s ,6 ,s 。,f ) 其中 q s 是一个有穷集,它的每个元素为一个状态; 又称输入符号表,是个有穷符号表,它的每个元素为一个输入符; 占是从s 到s 的映像,又称转换函数; s 。s 是唯一一的初态; f s ,是一个终态集。 第1 9 嗅 彤t 化语5 九撇表系统中的训究:i f , i 用海! j l f j 范人学f i ! ! t 。学位论史 一个d f a 可表示成一张确定的状态转换图。若d f am 含有m 个状态结点和n 个输入字符,则状态图中有m 个状态结点,每个结点最多有r l 条有向弧与其他结 点相连接,每条弧用中的一个不同输入字符作为标记,图中含有唯一的初态结 点和若卜( 可以是0 个) 终态结点。 定义3 非确定有限自动机( n f a ) 是氘元组:n = ( s ,j ,s 。,f ) 其中 、中的s 、同上; 艿是一个从s + 到s 的子集的映像,即万:s + 斗2 3 ; s 。s ,是一个非空初态集: f s ,是一个终态集( 可空) 。 一个n f a 可以表示成如下形式的状态转换图:图中有r n 个状态结点,每个结 点有若干条有向弧与其他结点相连接,每条弧用+ 中的一个输入字符( 4 i 要求 是不同的输入字符,也可以为空字符占) 作为标记,图中至少含有一个初态结点 与若丁个( 可以是0 个) 终态结点。 3 4 2 确定有限自动机与非确定有限自动机的转换 对于中的任何字符串t ,若存在。条从初态结点到某终态结点的通路, 且这条通路上所有弧的标记符连接成的字符串等于t ,则称t 可为d f am 所接受( 识 别) 。 对j :+ 中的任何字符串t ,若存在一条从某一初态结点到某一终结点的通 路,且这条通路t - 所有弧的标记符连接成的字符串( 忽略那些标记为s 的弧) 等 于t ,则称t 可为n f a n 所接受( 识别) 。 由有限自动机理论:设l 为一个由不确定的有限自动机接受的集合,则存在 一个接受l 的确定的有限自动机。因此,对于不确定有限自动机n ,存在个确 定的自动和l m ,使得l ( n ) = l ( m
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 北师大版八年级数学下册【期末满分押题】夯实基础培优卷(轻松拿满分)(原卷版)
- 三年级下册道德与法治教学设计-3健康生活每一天 苏教版
- 道路保洁技术培训
- 人教版 (新起点)Lesson 3一等奖教学设计
- 安全生产规章制度和劳动纪律培训内容
- 抖音客服入职培训
- 人教部编版一年级上册天地人教案
- 九年级化学下册 第九单元 金属 第二节 金属的化学性质教学设计 (新版)鲁教版
- 初中苏州园林教案配套
- 全国上海科教版初中信息技术八年级第二学期第三单元活动一《了解虚拟现实与增强现实技术》教学设计
- 滨海城市灾害防控-深度研究
- 房屋市政工程生产安全重大事故隐患判定标准(2024版)危险性较大的分部分项工程专项施工方案严重缺陷清单(试行)解读
- 无人机吊装作业安全措施
- 《永辉超市营运能力现状、问题及优化建议探析》10000字【论文】
- 《流行音乐发展史》课件
- 2025-2030全球储罐除锈机器人行业调研及趋势分析报告
- 露天矿排土场初步设计
- 海底捞服务营销策略分析
- GA/T 2144-2024法庭科学涉火案件常见助燃剂及其残留物检验技术导则
- UL499标准中文版-2017电加热装置UL中文版标准
- 中医院手术麻醉科介绍
评论
0/150
提交评论