第1题-文件过滤器设计_第1页
第1题-文件过滤器设计_第2页
第1题-文件过滤器设计_第3页
第1题-文件过滤器设计_第4页
第1题-文件过滤器设计_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

设计题-1文件过滤器设计题目完成及演示、演讲、答辩时间教学第6周项目组织:自由分组,每组4人文件过滤器文件的再处理软件称作“文件过滤器”包括了:文件属性的处理、文件群的处理、文件目录管理以及文件内容的处理等内容其中文件内容的处理是最复杂、最丰富、最难的内容。“文件过滤器”的主要处理内容1.文件头标识的文件实际格式与文件后缀的一致性识别2.文件夹、子文件夹、路径识别与文件群获取3.文件、文件群打包。“文件过滤器”的主要处理内容4.基于文件目录信息的文件处理。文件筛选、目录排序、文件隐藏等5.文件压缩存储(文件群压缩)6.文件加密与秘钥安全7.文件格式与解析“文件过滤器”的主要处理内容8.文件内容过滤8.1文本文件分词技术8.2字符串匹配运算、正则表达式匹配8.3文本文件不良信息屏蔽“文件过滤器”的主要处理内容8.文件内容过滤8.4文本文件格式规范化8.5文本比对与文件相似度判别8.6数据隐藏8.7文件格式转换、映射。......文件过滤驱动指文件过滤软件的激发方法文件过滤驱动方法1.用户应用层面的文件过滤驱动主要通过独立的文件过滤软件进行,本次的设计题目就是采用这种文件过滤驱动。例;RAR数据压缩、解压软件病毒查杀软件的文件病毒过滤各种图像显示软件......文件过滤驱动方法2.应用软件层面的文件过滤驱动主要通过软件内置的过滤软件实现。例;数据库软件中的文件到数据库中的映射,及数据库的文件存储文本处理软件中的文件映射PS软件的图像格式转换存储......文件过滤驱动方法3.系统层面的文件过滤驱动当有文件进出系统时自动激发文件过滤软件例如:病毒防火墙。是最复杂的文件过滤驱动系统。难度在于系统对进出被保护系统的文件(当然也包括指令、行为等)进行拦截,并进行过滤,以便决定是否对文件“放行”。再次介绍“拦截”技术,汇编中很多同学没明白。用户应用层面的文件过滤驱动Windows图形对话界面驱动。后面讲命令字(行)驱动。本软件按此驱动设计,如果学生已经会Windows图形对话界面驱动,也是很好的。一般说来,通过字符串(多代表文件名、目录名、路径)、命令字(一般一个字母代表一种处理)、连接区分符(一般:-、/、空格)。例如:copytest1.txtc:\test\atest1.txt/-b-u(/后跟控制命令字,-b去掉所有空格,-u字母都改成大写)“文件过滤器”软件基本要求1.使用者对软件的使用通过命令行形式驱动2.软件支持文件后缀与文件内容的一致性识别。(主要通过文件头识别文件类型)3.软件支持文件属性的文字显示,修改。如隐藏属性、系统文件属性、只读文件属性。4.软件支持但文件压缩与解压缩(可直接使用Java类库,或自行学习)“文件过滤器”软件基本要求5.软件支持文件的加密及解密,加密与解密算法自行选择,加密秘钥可输入(直接使用Java类库)6.软件支持文件夹及子文件夹打包操作7.软件支持命令行方式的文件重命名、删除操作8.软件可以对指定文件格式识别,并调用相应外挂软件进行显示,至少支持两种外挂软件,如:图像显示软件、word等文字处理软件。实现上述功能最高得分:70分“文件过滤器”软件提高要求一9.(10分)。建立一个不同于系统打包软件规则的自定义的文件群打包格式,并编写符合这个打包格式的打包、解包软件。该软件启动时需要输入一个秘钥,该秘钥以密文形式存储在软件中,也可以是把秘钥分段存储在软件不相邻的数据空间,以增加破解难度。这个要求适应于保护个人数据隐私,当电脑无意中被他人使用,或移动存储数据被他人无意获取时,由于是个人格式打包存储,别人无法正常把数据弹开,也就无法进行进一步的个人隐私数据破解。这种打包规则越复杂,他人破解难度越大。“文件过滤器”软件提高要求二10.(10分)。建立文本文件“不良文本信息”过滤功能。事先建立一个不良文本标本文件,可以通过标本文件对被过滤文件比对,根据匹配概率阈值,确定被过滤文件的“放行”度。字符串匹配可以采用正则表达式方式,也可以用普通“模式匹配”方式。“文件过滤器”软件提高要求三11.(20分)。C语言程序设计课程“试题自动评判”系统。编写一个C语言程序设计课程中对某学生程序的自动判别的程序。事先针对固定的题目,建立一个标准程序(老师建立),再建立若干个学生编写的正确、不正确的程序(可以假设编译通过),用设计的判别程序给出学生程序正确度的判别结论。

“文件过滤器”软件提高要求四12.(20分)手机骚扰电话分析、识别与拦截功能模拟。针对某一固定手机号码,基于电话局的一段时间来电(电话号、时间、通话时长)、电话号码薄、第三方提供的骚扰电话簿,判别来电中的可能的骚扰、推销业务电话。当有被认定的骚扰电话打入时,给予提醒,以确定是否接听。设计分析方法、骚扰认定策略,并进行过程模拟。

关于“打包规则”设计1.顺序打包被打包文件顺序连接在一起,每个被打包文件的路径、文件名、文件长度信息按格式组成顺序表形成文件头,存储在打包文件开头。打包后的文件内容可以再进行压缩、加密等。文件头信息可以用自己的加密方式加密,因为别人无法解密文件头,通过分析手段弹开文件的代价就很大。关于“打包规则”设计2.顺序打包文件头后置文件头也可以存在文件尾,打包文件开始存储文件头相对于文件头的偏移,并用强加密手段存储密文。由于打包的文件是不确定的,因此文件头顺序表长度就不确定,这种情况把不确定长度的文件头放置在文件尾,对打包文件整体结构比较好。关于“打包规则”设计3.文件等长切割,打乱顺序。如果能尝试被打包文件的等长切割,并打碎文件群切割后的文件块组包顺序,建立链接结构,被破解的难度系数就更高了。关于“文件内容获取”设计1.针对于文件“转储方式”处理。例如:文件顺序打包,包括等长切割打包,文件简单加密等等。内存中开设等长数据缓冲区,每次从文件中以二进制格式(不带转换)顺序读取固定长度的数据进入内存数据缓冲区,再简单(不变长度)处理(或直接)存入目标文件中。要注意文件最后一个不足长度块的处理。内存数据缓冲区开设方法:byte对象数组array类、Java集合中的ArrayList类-类库中支持一些处理(copy、fill、binarySearch、min、max、)。关于“文件内容获取”设计2.针对于文本文件“分词”、“过滤”等处理。例如:不良信息识别,格式规整、不等长记录映射等等。内存中开设可能的最大长度数据缓冲区,每次从文件中以文本格式(可能带转换)顺序读取非固定长度的“一行”文本进入内存数据缓冲区,再编程处理。不同系统存储的文本文件“回车换行”内部格式不一样。程序处理中,可能会“回溯”处理。关于“试题自动评判”设计1.设计基础因为是同一道题目的判别,“相同算法思想决定相同程序结构”的原则是设计该程序的基础。2.预处理大小写转换。空格与分隔符压缩。分行的处理。

......关于“试题自动评判”设计3.题目不同算法标准化程序的设计--老师。4.语句分割5.结构语句匹配6.变量匹配简单软件设计要点1.应用目标在学生现有知识、技术基础条件下,开发一个有一定“价值”的文件过滤器。设定的应用目标要本着:有价值、不复杂、能实现、有特点的原则。简单软件设计要点2.确定要实现的功能并描述通常是在用户提出的目标及功能前提下,经过与计算机技术的对应于调整及修改,得到计算机技术范畴内的用户功能。同时,给出设计者对软件的功能删减、增加、特色、扩展等建议。但一切都必须以满足用户应用目标(不是完全照搬用户提出的功能)为前提。简单软件设计要点3.技术储备、可行性、难度与工作量评估一般有有开发经验的系统工程师承担,并要结合本公司技术人员技术储备进行。还要根据软件特点等,选择开发环境及软件运行环境。简单软件设计要点4.用户使用(手册)设计-用户驱动设计指每一功能,从用户输入、数据获取、数据输出、异常捕获、处理特色的设计说明书。总之一句话:软件还未设计,就知道软件设计完后面向用户,软件是什么样子,以便用户及系统设计师对软件认定。装修房子:事先有立体设计图。简单软件设计要点5.技术基础设计泛指实现的基础技术选择、基础类库选择、数据结构设计、各功能组织。例如:内部数据结构是用数组[],ArrayList,还是用HashTable某种使用哪种布局管理

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论