《中文信息处理技术》教学大纲_第1页
《中文信息处理技术》教学大纲_第2页
《中文信息处理技术》教学大纲_第3页
《中文信息处理技术》教学大纲_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、信息科学技术学院本科课程授课纲领中文信息办理技术授课纲领一、基本信息课程名称中文信息办理技术课程编号ScLI4113英文名称ChineseInformationProcessingTechnology课程种类本专业介绍选修课总学时36理论学时24实验学时12实践学时学分2预修课程信息检索系统合用对象信息管理与信息系统专业计算机的中文信息办理技术是一门综合性的交叉学科,与计算机科学、数学、语言学、情报学等多门学科有关。本课程将系统介绍中文信息办理技术的研究对象、研究方法和技术。经过课程学习,学生有能力进行中文信息办理系统的应用与开发。课程简介课程内容包含三个方面部分:中文信息办理技术中的一些基础

2、理论和基础知识;中文信息办理技术中的基本I/O技术以及有关的字形技术;中文信息办理技术中的自然语言办理技术。二、授课目的及任务授课目的:本课程为高年级选修课,作用是使学生在学习完信息检索系统有关知识后进一步加深对中文信息办理技术的认识,提升信息办理技术的知识水平。经过本课程的学习,学生应付作为大字符集自然语言的汉语在计算机办理过程中的方方面面有深入的认识,对有关系统的应用能娴熟掌握,并有能力开发与之有关的应用系统。授课任务:详细达成以下授课任务:1中文信息办理技术中的一些基础理论和基础知识。包含中文信息办理的有关见解、现代汉语的语言学特色、汉字信息在计算机内部的表示、汉字字符编码字符集。2中文

3、信息办理技术中的基本I/O技术以及有关的字形技术。包含汉字输入技术、汉字字形生成与输出技术。3中文信息办理技术中的自然语言办理技术。包含汉语分词技术、中文信息检索、中文信息抽取、中文文本信息的分类与聚类。三、学时分派授课课时分派章节章节内容授课实验实践共计第一章汉字信息在计算机内部的表示6410第二章汉语分词技术6410第三章网页链接分析426第四章多媒体信息检索44第五章信息自动纲领技术与方法426合计241236四、授课内容及授课要求第一章汉字信息在计算机内部的表示第一节字符信息在计算机内的办理1数值数据与非数值数据2非数值数据办理的主要内容3字符信息的代码系统4英文字符在计算机中的表示第

4、二节汉字代码系统1汉字互换码2汉字机内码3汉字输入码4汉字字形码5汉字区位码第三节汉字字符编码标准集1GB2312-80336信息科学技术学院本科课程授课纲领2Big53ISO/IEC106464Unicode第四节汉字编码字符集的变换1简繁体的变换2汉字在网络上的传输与变换第五节汉字字形和字形库1汉字字形概括2点阵字形描绘技术3矢量轮廓字形描绘技术4曲线轮廓字形描绘技术5其余字形描绘技术第六节汉字输入技术1汉字键盘输入2汉字字形鉴识3汉字语音鉴识第七节汉字排序1汉字词典序2机内码序列3汉字词典序的实现上机习题:编写程序,实现不一样样编码集之间的变换。本章要点、难点:汉字编码系统及互相之间的对

5、应关系。本章授课要求:认识各样汉字字符编码集及变换算法,理解字符编码系统的构成与作用及汉字输入输出技术,掌握汉字编码系统的各样功能、实现方法、生成过程。第二章汉语分词第一节自动分词概括1见解与定义2汉语分词算法的种类3分词词典第二节机械分词法1正向最大般配2逆向最大般配3双向般配第三节无词典分词法1原理与步骤2无词典分词模型3无词典分词算法第四节分词歧义的消解1见解2鉴于规则的分词消歧3鉴于统计方法的分词消歧4其余统计消歧法第五节未登录词的鉴识1未登录词的见解2鉴于统计学的未登录词鉴识3自适应分词的未登录词鉴识法上机习题:编写逆向最长般配法的分词程序。本章要点、难点:各汉语分词算法的实现过程与

6、歧义办理。本章授课要求:认识汉字分词的意义及各样分词算法,理解分词歧义的产生原由,掌握机械分词法的程序设计过337信息科学技术学院本科课程授课纲领程。第三章网页的链接分析第一节链接分析的有关见解1超级链接与WEB网络2超链的价值与特色3内容分析与链接分析第二节PangRank1发源2原理3公式与计算4改良第三节HITS1发源2原理3算法4问题与改良5与PageRank的比较上机习题:编写逆向最长般配法的分词程序。本章要点、难点:编写程度,用迭代法求网页的PangRank值。本章授课要求:认识网络链接分析的见解与原理,理解各样网络链接分析算法公式,掌握网络链接分析的计算过程。第四章多媒体信息检索

7、第一节多媒体技术概括1多媒体的见解2多媒体技术的特色与特色3多媒体技术的产生与发展4多媒体数据压缩技术第二节多媒体信息检索原理1鉴于文本的检索(TextBasedRetrieval,TBR)2鉴于内容的检索(ContentBasedRetrieval,CBR)第三节多媒体信息检索的方法1图像信息检索2视频信息检索3音频信息检索本章要点、难点:多媒体信息特色的表示与抽取。本章授课要求:认识多媒体信息抽取的有关技术,理解鉴于内容的多媒体信息检索的技术路线,要点掌握鉴于内容的图像信息检索方法。第五章信息自动纲领技术与方法第一节文本信息纲领的生成与实现1见解与定义2鉴于统计的自动纲领3汉语文件自动纲领

8、的技术难点4文本信息自动纲领的评估方法5文本信息纲领系统第二节网页信息自动纲领1网页信息纲领的特色2搜寻引擎中的自动纲领3Web页面的冲洗4鉴于篇章构造的中文网页自动纲领338信息科学技术学院本科课程授课纲领第三节数值信息纲领的生成与实现1数值信息自动纲领的特色与流程2医疗诊疗系统中的数值纲领3石油开采系统中的数值纲领4天气预告系统中的数值纲领5股票行情系统中的数值纲领第四节视频信息纲领的生成与实现1视频信息概括2视频构造分析3视频信息纲领的种类4静态视频信息纲领5动向视频纲领6全景拼接图7鉴于文字描绘的视频信息纲领8多媒体视频纲领本章要点、难点:鉴于统计的信息纲领与视频信息纲领。本章授课要求:认识信息纲领的基本方法,理解视频信息纲领实现的基本方法,掌握鉴于统计的信息纲领详细算法。五、核查方式及要求依据课程的特色,将过程核查与终结核查相联合,依据百分制进行核查,学生的学期核查包含以下三个部分:平常核查:包含授课出勤、讲堂发问与测试等,占总成绩20%上机成绩:包含上机出勤、程序达成状况、实验报告,占总成绩的30%期末考试:占总成绩的50%。六、介绍教材

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论