察合台文与现代维吾尔文转写符号的智能输入_第1页
察合台文与现代维吾尔文转写符号的智能输入_第2页
察合台文与现代维吾尔文转写符号的智能输入_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

察合台文与现代维吾尔文转写符号的智能输入

1察合台文化中的声母和超方言查河台维尔文是雅中亚语中特语部落的拼音文字。它从13世纪到20世纪20年代开始写作文字。20世纪20年代。通行于中国新疆和中亚外,莫卧儿王国和埃及也曾使用过。察合台一词源于以成吉思汗(1162~1227)的次子的名字取名的察合台汗国。察合台文有28~32个字母。个别字母专用于拼写阿拉伯—波斯语源的词,词中的元音往往省略。有些辅音用发音近似重复的2~4个阿拉伯字母拼写,有个别的双字母及清浊音混用字母,有几个元音用同一个字母(单字母或双字母)表示,或一个字母在不同音节中既表示元音又表示辅音的现象。有些辅音字母在阿拉伯文中发音近似,字形不同,但在察合台文中发音相同。除字母外,还有辅助符号。字母分词首、词中、词末、单独等形式,从右至左横书。阿拉伯—波斯语源的词,依阿拉伯—波斯文正字法拼写;一部分维吾尔语固有词受阿拉伯—波斯文正字法及回鹘文书写传统影响,其音节仅由辅音构成。词干与某些后缀不连写,正字法遵循形态学原则。察合台文具有超方言的性质。其作品在历史上从小亚细亚直至阿尔泰、印度(莫卧儿王朝)使用突厥语的民族中广为流传。察合台文献,除较晚的铅印本外,多用阿拉伯字母的“纳斯塔里克体”(正体字)传抄(见图1)。现代维吾尔文是察合台文的延续。察合台文一直使用到20世纪初,其传播使用长达7个世纪。早期维吾尔文学家的许多作品都是用察合台语言写成的。最著名的作家有阿塔依、鲁提菲、纳瓦依等。本文是针对古文献整理的特需技术研究中,利用本课题组开发和提出的古维吾尔文(以下称察合台文)支撑环境的编码方案和察合台文输入技术,把察合台文智能输入技术和转写工具作为研究目标,参考国际标准Unicode中的古突厥文符号代码、阿拉伯文转写字符编码、波斯文转写字符编码和现代维吾尔文信息处理专家提出的维吾尔文字母转写符号编码基础上进行了详细分析,提出了察合台文的转写符号编码标准方案,以及察合台文的智能输入和转写工具的设计与软件实现,功能比较齐全的专用文字处理系统的关键技术及实现的方法。2信息处理系统的建立首先成功的开发了基于Unicode4.0版本的Windows2000/XP环境下的察合台文信息处理系统。并已经向国际标准化组织申请了信息交换用察合台文Unicode代码方案。制定的键盘布局方案(见图2和图3)也得到了相关专家的认可。基于Unicode4.0的察合台文代码方案见文献。3先进的拼写和符号输入设计3.1察合台文智能输入虽然解决了察合台文的输入问题,但是大部分使用察合台文的学者录入速度比较慢,非专业人员录入比较困难,容易出错。因此我们设计和开发了察合台文智能输入模块。该模块具有自学习、词频统计、校对功能。操作与汉字全拼输入法类似。根据正在输入的字符自动列出最匹配的10条词语,并根据用户的选择进行输入。模块流程设计和实际输入操作界面如图4、图5所示。3.2先进输入方法设计关于转写符号的初步分析目前已经整理并出版的察合台文文献基本上都用现代维吾尔文翻译/转写方式。上文所说的词典也采用现代维文方式记录了词条的转写。但是目前存在的问题是很多学者所编著的各种文献所使用的转写符号各不相同。没有通用性。我们分析了这些符号,把维吾尔文信息处理专家提出的LSU(Latin-ScriptUyghur)和UKY(UyghurKomputerYeziqi维吾尔计算机文字)和比较权威著作中所使用的转写符号作为主要依据初步制定了一个方案。如表1所示。合台文转写编码目前国内外学者使用的察合台文转写符号也存在不一致性问题。为我们根据阿拉伯文—波斯文转写符号和国际突厥语转写符号,并且在分析大量相关文献中所采用的转写符号的基础上,分别提出了两种察合台文转写符号方案(见表2和表3)。从表中不难看出部分字母有两个以上对应的转写符号。这样转写时遇到的一对多(1∶N)的对应关系、察合台文写法中的的元音脱落习惯、庞大的动词的附加成分,虽然人工转写没多大问题,但是通过计算机进行自动转写时会出现许多歧义(见图6)。目前我们研发的系统采用基于词典的察合台转写生成对应现代维吾尔文的词条的半自动转写方法,对于出现一对多(1∶N)的对应关系的情况,还的借助人工辅助转写。要进一步解决自动转写问题还需要建立和完善察合台文固定搭配和习惯用语词典和语义规则的语法知识库,这是本课题目前正在进一步探讨的目标。察合台文转写符号智能教学法察合台文转写符号比较多,记忆比较难。为此,我们在分析了察合台文文法习惯以及固定搭配规则的基础上,设计并开发了察合台文转写符号智能输入法。该输入法具有自学习、基于词典校对、根据用户习惯转换其他形式的转写(需要用户事先根据自己的习惯设置对应的转写符号转换表)和用户自定义转写符号表、与操作系统无关等功能和特点。其操作类似与中文全拼输入法。具体操作界面见图7。4智能计算机软件察合台文和转写符号的智能输入对古代维吾尔文(察合台文)文献数字化整理系统不可缺少的功能模块。本文提出的察合台文智能输入法和察合台文转写符号的智能输入法是国内首创。对该智能输入法稍加更改可以用于国际上进行语言

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论