




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ICS35.240CCSL70团体标准Applicationofartificialintelligencechip—Technicalrequirementstosystemof中国电子工业标准化技术协会发布IT/CESA1150—2021版权保护文件版权所有归属于该标准的发布机构,除非有其他规定,否则未经许可,此发行物及其章节不得以其他形式或任何手段进行复制、再版或使用,包括电子版,影印件,或发布在互联网及内部网络等。使用许可可于发布机构获取。T/CESA1150—2021前言 2规范性引用文件 3术语和定义 4总体功能 5输入和输出 26服务接口 37功能模块 58性能指标 5参考文献 T/CESA1150—2021本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。本文件由中国科学院计算技术研究所提出。本文件由中国电子工业标准化技术协会归口。本文件起草单位:中国科学院计算技术研究所、中国盲文出版社、中科寒武纪科技股份有限公司、浙江大学。本文件主要起草人:王向东、刘宏、王艳萍、李威、卜佳俊、钱跃良、周玮琪、胡晨希、恽超、刘俊英、王炜、周晟。1T/CESA1150—2021人工智能芯片应用面向汉盲翻译系统的技术要求本文件规定了在人工智能芯片应用方面,面向汉盲翻译系统的技术要求,包括输入/输出、服务接口、功能模块设置、性能指标等方面的要求。本文件适用于在智能芯片上进行汉盲翻译系统的部署、检验及应用。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T15720-2008中国盲文GB/T38640-2020盲用数字出版格式GF0019-2018国家通用盲文方案3术语和定义下列术语和定义适用于本文件。3.1机器学习machinelearning功能单元通过获取新知识或技能,或通过整理已有的知识或技能来改进其性能的过程。[来源:GB/T5271.31-2006,术语和定义31.01.02]3.2汉盲翻译Chinese-Brailletranslation将汉字文本转换为对应的汉语盲文文本。3.3电子盲文electronicBraille以数字形式存储的盲文内容。2T/CESA1150—2021[GB/T38640-2020,术语和定义3.2]4总体功能4.1核心功能汉盲翻译系统应至少具备将输入的汉字文本翻译为对应的汉语盲文文本的核心功能。基于智能芯片的汉盲翻译系统宜充分利用智能芯片运行人工智能和机器学习模型,以实现高效的汉盲翻译。4.2汉语盲文方案汉盲翻译系统所处理的汉语盲文应符合GB/T15720-2008、GF0019-2018。4.3输入输出形式以输入和输出的形式来划分,基于智能芯片的汉盲翻译系统可以两种方式提供汉盲翻译服务:文件翻译和字符串翻译。文件翻译是指输入一个汉字文本文件,返回一个与之相应的盲文文本文件。字符串翻译是指输入一个汉字字符串,返回一个与之相应的盲文字符串。4.4服务方式及接口以提供服务的方式和接口来划分,基于智能芯片的汉盲翻译系统可以两种方式提供汉盲翻译服务:网络服务和本地服务。网络服务是指基于网络通信接口提供服务。本地服务是指基于本机的进程/线程/模块间的通信接口提供服务。5输入和输出5.1文件翻译5.1.1输入文件输入的文件应支持常用的文本文件格式,包括txt格式、word格式(doc或docx)、pdf格式。对于包含格式和非文本内容的文件格式,如word格式和pdf格式,应至少可提取其中的所有标题和正文文本作为翻译的输入。根据需要,输入文件中的文本应包含所需的非汉字字符,如标点符号、英文字母、阿拉伯数字符号及其它可能用到的符号,而非只由汉字字符构成。5.1.2输出文件3T/CESA1150—2021输出的文件应符合GB/T38640-2020中电子盲文的格式要求。可采用标准中定义的XML格式,DBO格式或其它符合标准的格式。5.2字符串翻译5.2.1输入字符串输入字符串应采用UTF-8编码。一般为一个汉语句子。字符数不超过128。根据需要,输入字符串应包含所需的非汉字字符,如标点符号、英文字母、阿拉伯数字符号及其它可能用到的符号,而非只由汉字字符构成。5.2.2输出字符串输出字符串应遵循常用的盲文编码规范,包括Unicode编码和ASCII编码。6服务接口6.1网络服务网络服务采用网络服务接口,可基于socket接口或http服务。6.2本地服务本地服务除可采用运行于本地的网络接口外,也可采用本地接口。如作为SDK,以函数形式提供接6.3具体服务接口6.3.1应具备的服务接口一个用于向上层应用提供服务的汉盲翻译系统至少应具备如下的服务接口:任务创建接口、任务状态查询接口、翻译结果获取接口、翻译任务取消接口。6.3.2文件翻译任务创建接口调用此接口创建文件翻译任务,并在汉盲翻译服务器或本地进行翻译。接口的输入、输出参数见表1。4T/CESA1150—2021表1文件翻译任务创建接口参数定义参数名描述类型输入/输出input_file要翻译的文件名字符串输入参数braille_type要翻译的盲文类型,1为现行盲文,2为通用盲文,3为双拼盲文整数输入参数task_id翻译任务标识符(ID)整数输出参数6.3.3字符串翻译任务创建接口调用此接口创建字符串翻译任务,并在汉盲翻译服务器或本地进行翻译。接口的输入、输出参数见表2。参数名描述类型输入参数名描述类型输入/输出input_string要翻译的字符串字符串输入参数braille_type要翻译的盲文类型,1为现行盲文,2为通用盲文,3为双拼盲文整数输入参数task_id翻译任务标识符(ID)整数输出参数6.3.4任务状态查询接口调用此接口查询翻译任务状态。此接口适用于文件翻译和字符串翻译。接口输入、输出参数见表3。表3任务查询接口参数定义参数名描述类型输入/输出task_id要查询的任务标识符(ID)整数输入参数task_status任务状态,Y表示转换完成,W表示正在执行,N表示任务尚未开始字符串输出参数表2字符串翻译任务创建接口参数定义6.3.5文件翻译结果获取接口调用此接口获取文件翻译结果。输入、输出参数见表4。表4文件翻译结果获取接口参数定义参数名描述类型输入/输出task_id要获取结果的翻译任务标识符(ID)整数输入参数result_url翻译结果文件的URL字符串输出参数6.3.6字符串翻译结果获取接口5T/CESA1150—2021调用此接口获取字符串翻译结果。输入、输出参数见表5。表5字符串翻译结果获取接口参数定义参数名描述类型输入/输出task_id要获取结果的翻译任务标识符(ID)整数输入参数result_string翻译结果字符串字符串输出参数6.3.7翻译任务取消接口调用此任务取消翻译任务。此接口适用于文件翻译和字符串翻译。输入、输出参数见表6。表6翻译任务取消接口参数定义参数名描述类型输入/输出task_id要取消的翻译任务标识(ID)整数输入参数state是否成功取消,true为成功,false为失败输出参数7功能模块7.1模块划分基于智能芯片的汉盲翻译系统,应将机器学习模型与程序独立。基于智能芯片的汉盲翻译系统,应至少划分为接口响应模块、机器学习模型加载模块、翻译模块。接口响应模块负责响应各种接口请求,接收相应的输入,调用内部功能实现,并在需要时返回相应输出。机器学习模型加载模块负责一次性将外部存储(硬盘)中的机器学习模型文件加载至内存;翻译模块负责使用加载的机器学习模型执行翻译任务。在模型加载后,执行每次翻译任务时无需再次加载模型。7.2翻译模块采用智能芯片时,翻译模块应尽可能采用智能芯片运算。机器学习模型应尽可能加载至智能芯片。8性能指标8.1翻译准确率指标自动翻译完成后,将翻译结果与标准答案进行比对,计算相关的翻译准确率指标。对于标准答案中的某个盲文词,当在不考虑读音的情况下,该盲文词与翻译结果中对应的盲文词一致,即对应相同的汉字串时,认为该盲文词分词正确;当该盲文词与翻译结果中对应的盲文词完全一致时,认为该盲文词完全正确。按下面的两个式子计算盲文分词准确率和盲文词翻译准确率。盲文分词准确率=分词正确的盲文词数/标准答案中盲文词总数.(1)6T/CESA1150—2021盲文词翻译准确率=完全正确的盲文词数/标准答案中盲文词总数 对于标准答案中的某个盲文音节,当翻译结果中的对应音节与之完全相同时,认为该音节读音标注正确。按下面的式子计算读音标注准确率。读音标注准确率=读音标注正确的音节数/标准答案中的音节总数 8.2时间效率指标翻译时间:从开始翻译到结束翻译的时间。响应时间:从接收到翻译任务到返回结果的时间。平均每秒翻译字数:平均每秒翻译的字数。8.3测试和性能指标要求测试时,应按照具体的汉盲翻译系统实际应用时的真实场景,包括所处理的汉字文本的领域、主题等,设计测试数据。测试数据应尽可能的多样化,如来源于不同的书籍或资料。测试数据规模一般应不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025届广东省湛江市高三下学期第二次模拟考试历史试卷(含答案)
- 山东省烟台市芝罘区烟台一中2025届高三生物试题综合试卷(15)生物试题含解析
- 上海立达学院《中医健康理念》2023-2024学年第一学期期末试卷
- 天津市南开区2025年数学五年级第二学期期末综合测试试题含答案
- 宜兴市2024-2025学年数学五下期末复习检测模拟试题含答案
- 长春职业技术学院《工程经济与桥梁工程造价》2023-2024学年第二学期期末试卷
- 河南省开封市祥符区2024-2025学年数学三下期末调研试题含解析
- 陕西省西安市蓝田县重点达标名校2025届高中毕业班期末摸底统一考试生物试题含解析
- 湖南财经工业职业技术学院《物联网信息安全技术》2023-2024学年第二学期期末试卷
- 某品牌咖啡营销策划与广告策略
- 下肢动脉闭塞护理查房
- 诉讼异地管辖申请书范本 法院
- 提高压疮预防措施的落实率
- 牙周病科普宣教
- 新生儿呼吸窘迫综合征教学护理查房
- 印刷企业印刷厂安全风险分级管控和隐患排查治理双体系方案全套资料(2020-2021版)
- 低血容量性休克急救护理课件
- 图书馆读者服务课件
- 山西省太原市尖草坪区第一中学高三数学理月考试卷含解析
- 工程安全检查记录表
- 我与地坛读书分享
评论
0/150
提交评论