人工智能口译评测平台建设项目需求_第1页
人工智能口译评测平台建设项目需求_第2页
人工智能口译评测平台建设项目需求_第3页
人工智能口译评测平台建设项目需求_第4页
人工智能口译评测平台建设项目需求_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人工智能口译评测平台建设项目需求序号具体技术(参数)要求1一、建设目标2本项目在《国家英语能力等级量表》理论指导下,结合口译真实场景数据,依托深度学习、自然语言处理、语言技术、机器翻译自动评测方向上的前沿,实现口译交传的自动评测,建成国内领先的智能口译自主评测平台。具体目标如下:31、建设沉浸式自主口译练习评测与资源平台,面向包括翻译专业硕士(MTI)、翻译专业本科(BTI)、翻译学硕士(MA)在内的用户群体,提供完善的英语口译教学测活动。42、建设标准化语言服务数字化平台,平台具备高准确率、高时效性、广泛覆盖面的特点,能够健全口译教学的评价体系,深入推进学科交叉融合,助力新文科建设。53、提供面向师生个人的口译测评服务,师生可通过PC网页端/小程序自主创建个性化口译素材,沉浸式体验AI自动评分。从信息、表达、交际以及综合评分四大维度实时反馈口译质量,并同步统计评测时长,通过数据看板了解在同期同学中的水平段位。6本次项目建成后的服务对象为高级翻译学院师生,用户类型包括管理员、教师、学生,满足现阶段用户数量约800人。7二、建设范围8项目主要为软件系统建设,包括口译评测智能化应用平台定制服务、口译评测AI能力中心、平台计算服务及大模型推理服务三部分。9智能化应用平台定制开发包括平台管理教师端、平台管理学生端、小程序用户服务端、口译评测报告服务模块。10口译评测AI能力中心包括预处理AI模块、语义/声学特征提取AI模块、分数预测AI模块、诊断反馈AI模块。11平台计算服务及大模型推理服务包括平台运行所需的云计算服务、超大规模语言模型推理服务。12供应商中标后30个工作日内可提供给师生初步测试使用的智能口译评测平台,,初步测试使用的智能口译评测平台至少需实现如下功能:131、支持教师添加学生账号,创建口译班级并添加班级成员,教师创建口译校本素材,支持下载参考答案模板,将校本素材参考答案按照模板要求排版,支持排版完成的后的校本素材上传至平台,提示学生参考答案支持.docx文件格式,单个文件小于50M,媒体原音支持.wav.mp3文件格式,单个文件小于50M。142、支持上传媒体原音,对媒体原音打标,标记意群间位置。若媒体原音由多个意群构成,需匹配意群进行多条口译语音录入。创建题目时,需要对参考答案跟媒体原音进行前处理。上传媒体原音音频文件后,支持通过单击进度条新增标记点位,鼠标悬停已有点位可单击删除标记。支持将校本素材分发至班级,教师对学生提交的校本素材练习进行人工打分。153、支持学生搜索并登陆小程序,学生可查看校本/自建练习素材选择需要练习的素材进行练习,支持在移动端点击按钮开始本段口译音频录制,支持左右滑动切换片段。支持重录。演示学生订正口译转写文本,订正完成后进行提交。提示学生提交的口译内容不能更改。164、支持学生查看AI评分及教师评分,支持查看具体评测项目的结果,评测结果包括系统评分和教师评分。系统评分包括总体评分,以及用雷达图的形式对信息、交际、表达三个维度进行评分。支持查看该评测项目中的多条口译片段,支持查看结果文本与标准答案。教师评分包括总体评分,以及用雷达图的形式对信息、交际、表达三个维度进行评分。以及教师评价的优势与不足。175、支持学生对口译水平发起自评,支持对总分、信息、表达、交际四个维度进行自评,支持学生查看个人中心了解学情数据,数据包括已练习校本素材条数与时长,已练习自建素材条数与时长。按月和周展示个人练习时长趋势,展示质量构面趋势,包括个人分,专业平均分,从交际、表达、信息三个维度用雷达图的形式展示个人得分。18三、系统建设需求清单序号产品名称子模块功能描述单位数量备注1口译评测智能化应用平台定制服务平台管理教师端项1本地化部署平台管理学生端小程序用户服务端口译评测报告服务模块2口译评测AI能力中心定制服务预处理AI模块套1云端部署语义/声学特征提取AI模块分数预测AI模块诊断反馈AI模块3平台计算服务及大模型推理服务平台运行所需的云计算服务项13年服务超大规模语言模型推理服务项13年服务19本项目部署包括云端部署和本地部署两部分,其中云端部署的服务为“口译评测AI能力中心”,包括预处理AI模块,语义/声学特征提取AI模块,分数预测AI模块,诊断反馈AI模块;本地部分的应用为“口译评测智能化应用平台”,包括口译评测智能化应用平台管理教师端、口译评测智能化应用平台管理学生端、口译评测智能化应用平台小程序用户服务端、口译评测智能化应用平台小程序口译评测报告服务模块。20本地部署资源需求包括正式环境与测试环境,本地部署环境和设备设施由采购人提供。其中正式环境部署资源需求如下:服务器名称数量操作系统CPU内存系统盘数据盘公网IP反向代理服务器1Centos/Anolis24100100需要应用服务器2Centos/Anolis1632100100数据库服务器1Centos/Anolis832100500文件与视频服务器1Centos/Anolis481001T21测试环境部署资源需求如下:服务器名称数量操作系统CPU内存系统盘数据盘公网IP测试服务器1Centos/Anolis88100100需要22云端部署和本地化部署之间的通信机制、协同运行机制、网络安全和数据安全保障需满足如下要求:23VPC:云端部署需基于专有云上私有网络。实现网络的完全掌控,例如选择IP地址范围、配置路由表和网关等,可以在自己定义的专有网络中使用云资源,如云服务器、云数据库和负载均衡等。通过VPC内网访问,提供10Gbps的内网访问带宽,对于同region下的服务调用提供了带宽保障,对于系统中非评测服务的请求响应时间给予一定的保障(平均RT<=200ms)。24HTTPS:由HTTP进行通信,利用SSL/TLS建立全信道,加密数据包。提供身份认证,同时保护端到端交换数据的隐私与完整性。25RAM:提供管理用户身份与资源访问权限的服务。提供了多元的权限设置能力,可按需配置访问相关云上服务,安全可控。其访问凭证由一组AccessKeyID和AccessKeySecret组成的密钥对构成:26平台端向云端发起的请求均会携带AccessKeyID和AccessKeySecret加密请求内容生成的签名,进行身份验证及请求合法性校验。27开放平台:基于统一架构的开放平台,用于所有云产品的服务接入。评测服务基于开放平台提供服务,在服务接入环节提供了可靠的保障。28评测服务流量控制:基于开放平台统一的限流服务,提供容量允许范围内的流量控制,可自定义调配,保证服务运行的稳定性。29评测服务接口调用白名单控制:通过开放平台统一控制的调用白名单,可限制服务访问的ip端白名单/云账号白名单等。303.1口译评测智能化应用平台定制服务313.1.1.平台管理教师端32口译评测智能化应用平台管理教师端定制开发,主要功能模块需求如下:33账号及权限管理:管理员对平台教师、学生账号与权限进行管理;34班级管理:教师可创建班级,将学生加入班级;35任务创建分发:教师新建口译评测任务,并定向指派各班级;36历史任务管理:教师对创建过的历史评测任务进行删改查;37任务评分及评语:教师可对学生上传作答音频进行量化评分及主观评语;38评测质量及进度报表:教师可查看参与分配任务学生的评测质量及练习进度。39详细需求如下:40账号及权限管理:411、账号及权限管理,以手机号为唯一账号,打通web端和小程序端。42班级管理:431、教师可创建口译班级,并关联学生账号,将学生加入班级;442、教师可查看班级中学生任务个人总练习时长,练习题材类型分布,个人在班级中的排名。45任务管理:461、教师新建口译评测任务,创建【校本素材】(媒体原音及参考答案),并打上难易度、主题等标签;472、教师对创建过的历史评测任务进行删改查;483、教师可将口译评测任务发布至班级;494、查看AI评分及进行评语:教师可查看学生上传的指派任务作答音频的AI评分;教师可对学生上传作答音频进行量化评分及主观评语;505、评测质量及进度报表:教师可查看参与分配任务学生的评测质量及练习进度。513.1.2.平台管理学生端52口译评测智能化应用平台管理学生端定制开发,主要功能需求如下:53任务创建:学生可自行创建评测任务,供自己日常学时积累及口译质量评测;54历史任务管理:学生对创建过的历史评测任务进行删改查;55查看任务评分及评语:学生查看完成任务的AI及教师量化评分及教师主观评语;56评测质量及进度报表:学生可查看自己提交过的口译音频的评测质量及练习进度。57详细需求如下:58首页:591、可查看待完成和已完成的评测任务,包含教师分配的任务和自主创建的历史练习测评任务,学情报表等;602、学生可查看根据评测结果和自身综合情况推送的练习素材内容,并将内容添加至个人收藏夹或快捷创建个人练习任务;613、学生可查看个性化反馈报告。62任务管理:631、学生可自行口译素材,支持自定义素材主题、标签、难度等,供自己日常学时积累及口译质量评测;642、学生可对自己创建过的历史评测任务进行删改查;653、学生可查看教师分配任务的AI测评及相应的教师量化评分和教师主观评语;支持学生下载或导出文本;664、学生可查看自行创建的评测任务及相应的AI评分;支持学生下载或导出文本;675、学生可通过关键词搜索快速定位目标素材;686、支持将校本素材收藏至收藏夹;697、支持共享自建素材;70我的收藏:711、学生可创建收藏夹,收藏素材后可创建任务进行重复练习;同时学生可通过关键词排序快速定位目标素材。72口译评测报告服务模块:731、练习次数及时长报表:支持按照时间维度,以趋势图的形式展示个人以及专业学生每周/每月的练习次数与时长趋势;742、质量构面报表:支持展示质量构面趋势,以构面图的形式展示个人及专业学生在交际、表达、信息三个维度,每周/每月的练习得分。75个人中心:761、学生可进行账号登录/退出、学生可查看个人注册基本信息。773.1.3.小程序用户服务端78口译评测智能化应用平台小程序用户服务端定制开发,主要功能模块需求如下:79个人中心:学生可进行账号登录/退出、学生可查看个人注册基本信息;学生可查看校本素材/自建素材两类素材任务的累计练习次数及时长报表、练习质量构面报表;80评测中心:学生可查看校本素材/自建素材两类素材任务,并进行口译录制;模拟交传场景,学生可进行多片段听-译交替式音频录入;对学生录入音频进行语音识别,转写对应的文本,同时提供学生订正文本内容;学生可对练习素材进行重复提交,并累计计算练习时长及练习质量;81历史任务:学生可查看历史提交的练习任务;学生提交评测后,可查看AI评测结果(非实时,有分钟级别延时),同时会展示教师评测结果。82详细需求如下:83个人中心:841、学生可进行账号登录/退出,学生可查看个人注册基本信息;852、学生可查看个性化反馈报告;863、学生可查看根据评测结果和自身综合情况推送的练习素材内容,并将内容添加至个人收藏夹或快捷创建个人练习任务。87评测中心:881、学生可查看校本素材/自建素材两类素材任务;892、模拟交传场景,学生可进行多片段听-译交替式音频录入;对学生录入音频进行语音识别,转写对应的文本,同时提供学生订正文本内容;903、学生可选择素材部分片段进行练习和测评;914、学生可在测评时手动暂停音频,并进行文本转写;925、查看AI评分,包含片段评分和全局评分,以及查看扣分项;936、查看教师评分和评语;947、学生可查看答案文本;958、答案文本提供查词解析和关键词用法解析,并对重点词汇进行重点标记提醒;969、支持通过单次文本快速定位音频位置;9710、支持对测评结果进行语法检测并生成检测反馈报告;9811、学生可对练习素材进行重复提交,学生可将多次练习结果关联至同一任务并查看多次练习智能对比结果,并累计计算练习时长及练习质量;9912、学生可查看转写文本与原文文本对比展示结果。10013、可通过关键词排序快速定位目标素材101我的收藏:1021、学生可创建收藏夹,收藏素材后可创建任务进行重复练习;同时学生可通过关键词排序快速定位目标素材。1033.1.4.口译评测报告服务模块104口译评测智能化应用平台小程序口译评测报告服务模块定制开发,主要功能模块如下:105把评测结果整合,并生成图形化评测报告。包括包括测试内容,语向,时长。以雷达图的形式展示系统总评分,以及内容、交际、表达三个维度的得分。支持查下详细的口译片段。106练习次数及时长报表:支持按照时间维度,以趋势图的形式展示个人以及专业学生每周/每月的练习次数与时长趋势。质量构面报表:支持展示质量趋势,以雷达图的形式展示个人及专业学生在交际、表达、信息三个维度,每周/每月的练习得分。107详细需求如下:1081、支持按照时间维度,以趋势图的形式展示个人以及专业学生每周/每月的练习次数与时长趋势;1092、支持展示质量构面趋势,以构面图的形式展示个人及专业学生在交际、表达、信息三个维度,每周/每月的练习得分。1103.2.口译评测AI能力中心111供应商中标后10个工作日内提供所投口译评测AI能力中心原厂商出具的《项目授权函》、《售后服务承诺函》。112供应商建设完成的口译评测AI能力能够达到AI测评评分相关度PCC达到0.78以上。1133.2.1.预处理AI模块114语音识别AI模块:面向中转英,英转中两个方向,需支持高精度的中文/英文语音识别服务,与高速的推理识别服务。需支持高精度、低延迟的中文和英文语音识别,将原音音频转为原文文本。需支持高精度、低延迟的中文和英文语音识别,将口译音频转为译文文本,支持同步转写。115机器翻译AI模块:面向中转英,英转中两个方向,需支持翻译模型,支持把考题/试题的原文翻译成译文(异步处理),提供语义参考,口译评测模型通过比对口译结果和参考译文进行打分。116基于语义的智能分句AI模块:面向中转英,英转中两个方向,需支持根据语义把句子聚合成语块,以支持在口译测评环节,能够在篇章范围内动态搜索语块的最佳匹配方案。117语音识别人工标注服务:面向中转英,英转中两个方向,需支持ASR识别中出现的错误对口译评测的准确性有负面影响,需要人工标注提供“ASR结果+人工转写标准答案”来训练ASR模型,从而提升ASR转写准确率。需支持中、英两个语向。1183.2.2.语义/声学特征提取AI模块119声学特征提取模型开发:需支持中转英,英转中两个方向,定制研发针对学生口译音频进行声学特征提取。在表达流畅性维度,抽取语音、语调、语速、流利度等特征;在交际沟通有效性维度,抽取发音清晰度、高低起伏等特征。120语义特征提取模型:需支持中转英,英转中两个方向,分别建立独立的语言学特征提取器。采用分词、词性标注、语义网络等自然语言处理技术,在不同语言粒度上进行特征提取,将针对单词、句子和篇章三个层面进行综合分析。121语言流畅度模型:需支持中译英和英译中两个语向,分别定制研发基于Transformer架构的预训练语言模型的英文与中文语言流畅度模型,能够为口译评分系统提供一个多维度的流畅度分析。122语义相似度模型:需支持中译英和英译中两个语向,分别定制研发基于Transformer架构的预训练语言模型的英文与中文语义相似度模型,该算法模型支持从句子词法、上下文提炼出语义表达,具备高度的语义理解能力,能够从句子的词法结构和上下文中提取深层次的语义信息。1233.2.3.分数预测AI模块124量表口译分数预测模型:为中译英、英译中两个语言方向,分别定制研发基于“语义特征提取AI模块”中的语言流畅度模型、语义相似度模型、句长信息、词汇相似度、关键词命中率等一系列口译描述特征的口译评分模型。评分模型参考《国家英语能力等级量表》,从“内容准确性和完整性”、“表达流畅性和得体性”、“交际逻辑连贯性和沟通有效性”对特征进行聚合,利用机器学习算法拟合内容、表达、交际维度分数,并以此计算总分。1251、需为中译英和英译中两个语向,基于“语义特征提取AI模块”中的语言流畅度模型、语义相似度模型、句长信息、词汇相似度、关键词命中率等一系列口译描述特征,训练优化基于GradientBoostingDecisionTree、逻辑回归等算法的内容评分模型,以评估译文的内容准确性和完整性。1262、需为中译英和英译中两个语向,基于“语义特征提取AI模块”中的语言流畅度模型、语义相似度模型、句长信息、词汇相似度、关键词命中率等一系列口译描述特征,训练优化基于GradientBoostingDecisionTree、逻辑回归等算法的表达评分模型,以评估译文的表达流畅性和得体性。1273、需为中译英和英译中两个语向,基于“语义特征提取AI模块”中的语言流畅度模型、语义相似度模型、句长信息、词汇相似度、关键词命中率等一系列口译描述特征,训练优化基于GradientBoostingDecisionTree、逻辑回归等算法的交际评分模型,以评估译文的交际逻辑连贯性和沟通有效性。1284、需为中译英和英译中两个语向,参考《国家英语能力等级量表》,融合上述内容准确性和完整性、表达流畅性和得体性、交际逻辑连贯性和沟通有效性三个维度的得分,以得出总分。1293.2.4.诊断反馈AI模块130分别为中译英、英译中两个语言方向建立口译关键内容细粒度诊断模型:调用大模型推理服务,优化Prompt,定制研发反馈口译结果中具体哪些片段翻译得有问题,给出更加精细的反馈。1311、需利用超大规模语言模型,为中译英和英译中两个语向,以In-Context-Learning、Chain-of-Thought等方法设计Prompt,对学生译文进行细粒度诊断分析,如错误类型、严重程度,反馈口译结果中具体哪些片段翻译得有问题。1322、需利用超大规模语言模型,为中译英和英译中两个语向,以In-Context-Learning、Chain-of-Thought等方法设计Prompt,根据诊断结果与译文评分模型的结果给出评价。133译文诊断的标注服务;需支持中、英口译译文的细粒度诊断反馈标注,用于大模型以In-context-learning的方式对学生译文进行诊断反馈。1343.3.平台计算服务及大模型推理服务135供应商中标后10个工作日内提供所投平台计算服务及大模型推理服务原厂商出具的《项目授权函》、《售后服务承诺函》。136本次项目需提供满足平台运行3年所需的云计算服务和大模型推理服务。1373.3.1.平台运行所需的云计算服务13.云平台计算服务清单序号云服务类型规格参数单位数量1云服务器CPU&内存:8核16GB。系统盘:120GBESSD云盘。台22GPU云服务器CPU&内存:32核188GB。GPU:1*A10卡。系统盘:40GBESSD云盘。套13负载均衡支持连接数:50000。新建连接数(CPS):5000。每秒查询数(QPS):5000。套14Mysql数据库CPU&内存:4核8GB。存储:100G。高可用:一主一备的高可用架构,支持自动故障切换。备节点不可访问扩展能力:支持增加只读实例扩展读能力。套15Redis主从双副本下的数据可用总容量:2G分片数:2。架构:分片集群架构,支持代理连接。套16消息队列版本:RocketM5.0版。支持消息读写TPS总和:2000次/秒。套17容器编排支持企业级容器化应用的全生命周期管理。套18SLS日志服务月写入数据量规格:1TB。套113.云平台计算服务技术要求序号服务名称服务技术指标要求1云服务器1、网络:平均时延不高于55US。2、存储支持存储QOS能力设置,规格最大支持100万IOPS的存储能力。3、快照:支持应用一致性快照,保证数据库数据的可恢复性;支持快照跨账号共享。4、镜像:支持镜像构建能力,自动化构建镜像,自动检测镜像缺陷。2GPU云服务器1、网络:平均时延不高于55US。2、存储支持存储QOS能力设置,规格最大支持100万IOPS的存储能力。3、快照:支持应用一致性快照,保证数据库数据的可恢复性;支持快照跨账号共享。4、镜像:支持镜像构建能力,自动化构建镜像,自动检测镜像缺陷。5、支持容器场景下隔离GPU资源,任意划分GPU的算力和显存,多个容器共享一张GPU卡。3负载均衡1、支持连接数:50000。2、支持新建连接数(CPS):5000。3、支持每秒查询数(QPS):5000。4Mysql数据库1、MySQL版本:需支持主流版本,包括5.5、5.6、5.7、8.0。2、支持临时升级:支持临时升级资源规格,到期后自动降回原规格。3、在线升级存储空间:支持业务无中断在线方式升级数据库存储空间。4、数据库连接:支持域名形式数据库连接,支持修改数据库连接,支持修改端口。5Redis1、架构:支持主备,集群,读写分离,单副本;2、支持自定义端口号:支持创建时设置端口号,或创建后修改端口号;3、连接地址:支持修改连接地址;4、实例重启:支持实例重启;5、审计日志:支持查看审计日志;6消息队列1、消息重试:消费者消息消费失败重试机制,确保消息可以尽可能被成功处理;2、运维能力:提供诊断系统,用户自主分析消息服务是否健康使用;3、兼容性:兼容开源RocketMQ4.x,RocketMQ5.x系列版本,提供对应版本的产品能力;4、高可用:客户端与服务器间网络故障后无需重启应用服务器可恢复;7容器编排1、安全能力:支持集群内应用东西向网络安全策略;2、应用备份:支持对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论