2024年4月民族语言语音识别模型训练数据集规范_第1页
2024年4月民族语言语音识别模型训练数据集规范_第2页
2024年4月民族语言语音识别模型训练数据集规范_第3页
2024年4月民族语言语音识别模型训练数据集规范_第4页
2024年4月民族语言语音识别模型训练数据集规范_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025年民族语言语音识别模型训练数据集规范本合同共二部分组成,仅供学习使用,第一部分如下:2025年民族语言语音识别模型训练数据集规范第一条合同主体甲方:_____________(名称)地址:_____________(省/市/区/街道门牌号)法定代表人:_____________(姓名)乙方:_____________(名称)地址:_____________(省/市/区/街道门牌号)法定代表人:_____________(姓名)第二条定义与解释1.“民族语言”指中国境内官方认定的少数民族语言,包括但不限于藏语、维吾尔语、蒙古语、彝语等。2.“数据集”指本合同约定的由乙方提供的语音数据及其关联的标注文本、元数据等内容的集合。3.“标注规范”指本合同附件一所列的数据标注格式、质量标准及技术要求。第三条数据集内容与范围1.数据集总时长不少于_____________小时,覆盖_____________种民族语言,每种语言时长不低于_____________小时。2.数据内容包含_____________(如日常对话、新闻广播、特定领域术语等),具体分布见附件二。第四条数据采集标准1.语音采集设备需符合_____________(标准名称),采样率不低于_____________kHz,位深度不低于_____________位。2.发音人需为母语者,年龄分布为_____________至_____________岁,男女比例均衡,地域覆盖_____________(省/自治区)的_____________个方言区。第五条数据标注要求1.标注文本需使用_____________(文字编码格式),时间戳精度至_____________毫秒。2.语音片段需标注说话人性别、年龄、情感状态(如中性、喜悦、愤怒等),具体标准见附件三。第六条知识产权归属1.数据集的所有权及衍生知识产权归甲方所有,乙方不得以任何形式向第三方披露或使用。2.乙方保留其提供的原始录音文件的元数据权利,但不得妨碍甲方对数据集的合法使用。第七条数据交付与验收1.乙方应于_____________年_____________月_____________日前以_____________(存储媒介或传输方式)交付数据集。2.甲方应在收到数据后_____________个工作日内完成验收,逾期未提出书面异议视为验收合格。第八条保密义务1.双方应对本合同内容及履行过程中知悉的对方商业秘密、技术信息等承担保密责任,保密期限为合同终止后_____________年。2.乙方不得将甲方提供的数据标准、标注规范用于其他商业项目。第九条质量保证与瑕疵处理1.乙方保证数据集的语音清晰度信噪比不低于_____________dB,标注错误率不高于_____________%。2.如甲方发现质量问题,乙方应在_____________个工作日内免费修复或重新提供符合要求的数据。第十条违约责任1.乙方未按期交付数据的,每逾期一日按合同总金额的_____________%支付违约金。2.因数据质量问题导致甲方模型训练失败的,乙方应退还已收取费用的_____________%,并赔偿直接损失。第十一条数据安全与合规1.乙方须确保数据采集过程符合《中华人民共和国个人信息保护法》及《数据安全法》,并已获得发音人的书面授权(授权书模板见附件四)。2.数据集存储与传输需采用_____________(加密协议),未经甲方书面许可不得跨境传输。第十二条不可抗力因战争、自然灾害、重大疫情等不可抗力导致合同无法履行的,受影响方应在事件发生后_____________日内书面通知对方,双方协商终止或变更合同。第十三条合同变更与解除1.任何一方需变更合同内容,应提前_____________日以书面形式提出,经双方签字确认后生效。2.甲方有权在乙方严重违约时单方解除合同,并要求乙方支付合同总金额_____________%的赔偿金。第十四条法律适用与争议解决1.本合同适用中华人民共和国法律。2.因本合同产生的争议,双方应协商解决;协商不成的,提交_____________(仲裁机构名称)仲裁。第十五条附件效力本合同附件包括:附件一:数据标注规范附件二:语种及时长分布表附件三:情感标注标准细则附件四:发音人授权书模板上述附件与本合同具有同等法律效力。第十六条合同生效与期限1.本合同自双方签字盖章之日起生效,有效期至_____________年_____________月_____________日。2.本合同正本一式_____________份,双方各执_____________份。第十七条其他约定1.乙方需提供数据采集环境的噪声检测报告及设备校准证书。2.甲方有权委托第三方机构对数据集进行抽检,抽检费用由_____________方承担。第十八条通知与送达甲方收件地址:_____________乙方收件地址:_____________第十九条税费承担本合同涉及的税费由双方依法各自承担,乙方应向甲方开具_____________(发票类型)。第二十条合同完整性本合同构成双方全部合意,取代此前所有口头或书面协议。未尽事宜需经双方签署补充协议。第二部分:第三方介入后的修正第二十一条第三方定义与类型1.本合同所称“第三方”指基于本合同履行需要,经甲乙双方共同书面同意引入的独立主体,包括但不限于数据安全评估机构、技术顾问、中立仲裁机构、数据存储服务商等。(1)协作型第三方:直接参与数据采集、标注、存储或传输的主体;(2)监督型第三方:负责质量审核、合规审查或争议调处的主体;(3)技术型第三方:提供加密、算法支持或其他专业技术服务的主体。第二十二条第三方引入条件1.甲方或乙方需引入第三方时,应提前_____________日向对方提交书面申请,列明第三方资质、服务范围及责任划分方案。(1)具备独立法人资格及履行合同所需的专业资质证书(如数据安全等级保护认证);(2)无重大违法违规记录,且与甲乙双方无利益冲突。第二十三条第三方责任划分1.协作型第三方对其提供的服务成果承担连带质量责任,若因数据采集设备缺陷或标注错误导致甲方损失,乙方与第三方按_____________%与_____________%的比例分担赔偿责任。2.监督型第三方出具的验收报告或合规意见书具有最终效力,但因第三方故意或重大过失导致结论错误的,第三方应承担直接损失的全额赔偿。第二十四条第三方保密义务1.第三方须与甲方或乙方单独签订保密协议,保密义务不低于本合同第八条约定标准。2.第三方员工接触敏感数据的,应通过背景审查并签署保密承诺书(模板见附件五)。第二十五条数据安全与第三方管控1.第三方存储或处理数据时,需采用甲方指定的_____________(加密算法或安全协议),数据留存期限不得超过_____________日。2.第三方跨境传输数据的,应事先取得甲方书面许可及国家网信部门批准,并接受甲方的全流程审计。第二十六条第三方服务费用1.第三方服务费用由_____________方承担,支付方式为:_____________(如按阶段支付、验收后支付等)。2.因第三方原因导致服务周期延误的,每逾期一日按服务费总额的_____________%扣减费用。第二十七条第三方连带责任1.乙方委托第三方完成本合同约定义务的,仍对第三方行为向甲方承担首要责任。2.第三方在履行合同中侵害他人知识产权或人格权的,由_____________方负责处理纠纷并承担最终法律责任。第二十八条第三方变更与退出1.第三方因破产、资质注销等原因无法继续履约的,甲方有权直接指定替代第三方,相关费用由_____________方承担。2.第三方退出时应向甲方移交全部数据及过程文档,并签署数据销毁确认书(模板见附件六)。第二十九条争议解决中的第三方角色1.因第三方服务引发的争议,由甲乙双方与第三方协商解决;协商不成的,提交_____________(仲裁机构名称)仲裁。2.仲裁期间,第三方应继续履行未争议部分的合同义务。第三十条第三方知识产权声明2.第三方使用自有知识产权提供服务的,应授予甲方不可撤销的永久非独占使用权。第三十一条第三方与原始数据的隔离1.第三方不得将本合同数据用于其他项目或与其自有数据混合使用,存储介质需物理隔离。2.第三方访问数据的权限按_____________(如最小必要原则)分配,操作日志需保存不少于_____________年。第三十二条第三方保险要求1.第三方需投保数据安全责任险,单次事故保额不低于人民币_____________万元,并将甲方列为共同被保险人。2.保险凭证需于合同生效后_____________日内提交甲方备案。第三十三条第三方服务终止后的义务1.第三方服务终止后_____________日内,需删除所有数据副本并通过甲方认可的第三方机构出具数据清除验证报告。2.第三方核心技术人员离职的,应重新签署保密协议并通知甲方。第三十四条第三方与乙方的分包限制1.乙方将本合同义务分包给第三方的,分包比例不得超过合同总金额的_____________%,且不得涉及核心数据采集或标注环节。2.乙方需对第三方人员进行_____________(如语言能力测试、技能考核),考核记录提交甲方存档。第三十五条第三方审计权1.甲方有权委托独立审计机构对第三方的数据管理流程进行检查,第三方应配合提供_____________(如服务器访问权限、操作日志)。2.审计费用由_____________方承担,审计周期每年不超过_____________次。第三十六条第三方与法律责任豁免1.因遵守政府监管指令导致第三方无法履约的,不视为违约,但需在_____________小时内书面通知甲乙双方。2.第三方因不可抗力免责的,应提供_____________(如气象部门证明、行政决定书)作为证据。第三十七条第三方通知义务1.第三方发生股权变更、法定代表人变更或主营业务调整的,应在变更后_____________日内书面通知甲乙双方。2.第三方发现数据安全事件的,应于_____________小时内向甲方提交事件报告及应急预案。第三十八条第三方服务验收标准1.第三方服务验收由甲方或甲方指定的监督型第三方执行,验收标准包括:(1)数据完整性:缺失率不超过_____________%;(2)服务响应时间:不超过_____________小时。2.未通过验收的,第三方应在_____________日内完成整改并重新提交验收。第三十九条第三方合同独立性1.甲乙双方与第三方签订的附属协议与本合同具有同等效力,但条款冲突时以本合同为准。2.第三方不得以附属协议未履行对抗本合同项下的权利主张。第四十条签署页(本页无,为签署页)甲方:_________________________(盖章)名称:_________________________地址:_________________________法定代表人(签字):_________________________日期:_________________________乙方:_________________________(盖章)名称:_________________________

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论