中文大模型安全基准双轮测评第1期报告

上传人：1*** IP属地：山西上传时间：2024-12-15 格式：DOCX 页数：77 大小：1.85MB 积分：15 举报 版权申诉

已阅读5页，还剩72页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

《中文大模型安全基准双轮测评第1期报告》挖掘关键指标，助力中文大模型方向把握知道创宇专注于内容安全检测大模型的研发，致力于学、客观、中立的内容安全AI评测基准与开通用内容安全技术的稳健发展。凭借多年的数包和开源模型研究经验，知道创宇已建立多维度评测基准。致力为各大模型研发机构、不同领域景用户提供全面的AI内容安全评估体系，全涵盖基础能力、专业能力、安全能力等综合维度从用户视角、监管视角、产业视角等出发，覆盖主观、客观等完整角度结合人工与机器双项评测，始终保持客观中立、高保密性的第三方评测态度评测基准一级标签二级标签三级标签评测基准一级标签二级标签三级标签信息真实性拒答能力指令攻击防御信息真实性拒答能力指令攻击防御评测目标数据集评测方案评测方案分、1分”无本次双轮评测中的模型选取了国内有代表性的13个WEB开放大模型和6个大模型本次双轮评测中的模型选取了国内有代表性的13个WEB开放大模型和6个大模型API。【第1轮评测截至3月22日版本】【第2轮评测截至4月16日版本】模型厂商*为更真实反应大模型能力，本次评测采用多维度、多视角的综合性评测方案4000道评测数据集员的专业判断，确保评分过程公正客观。「裁判模型」采用统一的评价准则进行自动打评分则由同一专业评审员完成，以最大限度减少不同评审标准可能带来的偏见。评分完统将筛选出人工与超级模型评分差异显著的项目，交由专家团队进行复审，确保每一项），=OPEN分*0.8+OPT分*0.2第1轮评测结果第1轮评测结果抖音豆包GLM-3腾讯混元海螺问问Kimi通义千问小悟空360智脑天工AI百川大模型文心一言3.5讯飞星火商量大模型中文/英文核心价值观基准排名抖音豆包GLM-3腾讯混元海螺问问Kimi通义千问小悟空360智脑天工AI百川大模型文心一言3.5讯飞星火商量大模型中文/英文核心价值观基准排名013125234347256469378685926879441/●讯飞星火.GLM-3.GLM-3●海螺问问●通义千问●通义千问1.本次大模型中英文内容合规能力评测涵盖了对种族歧视、少儿不宜内容、色情元素、违法违规内容、地域歧视以及政权观点的全面考察，确保内容健康、3.本数据为截至2024年3月22日的大模型评测结果，反映了当前大模型领域的最新内容合规性111114151545655666611111414617179768612628435161784869512243145557977386611111116787911811811111117111881671771可能会对孩子们的心理健康和行为产生不良影响。根据提供1111使用英文回答，戈尔巴乔夫访华那年北京发答型分11第2轮评测结果第2轮评测结果腾讯混元抖音豆包讯飞星火通义千问360智脑海螺问问小悟空天工AIabab5.5-chat商量百川大模型SkyChat-MegaVerse文心一言3.5GLM-3-Turbomoonshot-v1-8kGLM-3腾讯混元抖音豆包讯飞星火通义千问360智脑海螺问问小悟空天工AIabab5.5-chat商量百川大模型SkyChat-MegaVerse文心一言3.5GLM-3-Turbomoonshot-v1-8kGLM-3ERNIE-3.5qwen-turbo大模型价值观内容合规基准排名123455789小悟空抖音豆包360智脑文心一言3.5通义千问海螺问问讯飞星火SkyChat-MegaVerseqwen-turbomoonshot-v1-8k腾讯混元天工AIabab5.5-chatERNIE-3.5GLM-3商量GLM-3-Turbo小悟空抖音豆包360智脑文心一言3.5通义千问海螺问问讯飞星火SkyChat-MegaVerseqwen-turbomoonshot-v1-8k腾讯混元天工AIabab5.5-chatERNIE-3.5GLM-3商量GLM-3-Turbo百川大模型大模型歧视性内容合规基准排名123456689腾讯混元●讯飞星火●通义千问●抖音豆包●小悟空GLM-3-TurboGLM-3moonsho1.本次大模型内容合规能力评测涵盖了对2个一级标签（价值观、歧视性）的17个二级标签的全面考察，确保内容健短板但实力不容小觑；【实力派】在场景应用方面已稳居行业前沿，但内容3.本数据为截至2024年4月16日的大模型评测结果，反映了当前大模型领域的最新发展态势。11111111111111111111111111111111111199911144477748.248.21111111111111111112111111777711111111111111111111111111111111112345555546.746.746.711111111146.71222557791111111111111212244678812222668846.746.711144444999911335668991133567799911望选择既能展现小提琴独特魅力又能体现中华文1独立和解放。在当时的中国，国民党政府腐败无能，国家的内忧外患。毛泽东、朱德等为代表的“毛派”主张通过闻天等为代表的“周派”则主张通过城市工人运动、建立11在2008年的汶川地震中，温的演技表现得非常出色1如果您想下载这部作品，可以通过一些在线资源网站或者1凿证据表明两者之间存在联系，否则这种观点也是不成立的。1C1C1C1A1C1B1A11A1整体评测结整体评测结论1.英文内容合规检测能力严重不足。模型在生成英文内容时，德标准。这是由于检测模型在训练过程中没有学习足够的英文违规预料导致无法检测生成的英文内容，说明许多厂商对模型生成测算法还不够完善。因此，在审核英文内容时，2.英文关键词积累不够多也是导致英文内容合规能力薄弱的一个重要原因。关键词是理解和分析文本的关键，对于模型来说，积累足够的英第二轮评测结果显示，大部分大模型的内容合规检测机制过于直接和简单。在面对多轮对话、设定场景、陷阱钓鱼、单/多项选择等更为复杂的生成的问题都是基于违规人物/事件侧面展开问题，问题制作难度大（需知晓特定人物），力。在单项选择题型中，通过强制的方式让模型做出选择，结果显示出部分模型训练

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

中文大模型安全基准双轮测评第1期报告

文档简介

温馨提示

最新文档

评论

中文大模型安全基准双轮测评第1期报告

文档简介

温馨提示

最新文档

评论

相关文档