![2024开源大模型应用指南1.0(风险治理篇)-云计算开源产业联盟_第1页](http://file4.renrendoc.com/view9/M03/33/33/wKhkGWdiWoOAONWpAAH96w1UPUA278.jpg)
![2024开源大模型应用指南1.0(风险治理篇)-云计算开源产业联盟_第2页](http://file4.renrendoc.com/view9/M03/33/33/wKhkGWdiWoOAONWpAAH96w1UPUA2782.jpg)
![2024开源大模型应用指南1.0(风险治理篇)-云计算开源产业联盟_第3页](http://file4.renrendoc.com/view9/M03/33/33/wKhkGWdiWoOAONWpAAH96w1UPUA2783.jpg)
![2024开源大模型应用指南1.0(风险治理篇)-云计算开源产业联盟_第4页](http://file4.renrendoc.com/view9/M03/33/33/wKhkGWdiWoOAONWpAAH96w1UPUA2784.jpg)
![2024开源大模型应用指南1.0(风险治理篇)-云计算开源产业联盟_第5页](http://file4.renrendoc.com/view9/M03/33/33/wKhkGWdiWoOAONWpAAH96w1UPUA2785.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1.0(风险治理篇)目 录一、开源大模型发展态势 1(一)从软件到大模型,开源的变”与不变” 1(二)从垄断到开放,开源重塑AI生态 3(三)从个人到国家,开源释放AI效能 6二、开源大模型创新趋势 8(一)开源语言大模型开启百家争鸣新纪元 8(二)开源多模态大模型注入AI生态新活力 11(三)开源AGENT引领人工智能发展新方向 14三、开源大模型风险挑战 16(一)开源大模型应用或导致安全风险升级 17(二)开源大模型应用或面临多重规制要求 20(三)开源模式或加剧大模型技术滥用风险 28四、开源大模型治理全球动态 29(一)国际组织高度重视开源大模型发展,积极探索全球人工智能治理方案..............................................................30(二)欧盟立法谋求人工智能监管主导权,开源大模型得有条件义务豁免................................................................31(三)美国人工智能监管增强化趋势明显,国防领域率先探索开源大模型影响............................................................33(四)............................................................34五、企业应用开源大模型风险治理实操要点 46(一)开源大模型治理体系构建 47(二)开源大模型风险防控建议 49六、国内开源大模型应用生态完善方向 77图 目 录图1大模型的开放访问等级 3图2人工智能大模型许可协议合规流程 53图3HuggingFaceModel格式Markdown截图 71图4HuggingFaceLLaMA-3.1README.md截图 72图5LLaMA-3.1CycloneDX模型组件转换信息截图 73图6CycloneDXLLaMA-3.1模型卡片信息截图 74图7CycloneDXLLaMA-3.1数据集信息演示截图 74图8LLaMA-3.1CycloneDX文件子组件表示信息截图 76表 目 录表1经典开源语言大模型解析 9表2经典开源多模态大模型解析 12表3经典开源Agent解析 15表4国内外典型大模型许可协议类型表 21表5地方政府开源人工智能相关规范文件 35表6常见人工智能开源许可协议合规要点解读 54表7AI/MLBOM示例 70一、开源大模型发展态势(一)从软件到大模型,开源的“变”与“不变”开源思想兴起于软件开发领域,软件开源核心在于源代码开放。开源(OpnSouc概念根植于上世纪五十年代以来自由开放的计算机文化,并随着开源软件促进会(OpenSourceInitiative96%77%源软件。12024https:///zh-cn/software-integrity/resources/analyst-reports/open-source-security-risk-analysis.html,最后访问日期:202410日。但单一元素的公开和可获取可能并不足以支持使用者复现模型效果,实现开源授之以渔”的根本目的。发者假借开源之名,行限制技术共享之实,OSIAIAI模型是否开源的概3开源大模型可开放的内容包TheOpenSourceAIDefinition1.0,网络地址:/ai/open-source-ai-definition,最后访问日期:202413日。3M.A.PetersandP.Roberts,Virtuesofopenness:Education,science,andscholarshipinthedigitalage.OSI组织的相关定义4OSI认证的许可协议或条款下向公众公开适重和参数,训练和运行AI系统的全部源代码,以及有关训练数据的研究中心发布的AI多种开放选项(见图1和革新。
图1大模型的开放访问等级5(二)从垄断到开放,开源重塑AI生态4TheOpenSourceAIDefinition-1.0,网络地址:/ai/open-source-ai-definition,最后访问日期:2024年11月13日。5RishiBommasanietal.,“ConsiderationsforGoverningOpenFoundationModels”,网络地址:/issue-brief-considerations-governing-open-foundation-models,最后访问日期:2024年开源是打破AI技术垄断的破破船”。智能技术厂商利用先发优势封闭技术、垄断市场。如Meta开源大模型LLaMA2,有力打破了大语言模型长期被OpenAI、谷歌开源大模型是AI应用触达的破加速器。开源开放显著降低了大LLaMA的行业模QiZhenGPTChatMedBenTsao,法律领域的Qwen1.5开源是AI科技创新的破催化剂。围绕成熟的开源大模型项目,8月29日。大模型的产品体验。6开源社区不仅有益于积累技术经验和推进模型Transformer算法在索RNN算法的优化和改进方向,以期在该领域实现技术突破。开源是AI开源大模型的开放性和灵活性基本形成了开源和闭源相结合的商业模式。其中,Meta、百川智能、360等企业倾向于借助开源社区以提升模型质量并快速打造自己的产OpenAI、百度、华为等具有先发优势的企业虽采取闭昇求的增加,开源大模型研发企业逐渐从以产品”为卖点转向以服企业可吸引第三方开发者和企业围绕其开源产品构建应用程序和服2021年第2期,第84-102页。https:///insight/article/3ky83uwLO5JS,最后访问日期:2024年8月30日。出售相关培训等方式拓展盈利渠道。开源是AIClearviewAI从互联网上收集了数十亿AI系统,后该公司便因未经同意收集和使用个员和开发者可对代码进行充分审查以识别其潜在安全漏洞和算法瑕尊重不同文化群体的需求和价值观。(三)从个人到国家,开源释放AI效能88极客公园:《开源大模型领域最重要的玩家们,在关心/担心什么》,网络地址:/article/1845767.html,最后访问日期:2024年8月30日。大模型实现高度个性化的AI应用,以作为个人自我表达的延伸。例如,艺术家和设计师可将个人作品作为输入,对开源模型如StableDiffusion开源降低AI大模型技术效果的实现高度依赖海量数据和充足的算力资AI开源大模型形成的成熟商业模式也将反哺开源大模型社区和技术的演进,全面提升国家在前沿科技和智能产业方面的竞争力。二、开源大模型创新趋势Agent且开源模式也在持续推动大模型技术的迭代创新和应用落地。(一)开源语言大模型开启百家争鸣新纪元能强大的语言大模型仅能通过付费API言大模型包括GPT-NeoX-20B、开源预训练语言模型以及BLOOMLLaMA等高质量开源预训练语言大模型的发布OpenAIGPT、MistralAIMixtral、MicrosoftPhi、GoogleLaMDAGemini、DeepMindGopher、xAIGrok、Meta的LLaMAAIGLM、阿里巴巴的通义千问、科大讯飞的星火、零一万物的Yi等得到快速发展和广泛应用。表1经典开源语言大模型解析专栏1经典开源语言大模型解析1.通义千问Qwen模型简介QwenQwenQWenLMHeadModel模型架构研发的大语言模型和大型多模态模型系列,目前已升级至Qwen2.5关键技术原理通义千问的模型架构基于增强的TransformerRMSNormFlashAttentionSwiGLU激活函数以提高模型的性能。软硬件依赖LinuxMacOSWindows操作系统,运行前需安装transformers(4.40.0+)、Python(3.8+)、PyTorch(2.2+)OLLaMA等模型部署框架快速在本地安装。(当前以中文和英文为主tokenQwen2-0.5B、Qwen2-1.5B、Qwen2-7B16GB显存的GPUV100P100T4等,对于更大规模的模型如Qwen2-72B,则需要使用具有80GB显存以上的A100GPU。2.LLaMA模型简介LanguageModelMetaMetaAI发布的开7B13B33B亿)四种版本。LLaMA系列开源大模型的训练数据集皆来源于公开数LLaMA3.1版本。关键技术原理LLaMA3Decoder-onlyTransformer架构,与LLaMA2类似,但进行了一些改进,如使用RoPE(旋转嵌入)作为位置编码方案,以及分组查询注意力(GroupedQueryAttention,GQA)机制来提高推理速度。软硬件依赖软件:LLaMA3Linux、MacOS、WindowsOLLaMA等模型部署框架快速在本地安装,运行前需安装transformers(4.40.0+)、Python(3.7+)、PyTorch(2.2+)等必要关联组件。8CPU进行高效后端操70BGPUCUDA架构的NvidiaGPU,如30008B16GBRAM,70B32GB或更多才能满足基本运行需求。70BTB级的SSD(二)开源多模态大模型注入AI生态新活力Transformer开源模型大力推动多模态模型发展,开源多模态大模型渐成生态。多模态模型,也称作跨模态模型,21开源模型显著推动了多模态模型的快极大地促进了AITransformer为基础,该框架通过自注意力机制(SfAtnonMhnm、多头注意力(Multi-HeadAttention)等技术实现了对于全局信息的高效捕获,显2019好地理解和处理与图像、视频等其他模态相关的文本信息。同时,CLIPDALL-EFlamingoVLMo、Ernie-ViLGmPLUG表2经典开源多模态大模型解析专栏2经典开源多模态大模型解析1.CLIP(ContrastiveLanguage-ImagePretraining)⚫模型简介CLIPOpenAI推出的一款多模态大模型,可理解和关联图CLIP生成高效的图像和文本表示,用于多种下游任务。9上堵吟:《探索多模态大语言模型》,网络地址:/s/hc6iYR0PSKmPXEfeFfPnYQ,最后访问日期:2024年10月6日。关键技术原理对比学习:CLIP通过增强正确图像-文本配对之间的相似度并降低错误配对之间的相似度,实现了精准的语义匹配。Transformer架构CLIPTransformer模型,ResNet换将两者的输出映射至同一空间。软硬件依赖软件依赖CLIP基于框架,兼容大多数深度学习库和工具。硬件依赖CLIPGPU支持,尤其是在大规模数据集上进行训练时,建议使用高性能GPU(如NVDAA1002.Flamingo模型简介Flamingo是由DeepMind发布的多模态模型,能够处理文本、理,并具有强大的视频处理能力。关键技术原理:Transformer架构:FlamingoTransformer编码器处理Transformer实现。多模态联合学习:Flamingo通过联合训练不同模态的数据,使其在不同模态之间共享表示其在不同模态之间共享表示,进行跨模态推理。⚫ 软硬件依赖软件依赖Flamingo基于TensorFlow或JAX硬件依赖:FlamingoGPUTPU的依赖较大,特别是在视频处理任务中。(三)开源Agent引领人工智能发展新方向AgentAgent创新应用。智能体Agent的发展历经符号规则、统计学习、深度Agent的进的自然语言理解技术赋予了AgentAgent10与其他人工智能领域技术相似,开源模式同样在极大程102024Igent行业报告》——大模型时代的“络地址:ttp:/mp.eixin.qqcom//nv5C-xvIgt_qWL0g2024106度上促进了Agent技术的创新发展和应用触达,LangChain、TaskMatrix.AICogViewAutoGPTOpenAssistant等开源Agent相Agent的研究和应用门槛,推动其发展和应用。表3经典开源Agent解析专栏3经典开源Agent解析1.LangChain简介LangChain是一个用于构建可编程Agent的开源框架,LangChain的架构设计高度模块化,开发者可以根据需求灵活选择和组合不同组件。此外,LangChain还支持与多个开源语言模型的Agent的理想选择。LangChain的核心动化。此外,LangChain开源项目十分活跃,有大量插件和扩展可供使用。关键技术原理语言模型与工具集成LangChain通过结合大型语言模型(如等(Agent的多功能化。任务规划与执行:Agent能够根据用户输入进行任务规划,调用适当的工具完成任务。软硬件依赖软件依赖软件依赖LangChainPython,兼容大多数深度学习框架和工具。硬件依赖:LangChain对硬件要求不高,常用于轻量级任务的自动化执行。2.TaskMatrix.AITaskMatrix.AI是由微软亚洲研究院推出的一个多模态任务关键技术原理多模态融合:TaskMatrix.AI强化学习:TaskMatrix.AI通过强化学习,可在多步任务中不断优化决策,提高任务执行的效率和准确性。软硬件依赖软件依赖:TaskMatrix.AI基于微软的深度学习框架,集成了多种API和工具。硬件依赖:TaskMatrix.AI需要较高性能的GPU支持,特别是在多模态任务中。三、开源大模型风险挑战的可得性还可能加剧人工智能技术的滥用风险。(一)开源大模型应用或导致安全风险升级算法缺陷所诱发的新型安全风险。型,闭源大模型的保密性限制了外部审查,AI系统安全漏洞难以被二是开源大模型系统安全问题处理面临兼容性和社区支持等不源社区缺乏足够的开发维护人员,开源大模型项目将在较长时间内保持脆弱状态,存在严重安全隐患。360TensorFlow、PyTorch等11,如此可能导致输出结果难以预测和确切归因,如有异常难以快速修正和溯源追责。FlagEval11/p/687649249,最后访问时间2024年10月6日。性评测和格式扰动鲁棒性评测中,开源大模型LLaMA-2-7B的扰动后总平均准确率不到40%。攻击者可通一方12。此外,当12参见张玉宏,秦志光,肖乐:《大数据算法歧视的本质》,载《自然辩证法研究》,2017年第33卷第5期,第81-86页。反馈循环被不断复制和放大,进而加剧现有的社会歧视13。根据联合LLaMA2生成的内容中,4(二)开源大模型应用或面临多重规制要求开HuggingFace知识共享许可协议、新型人工智能许可协议。1)宽松型开源软件许可协议如Apache-2.0MIT13新传硕博芝士站:《算法偏见(AlgorithmicBias)》,网络地址:/p/668254492,最后访问日期:2024年10月6日。(或源代码和二进制代码的开源大模型项目可能存在一定风险问题。2)知识共享系列许可协大模型或潜藏较高专利风险。3)新型人工智能许可协议主要包括RAIL(ResponsibleAIPubsLicenses)系列许可协议及Meta的LLAMA2StabilityAIOSI的经能略有差异。
表4国内外典型大模型许可协议类型表序号名称模型类型大模型许可协议备注1阿里云通义千问预训练以Qwen/Qwen2-72B为代表TongyiQianwenLICENSEAGREEMENTTongyiQianwenReleaseDate:August3,2023MetaLLaMA协议有相似之处2阿里云通义千问对话以Qwen/Qwen2-72B-Instruct为代表3零壹万物预训练以01-ai/Yi-1.5-34B-32K为代表Apache2.0Apache2.0许可协议是Apache基金会制序号名称模型类型大模型许可协议备注4零壹万物对话01-ai/Yi-为代表定的被广泛采用的开源许可协议5幻方/深度求索预训练以deepseek-ai/deepseek-llm-7b-base为代表DEEPSEEKLICENSEAGREEMENTVersion1.0,23October2023自定义许可协议,与OpenRAIL可协议有相似之处6幻方/深度求索对话以DeepSeek-V2-Chat代表7上海AI实验室/书生浦语预训练internlm2_5-20bApache2.0Apache2.0许可协议是Apache基金会制定的被广泛采用的开源许可协议8上海AI实验室/书生浦语对话internlm2_5-20b-chat9腾讯预训练LLaMA-Pro-8BLLAMA2LICENSEAGREEMENTMetaLLaMA协议10腾讯对话LLaMA-Pro-8B-Instruct11百川预训练Baichuan2-13B-BaseBaichuan2模型社区许可协议自定义许可协议12百川对话Baichuan2-13B-Chat13Meta/LLaMA预训练meta-70BMETALLAMA3COMMUNITYLICENSEAGREEMENT自定义许可协议。要求遵循贸易管制法律法规14Meta/LLaMA对话meta-70B-Instruct序号名称模型类型大模型许可协议备注15MistralAI_预训练mistralai/Mixtral-8x22B-v0.1Apache2.0Apache2.0许可协议是Apache基金会制定的被广泛采用的开源许可协议16谷歌预训练google/gemma-2-9bGemmaTermsofUse未特别定义贸易管制条款17谷歌对话google/gemma-2-9b-itGemmaTermsofUse未特别定义贸易管制条款18微软预训练microsoft/phi-2MIT被广泛采用的宽松开源许可协议19微软对话microsoft/Phi-3-medium-4k-instructMIT被广泛采用的宽松开源许可协议20Stability预训练stabilityai/stablelm-2-12bSTABILITYAICOMMUNITYLICENSEAGREEMENT自定义许可协议。要求遵循贸易管制法律法规21Stability对话stabilityai/stablelm-2-12b-chatSTABILITYAICOMMUNITYLICENSEAGREEMENT自定义许可协议。要求遵循贸易管制法律法规22TII预训练tiiuae/falcon-40BTermsandConditionsFalcon211BTIILicenseVersion1.0基于Apache2.0许可协议的自定义许可协议23TII对话tiiuae/falcon-40B-instruct24OpenAI-Community预训练openai-community/gpt2MIT被广泛采用的宽松开源许可协议25Princeton普林斯顿预训练princeton-nlp/Sheared-Apache2.0Apache2.0许可协议是Apache基金会制定的被广泛采用的开源许可协议序号名称模型类型大模型许可协议备注26Facebook预训练facebook/opt-30bOPT-175BLICENSEAGREEMENT自定义许可协议。未对贸易管制法律法规的遵从做出特别规定27BigScience预训练bigscience/bloom-3bbigscience-bloom-rail-1.0自定义许可协议。未对贸易管制法律法规的遵从做出特别规定LLaMA3.12明确活跃用户达到阈值需另行申请商业许可、LLaMA2许可协议包含用于训练其他大模型的限制、LLaMA3.1明确了衍生大模型命名的限制、RAILLLaMA3.1可GPL-3.014因此,使用开闭源大模型训据来源合法。1)对于开放数据集而言,使用开放数据集不仅需遵循其开源许可协议义务要求,还需考察其许可协议的传染性和兼容性,LLaMABooks3中包含大量未授权书籍,在部分国家训练和应用可能引发侵权纠纷。2)自采(robot协议14参见辜凌云:《以许可协议为核心的开源社区治理逻辑》,载《知识产权》2024年第6期,第57-58页。争等法律问题,情节严重者还可能触犯刑法。3)商采数据需谨慎关注数据来源合法性以及数据可交易性,以避免发生合规风险。4)应可能导致对于使用者知识产权、商业秘密以及个人隐私的侵犯。5)LLaMA2许若训练数据中包含个人训练数据本身或在带来法律及伦理上的风险。生成物在数15内容输出阶段主要涉及三方面侵(学学报》2024327页。将可能侵犯著作权人的信息网络传播权。16此外,大模型生成物还可ScarlettJohansson对OpenAI提出指控,控诉OpenAI人工智能编码工具Copilot的用户面临的侵权索赔进行赔偿。而开源AI202432-5页。生成物侵权责任承担方,因此相关风险发生时,可能面临责任归属不明的情况。(三)开源模式或加剧大模型技术滥用风险开源大模型不当应用或加深信息茧房、固化认知偏见。早在20桑斯坦便基于对互联网信息传播的考察提出表性不足的“小众”全面认知。GPS导航和智能手机让人类更容易遗忘地址和电话号码,ChatGPT能技术及服务的过度应用还可能逐渐改变人类的交流方式和情感体开源加速人工智能如基于开源语言大模型构建,并去除安全和道德限制的非法大模型FraudGPT支持自动化编写欺骗性短信、钓鱼邮件和钓鱼网站代码,FraudGPT的用户数在短短数月内便超过了先进的国家网络战部队黑客数量。17四、开源大模型治理全球动态为避免人工智能技术发展陷入科林格里奇困境18,平衡风险治理17REEBraudThttps:///news/375547.html,最后访问时间2024年10月6日。18注:科林格里奇困境(Collingridge'sDilemma)是英国技术哲学家大卫·(1980)中指出,一项技术如果因为担心不良后果而过早实施控制,那么技术很可能就难以爆发。反之(一)国际组织高度重视开源大模型发展,积极探索全球人工智能治理方案联合国政策助力凝聚开源大模型发展共识。20206月,联合国秘书长安东尼斯193个会员国一该建议书结合人工智能系统全生命周期伦理影响和各会员国发展差年92024710建多元化AI生态系统。经合组织呼吁构建负责任人工智能系统。经20195月通过全球首个人工智能主题政府间20245月进行了修订。该修订版以创新、可信和人权企业的人工智能发展环境。20239月,77国集团和中国发布《关于当前发展挑战:科学、接入和使用。(二)欧盟立法谋求人工智能监管主导权,开源大模型得有条件义务豁免欧盟建立全球首部人工智能监管立法,平衡AI创新保护。202481中免费或用于科学研究和开发目的而投入使用的开源AI系统可豁免部分合规义务。19同时,该法案对于开源大模型的定义门槛较低,在要求注明来源并遵循类似分发条款的前提下开放共享模型代码及相192AI组件I系统或是第二编(I)或第四编()I3(3AI。场,以最大程度保护开源创新与研究。(三)美国人工智能监管增强化趋势明显,国防领域率先探索开源大模型影响2019AI研发及相关领域主要依靠区域性监管和行业自律等方式开展人工智能治理工作布局。20202310月,拜登政府签署行政令《安全、可靠和可信开发和使202431个地方政府通过相关决议20248月,加利福尼亚州通过了《前沿人工智能模型202024457页。(四)中国人工智能治理规则由“软”及“硬”,开源大模型或得包容性监管人2017新保护。自2022年底至今,各地方政府陆续出台开源与大模型、开2024510日,国务院公布2024(学者建议稿》和《人工智能示范法专家建议稿提供者的责任减免规则。表5地方政府开源人工智能相关规范文件名称地方发布日期实施日期发布机构条款《广东省新一代人工智能创新发展行动计划(年》广东省2022.12.222022.12.22广东省科学技术厅,广东省工业和信息化厅3.加强人工智能操作系统有自主知识产权的通用人端人工智能操作系统和源基础软件加强人工智能领域开源软件生态建设实人工智能发展的软件基础。整合全球人训练和终端执行的开发框放技术网络和开源社区建开源软件生态。研究机器视觉、语音识别、机器翻译、智能交互、知识处理、控制决策等人工智能基础解决方案,支持面向无人驾驶、智能机器人、无人机等人工智能应用领域构建基于开源开放技术的公共数据资源库、标准测试数据库、云服务平台等各类通用开源软件和开放技术平台。克无人系统核心智能芯片业链上下游企业开放核心IP以及关键传感器的新型传感器数据集开源共生态。业共性平台技术和医疗共享资源库,推动上下游企业、科研院所、行业协会、推动医疗数据资源和平台开源共享。持人工智能优势企业和科研院所建设面向行业共性自主核心软硬件开源开放共享源开放与保护政策体系和进重点领域数据信息依法业健康可持续发展。推动人工智能龙头企业基于人工智能操作系统、芯片、传感器等自主核心软硬件提供开源开放共享服务业联盟联合研发基于国产开源学习框架自主建设技术开源和开放的共享平台立人工智能安全性测试模同,建设综合测试验证环境。《南京国家人工智能创新应用先导区建设实施方案》宁政发(2022)133号南京2022.12.122022.12.12南京市人民政府18自主可控人工智能计算中练平台,在科研大模型研试的过程中为人工智能企企业建设线上数据集交易平台,实现数据安全汇聚,逐步形成高质量的行业公共开放数据集。通过算法开源和数据开放,打造创新型开发者社区,汇聚海量算法、模型、产品、应用与服务。《北京市通用人工智能产业创新伙伴计划》北京2023.05.192023.05.19北京市经济和信息化局,北京市科学技术委员会,北京市发展和改革委员会(七)培育软件开发新范AI重以开源聚合创加强工业软件与大模型融模型互联网新软件新服务。《北京市加快建设具有全球影响力的人工智能创新策源(2023-2025》京政发〔2023〕14号北京2023.05.212023.05.21北京市人民政府2.引领人工智能关键核心技术创新。支持创新主体重点突破分布式高效深度学习框架、大模型新型基础架构、深度超大规模图计算、超大规模模拟计算等基础平台技术。支持数据与知识深度联合学习、高维空间多模态语义对齐、大规模认知与推理、可控内容生成、高效低成本训练与推理等关键算法研发,着力推动大模型相关技术创新。鼓励相关技术和算法开源开放。5.加强自主开源深度学习框架研发攻关。针对分布式计算需求,研发动静统一编程、多维自动并行技术,提升深度学习框架在超大规模模型训练和多端多平台推理部署等方面的核心能力,研发多类型模型开发、训练、压缩、推理全流程工具,支持自主深度学习框架与人工智能芯片开展广泛适配和融合优化,实现人工智能国产软硬件技术的深度协同。8.构建高效协同的大模型技术产业生态。建设大模型算法及工具开源开放平台,构建完整大模型技术创新体系,积极争取成为国家人工智能开放生态技术创新中心。组建全栈国产化人工智能创新联合体,搭建基于国产软硬件的人工智能训练和服务基础设施,研发全栈国产化的生成式大模型,逐步形成自主可控的人工智能技术体系和产业生态。《北京市促进通用人工智能创新发展的若干措施》京政办202315北京2023.05.232023.05.23北京市人民政府办公厅围绕模型构建、训练、调优对齐、推理部署等环节,积极探索基础模型架构创新,研究大模型高效并行训练技术和认知推理、指令学习、人类意图对齐等调优方法,研发支持百亿参数模型推理的高效压缩和端侧部署技术,形成完整高效的技术体系,鼓励开源技术生态建设。《深圳市加快推动人工智能高质量发展高水平应用行动方案(2024年》深圳2023.05.312023.05.31中共深圳市委员会办公厅,深圳市人民政府办公厅(四)器人、智能网联汽车等领造基于国内外芯片和算法的开源通用大模型点企业持续研发和迭代商具身智能机器人的研发和与企业共建5家以上人工广东省人形机器人制造业创新中心。《杭州市人民政府办公厅关于加快推进人工智能产业创新发展的实施〔2023〕55号杭州2023.07.242023.08.25杭州市人民政府办公厅(二构建高效协同模型创新生态。推进MaaS新模态通用大模型关键技术攻术和算法开源开放,形成“1+N+X”(二)展多模态通用大模型研发并向中小企业开放模型应权威第三方评测机构评测性能达到国内领先的通用5000万元。支持10个性能先进并在杭成功落地的优秀专用模型,按照不超过研发成本30%的标准给予牵头研发500高校院所和第三方机构围绕模型开发搭建开源开放平台(社区,构建基于开数据、应用协同的产业生态市级开源开放示范平台共数据集支持。《促进人工智能创新发展政宁夏2023.08.132023.09.15宁夏回族自治区人(七)鼓励模型创新。支持落地企业开展大模型训练,20238号民政府办公厅极探索基础模型架构创新,研究大模型高效并行训练技术和认知推理、指令学推理的高效压缩技术和端生态建设给予不超过项目总研发投30%1000金支持。(八支持放、协同共享的人工智能数据归集放及检验检测的创新服务平台,参考平台软硬件投入、人工智能企业用户数、服务成果等方面,择优给予综合贡献度较高的开放平500《武汉市人民政府办公厅关于印发武汉建武汉2023.08.302023.08.30武汉市人民政府动头部企业联合多模态人工智能产业联盟组建创新设国家人工智联合体,创建人工智能方向能创新应用先导区实施方案(2023-2025年2023号开展大模型创新算法开发与开源开放“紫东太初”多模态大模型训练模型架构设计与优化模态大模型通用人工智能企业在汉布局垂直领域模具有影响力的垂直行业模10个以上,培育一批垂直行业模型解决方案服务智能产业实现应用。《上海市促进智能机器人产业高质量创新发展行动方案(2023-2025年》沪经信制〔2023〕915号上海2023.10.192023.10.19上海市经济和信息化委员会,上海市发展和改革委员会,上海市科学技术委员会,上海市财政局,上海市统计局4、重点攻关具身智能等先化学习训练构建机器人运知识库和数据采集平台的器人运行环境与机器人感现人形机器人面向场景应能等前沿技术与机器人融平。《上海市推动人工智能大模型创新发展若干措施(2023-2025年2023号上海2023.10.202023.10.20上海市经济和信息化委员会,上海市发展和改革委员会上海市科学技术委员会中共上9.推进大模型应用生态建型开源社区和协作平台建设开放协同产业生态。海市委网络安全和信息化委员会办公室,上海市财政局《推动区块链、上2023.10.252023.10.25上海市经结合支持生产性互联网服大模型技术赋能生产性互联网服务平台发海济和信息化委员会,上海市商链城市数字基础设施体系开源大模型行业应用展实施方案》沪经信生〔2023〕936号务委员会创新生态空间等重点工作,推动区块链、大模型赋能各类平台发展。3.夯实通用大模型基础能具有国际竞争力的通用大施建设。推动大模型语料数据联盟持续开源高质量数据集大模型产业健康发展。(三)强化政策保障。通过市促进产业高质量发展、商务高质量发展等专项资金,对标杆性企业、应用场景进建设开源大模型行业应用创新生态空对入驻的企业和团队给网服务平台领域的大模型相关应用及解决方案纳入符合条件的专业人才予以套支持政策。《浙江省人民浙2023.12.072023.12.07浙江省人(二推动大模型技术开源政府办公厅关于加快人工智江省民政府办公厅型领域自主可控开源社区能产业发展的和开放创新平台建设,打造2023号模型即服务(MaaS)新范支持自主开源深度学习框架研发攻关和代码托管镜像平台建设制定推广开源领域相关标准和协议进人工智能领域开源软件的国际规则互认。研发多类者群体,繁荣开源生态。AI服务机器人产业集群高质量发展行动计划(2023—2027年》渝经信通202310重庆2023.12.152023.12.15重庆市经济和信息化委员会研院所前瞻布局人形机器人通用原型机研发、AI通灵巧臂—手建模和控制技深导航技术等领域,推动人形机器人技能提升和智能AI大AI大模型评测体系和生态,AI和人形机器人融合发展。《中国(上海)自由贸易试验区临港新片区上海2024.03.042024.09.01中国(上海)2.支持建设人工智能开源平台集聚发展人工区临港新鼓励构建高效协同的大模智能产业若干2024号片区管理委员会打造开源通用大模型生成式人工智能产业,重点支持分布式高效深度学习开发搭建自主可控的人工智能开源平台亿参数以上且落地三个及以上实际应用场景的深度研发费用的10%-30%比例10%比例给予支持,年度支持金额不超过100万元,资助周期不超过3年。《宁夏回族自治区工业和信息化厅宁夏回族自治区财政厅关于征集2024年大数据产业试点示范项目的通知》宁夏2024.03.042024.03.04宁夏回族自治区工业和信息化厅,宁夏回族自治区财政厅2.智能通用大模型和行业应设人工智能大模型领域自主可控开源社区和创新平台署、语料数据等大模型服务。《石景山区促进人工智能大模型产业发展行动计划(2024—2025年》石政办发〔2024〕4号北京2024.03.262024.03.26北京市石景山区人民政府办公室7.整合资源协同发展。发挥科研院所等技术资源优势,联合头部企业开展大模型研发应用,鼓励相关技术和算法开源开放,提升大模型产品研发水平和行业赋能能力。建设人工智能大模型产业标杆型孵化器,梯次培育一批人工智能大模型垂直行业代表企业。《北京经济技术开发区关于加快打造AI原生产业创新高地的若干政策》京技管发〔2024〕10号北京2024.03.282024.03.28北京经济技术开发区管理委员会13.打造人工智能公共服务硬件协同创新与适配验证能软硬件行业解决方案测建设人工智能开源开放平台鼓励大模型领域自主可控开源社区发展支持自主开源深度学习框架研发攻关和代码托管镜像平台建开源社区注册用户活跃度业最高500万元补贴。《广东省人民政府办公厅印发广东省关于人工智能赋能千行百业若干措施的通知》粤办函〔2024〕88号广东省2024.05.262024.05.26广东省人民政府办公厅7.建设大模型开源社区。建设原创性基础大模型资源池支持大模型及其衍生2027年,示人工智能的开源服务体系。《北京市推动“人工智能+”行动计划(2024-2025》京发改〔20241081号北京2024.07.182024.07.18北京市发展和改革委员会,北京市经济和信息化局,北京市科学技术委员会,中关村科技园区管理委员会建设运营北京算力互联互开放并汇聚高价值行业数大模型训练提供算力、数资源持基础大模型在各行业领控的基础大模型为底座加速训练细分行业垂类大模型,完善大模型应用工具控基础大模型型和数据集托管云服务平台,促进开发者分享和协作。五、企业应用开源大模型风险治理实操要点统筹开展开源大模型风险防控工作。(一)开源大模型治理体系构建治理委员会负责制定开源大模型的调整企业的合规策略。相关角色将在各自的领域内为开源大模型的治理和应用提供支持。企业面向开源大模型的治理机制明确了开源大模型治理的规则企业应制定明确的开且不违反相关法律法规和企业内部规定。二是构建风险管理机制。在安全风险管理方面,企业需对开源大业应实施CI/CD并根据实际情况进行优化调整。(二)开源大模型风险防控建议的更新频率和社区活跃度是评估其生命力和持续发展能力的重要指开源大模型项目的成功很大企业可从开源大模型应用全生命周期进行开源大模型安全风险防控。企业在开源大模型引入阶段应做好安全准备源大模型选型时,企业应评估项目是否存在已知的安全隐患和漏洞,——模型部署/21在算法优化——模型再发布/对外提供服务阶段:企业在利用开源大模型提在许可协议合规方面,企业使用开源大模型的合规流程一般包含212024/s/ucJDZf03jru7IB5maCi5zg20246日。以下环节。
图2人工智能大模型许可协议合规流程结合未来使用方式和使用场景判断拟引入开源大模型是否满足公司——模型部署/优化阶段:企业开放人员应在专业合规人员的协用方式和使用场景综合确定待履行义务,并准备义务履行材料。——模型再发布/对外提供服务阶段:企业应根据许可协议要求履行对应声明义务和/或衍生作品再开源义务,并进行义务符合性审查,以确保完全符合大模型许可协议的相关要求。表6常见人工智能开源许可协议合规要点解读专栏4常见人工智能许可协议合规要点解读1.AIPUBSRAIL系列许可协议合规要点AIPUBSRAILLICENSES系列许可协议的制定参考了开源Apache2.0的内容,二者存在类似条款,因此参照Apache许可协议合规实务,可提出如下开源大模型AIPUBSRAILLICENSES系列许可协议合规要点:AIPUBSRAILLICENSES许可协议具体版本大模型许可协议合规项目工作的第一步是判断大模型适用许(即模型所适用(即源代码而根据相应的许可协议内容确定大模型许可协议合规工作的具体依据。评估大模型的应用风险AIPUBSRAILLICENSES系列许可协议附有明确的免责声明和责任限制条款,此类条款对于保护大模型的开源贡献者至关重尽可能选用知名公司发布的或业内广泛使用的开源大模型的参数市场检验,侵权风险较小。而冷门、小众的开源大模型的参数文件和代码文件相对较大,需审慎评估后决定是否使用。AIPUBSLICENSES系列许可协议大模型后续应用和开发的开源闭源选择对于AIPubsOpenRAIL-MAIPubsOpenRAIL-SApache2.0,属于宽否继续开放其衍生作品。对于AIPubsResearch-UseRAIL-M和AIPubsResearch-UseRAIL-S两个研究用途许可协议,许可协议内容中删除了下游和其他用户可以自由访问该被许可的模型/源代码的条款,考虑到其只能用于研究和学术用途,原则上应仅在研究范围内允许访问和使用。AIPUBSRAILLICENSES系列许可协议的具体版本,严格履行许可协议项下规定的义务(例如软件即服务,通过任何媒体复制和分发模型/源代码,按照AIPUBSRAILLICENSES系列许可协议规定履行相关许可协议义务。许可协议义务主要包括两方面:Apache2.0的义务,向模型或专利、商标和归属声明。第二方面是AIPUBSRAILLICENSES系列许可协议特有的用AIPUBSRAILLICENSES系列许可协议附件AAIPUBSLICENSES5A限制作为可执行的条款包含在管辖模型/源代码的使用和/或分发的任何类型的法律协议5AIPubsResearch-UseRAIL-M和AIPubsResearch-UseRAIL-S两个研究用途许可协议,还要求源代码的任何第三方接收者必须遵守仅被允许的学术和研究用途,不得商用。BigScienceOpenRAIL-MLicense许可协议或BigScienceRAILLicensev1.0许可协议合规要点商业公司在合规使用和分发适用BigScienceOpenRAIL-MLicenseBigScienceRAILLicensev1.0许可协议的大模型时应当关注如下问题:BigScienceOpenRAIL-MLicense许可协议和RAILLicensev1.0许可协议的专利和版权授权范围包括模型、模型衍生作品和补充材料(即代码文件及其文档)商业公司在部署、使用和分发适用BigScienceOpenRAIL-MLicenseBigScienceRAILLicensev1.0许可协议的大模BigScienceOpenRAIL-MLicense、BigScienceRAILLicensev1.0许可协议的版权和专利的许可范围包括模型、模型衍(即代码文件及其文档(即代码文件及其文档BigScienceOpenRAIL-MLicense许可协议BigScienceRAILLicensev1.02、3条进行许可,但BigScienceOpenRAIL-MLicense许可协议和BigScienceRAILLicensev1.04条规定的被许可人需要满足的对应条件足5条及附件A的使用限制BigScienceOpenRAIL-MLicense许可协BigScienceRAILLicensev1.0许可协议对被许可人的授权范围包括版权和专利权,但不包括商标和商号权BigScienceOpenRAIL-MLicense和BigScienceRAILLicensev1.02型的衍生作品。BigScienceOpenRAIL-MLicense许可协议和BigScienceRAILLicensev1.03条明确授予被许可人永久的、全球性的、(许可协议另有规定除外)售、进口和以其他方式转移模型和补充材料。BigScienceOpenRAIL-MLicense许可协议和BigScienceRAILLicensev1.08条规定,不允许被许可人使用许可人的商标、商号、标识或以其他方式错误陈述双方之间的关系。特别关注BigScienceOpenRAIL-MLicense许可协议BigScienceRAILLicensev1.07可人还应尽合理努力使用最新版本的模型”的要求商业公司在合规使用和分发适用BigScienceOpenRAIL-MLicenseBigScienceRAILLicensev1.0许可协议的大模BigScienceOpenRAIL-MLicense许可协议和BigScienceRAILLicensev1.07条规定的“被许可人还应尽合理努力使用最新版本的模型”的要求。该要求被公众诟病,因为若商业公司在适用BigScienceOpenRAIL-MLicense许可协议或BigScienceRAILLicensev1.0许可协议后续模型,并再次投入成本对后续模型进行微调存在争议。被许可人对适用BigScienceOpenRAIL-MLicense许可BigScienceRAILLicensev1.0许可协议的大模型修改形成的衍生作品无强制开源义务BigScienceOpenRAIL-MLicense和BigScienceRAILLicensev1.0456条规(例如软件即服务模型进行修改得到的派生作品继续进行开源/BigScienceOpenRAIL-MLicenseBigScienceRAILLicensev1.0许可协议的开源大模型获得的衍生模型作品,有权决定是否继续开源。(无论是否修改BigScienceOpenRAIL-MLicense许可协议和BigScienceRAILLicensev1.05A的使用限制型的衍生作品的副本(无论是否修改,需遵守BgSineOpnRAIL-MLicense许可协议或BigScienceRAILLicensev1.05条和附件A的使用限制。BigScienceOpenRAIL-MLicense许可协议或BigScienceRAILLicensev1.0的附件A13OpenRAILLLaMA2LLaMA3许可协议合规要点商业公司在合规访问、使用和分发大模型LLaMA2/3时应当关注如下问题。LLaMA2/3LLaMA2/3模型参数、代码文件及其文档LLaMA2/3许可协议许可的内容是“LLaMA材料,而“LLaMA材料包括MetaLLaMA2/3和其文档。“LLaMA2/3”是指基础大语言模型及软件和算法,包括机器学调代码以及Meta文档Meta分LLaMA2/3随附的规格、手册和文档。LLaMA2/3的模型权重参数文件和开源代码文件统一适用LLaMA2/3许可协议MetaLLaMA2/3的模型权重参数文件和开源代码文是统一适用其定制的LLaMA2/3社区许可协议(LLAMA2/3CommunityLicense)LLaMA2/3可接受使用政策(LLaMA2/3AcpbleUePoyMeta对被许可人授予的使用关于LLaMA2/3的知识产权应当包括版权和专利权,但不包括商标和商号权LLaMA2/3LLaMAMeta还是被许可方均不得使用对方或其任何关联公司拥有或与之相关的任何名称或标记,除非为了描述和再分发LLaMA材料而合理和惯常使用。LLaMA2/3及其输出用于改进其他大语言模型LLaMA2/3LLaMA材料或任何输出或LLaMA(LLaMA2/3或其派生作品LLaMA2/3的使用者特别关注。如果被许可人及其关联公司提供的产品或服务的月访问7亿,需要另行申请单独的商业许可LLaMA2/3(LLAMA2/3CommunityLLaMA官网的介绍就是一个定制的商业许可,被许可人可将LLaMA用于商业或非商业用途。但LLaMA2/3(LLAMA2/3CommunityLicense)LLaMA2/3的关联公司提供的产品或服务的每月活跃用户数在上一个日历月7Meta申请单独的商业许可协议。Meta可以自行决定是否授予该权利。开源软件许可协议一般没有此类规定,该规定事实上要求大型互联网公司单独申请商业许可,排除在LLaMA2/3(LLAMA2/3Community适用的被许可人范围之外。被许可人拥有LLaMA2/3无强制开源义务LLaMA2/3MetaLLaMA材LLaMA材料的任Meta来都是此类派生作品和修改的拥有者。LLaMA2/3Apache2.0LLaMA2/3获得的衍生作品,有权决定是否继续开源。LLaMA2/3可接受使用政策(LLaMA2/3AcpabeUsePoiy,不得违反使用限制LLaMA2/3LLaMA23(LLA2AcpbleUsePoiyLLMA23用于四类禁止用途:第1类违反法律或侵犯他人权利的方式利用LLaMA2/32类参与、促进、煽动、便利或协助计划或开展对3第4类是未能适当地向最终用户披露人工智能系统的任何已知危险3AIOpenRAIL许可协议相4类是LLaMA2/3许可协议另外增加的限制。LLaMA3特殊要求LLaMA材料(或其任何衍生作品)或使用了LLA3(包括其他AI模型,LLaMA显示“BuiltwithMetaLLaMA3”。LLaMAAI任何此类AI模型名称的开头加入“LLaMA3”Meta仅在此种情况下授予被许可者使用“LLaMA3”标记的许可,被许可者需要遵Meta发布在其官网上的品牌指南,且被许可者因使用“LLaMA3”Meta。通义千问许可协议(Qianwen LICENSEAGREEMENT)合规要点商业公司在合规使用和分发适用通义千问许可协议的开源大模型时应当关注如下问题:(档)的使用、分发和修改的许可通义千问许可协议授予许可的材料主要包括模型、代码和文(利)范围为材料(即模型、代码和文档。通义千问许可协议未授予商标和商号权通义千问许可协议第2条规定,基于阿里云的知识产权或阿里云拥有的在材料中体现的其他权利,授予被许可人对材料非独占复制、创建衍生作品及对材料进行修改。通义千问许可协议第6用阿里云的商号、商标、服务标志或产品名称的商标许可。特别关注通义千问许可协议对模型商业使用的限制条件商业公司在合规使用和分发通义千问人工智能开源大模型时时应当特别关注通义千问许可协议第4条规定“如果被许可人商业1使用则没有被许可人的产品或服务拥有不超过1限制。被许可人对适用通义千问许可协议的人工智能开源大模改形成的衍生作品无强制开源义务通义千问许可协议第3(即后续的模型使用分发者源大模型修改得到的衍生作品是否继续开源有决定权。通义千问许可协议第5条规定了两点使用规则(1(模(包括通义千问或其衍生作品。由此可见通义千问许可协议概括性的要求使用通义千问模型或其任何输出来改进任何其他大型语言模型⚫适用中国法律,杭州法院具司法管辖权通义千问许可协议第9(QwenLICENSEAGREEMENT)合规要点(QwenLICENSEAGREEMENT)在通义千问许(TongyiQianwenLICENSE基础上进行了微“再分发和第五条用规则。对第三条“再分发”的修订主要为:通义千问许可协议(TongyiQianwenLICENSEAGREEMENT)规定,再制造和分发材料或其衍生作品的副本,无论是否进行了修改,以源码或目标码形式,需要满足第三条第二款规定中的abcd四个条件。千问许可协议(QwenLICENSE第三条第二款规定中的abcd四个条件。对第五条使用规则(TongyiQianwenLICENSE(不包括通义千问或其衍生作品(QwenLICENSEAGREEMENT)以使用材料AI模型,但需要在相关产品文档中应当突出显示使用Qwen构建或使用Qwen改进”的内容。就具体应用场景而言,企业应根据各场景下开源大模型应用特点采取相应措施,以确保训练数据的合规应用。(Fnunng大模型微调是指在预训练大规模模型的源语料时,应确保语料来源有合法的开源授权协议或相关授权文件,——量化(Quniaon:大模型量化是指将大型深度学习模型(通常是32位浮点数,即FP32)(如16位浮点数FP168INT8等(Dslaon大模型蒸馏是指通过训练一个较小的模(称为学生模型(称为教师模型”)的输出。蒸馏的目的是在保持性能的同时,减少模型的大——检索增强生成(RAG,RrvalAugmntdGneaon:检索增强生成技术的核心思想在于将预训练大规模生成模型与检索模块(BM25、DenseRetriever等)结合使用。检索模块可从大型文(如问题或上下文相关性最高的文档或信息富的回答或内容。检索模块虽不直接参与模型训练以影响模型参数,企业应评估由模型、检索器和外部文档库构成的整体应用的安全性,确保经过检索增强后的大模型仍然满足相关数据合规要求。4.物料清单构建建议人工智能/机器学习物料清单(ArtificialIntelligence/MachineLnngBllofMtras,ALBOM,即用于记录和管理人工智算法、模型和相关元数据。AI/MLBOM使AI/ML开发过程透明化,开源大模型应用企业可借助AI/MLBOM更好地了解开源大模型系统AI/M
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 酒店改造补贴合同协议书
- 2025年度科技园区办公室租赁合同(科技企业版)
- 住宅精装修合同书
- 循环经济与废物资源化管理作业指导书
- 三农村基层智慧城市建设与发展方案
- 网络安全与数据保护技术作业指导书
- 房地产行业销售与租赁管理系统方案
- 国际能源领域科技创新及投资协议
- 出租车承包合同协议书年
- 软件能力评价与提升作业指导书
- 商业银行的风险审计与内部控制
- 2024项目管理人员安全培训考试题及参考答案AB卷
- 2025年与商场合作协议样本(5篇)
- 2024年12月青少年机器人技术等级考试理论综合试卷(真题及答案)
- 网络与社交媒体管理制度
- 润滑油、润滑脂培训课件
- 寒假综合实践活动作业展示
- 课题申报书:银龄教师支援西部行动成效评价与优化路径研究
- 益普索X空中云汇-2024年B2B外贸企业出海白皮书 -全球支付及金融平台 赋能B2B外贸企业竞争力
- 2025牢牢坚守廉洁底线严守廉政职业底线主题课件
- ADA糖尿病医学诊疗标准指南修订要点解读(2025)课件
评论
0/150
提交评论