




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ONTNS2022开源年度报告开源⼤事记篇 ! 01⼀. 开源商业⼤事记 03中国开源商业领域投资降温 03「⼤⼚」纷纷设⽴开源管理办公室,开源合规与安全受到⼴泛重视 03⾛向全球:中国开源商业公司集体出海 06⼆. 开源安全⼤事记 07开源安全攻击持续⾛⾼,⽹络数据泄露已成为重⼤问题 07基础软件VE漏洞频繁出现,影响范围⼤波及范围 07开源安全组织发布开源软件安全指南,多家联盟与企业发布漏洞赏⾦计划 07开源安全⼯具与与开源安全项⽬相继推出 082023年⽹络安全市场预测 08三. 开源技术⼤事记 09⼈⼯智能 10操作系统 11编程语⾔ 123.4Web3 13数据库 13云计算 16四. 开源法律⼤事记 17SC.Vizio,⾸个以消费者⾝份提起的GPL维权案件 17GitHubCopilt,使⽤开源代码进⾏AI训练引发版权争议 18南京未来诉江苏云蜻蜓,GPL抗辩获法院⽀持国内⾸案 18中国信通院牵头成⽴“可信开源合规计划”并发布《开源合规指南(企业篇) 18 19五. 开源社区、⽣态⼤事记 20政治⽆处不在,开源也不能独善其⾝ 20各国政府与开源的关系纷繁复杂 20更多中国⼈在开源社区中发挥影响⼒ 21开源报告与榜单纷纷出炉,喜忧参半 21开源平台的发展,依然在探索中 22开源个体⼾⽣存现状,个⼈英雄主义的⻩昏 222022开源年度报告数据篇 ! 23GitHub数据
..........................................................................................................................24⼀.概述 24⼆.指标介绍 24通⽤指标 24社区指标 25项⽬分析指标 25三.宏观洞察 26GitHub活跃趋势图 26全球项⽬Openank排名op10 28中国项⽬Openank排名op30 30中国企业Openank排名op30 31中国开发者Openankop50 33基⾦会中中国项⽬排⾏ 34开源基⾦会中国企业数据分析 35中国企业主导在CNCF基⾦会Landsape中项⽬的OpenRank排⾏榜 35中国企业发起并捐献到Aache基⾦会的项⽬OpenRank排⾏榜 36技术领域排名 37云原⽣ 37⼤数据 37数据库 37操作系统 38四.项⽬洞察 38机器⼈活动占⽐ 38社区成⻓ 39社区反馈 40Issue回应天数 40PR回应天数 41仓库⼯作时间分布图 41仓库审查 43五.⼯具介Giee数据篇
..........................................................................................44.............................................................................................................................45⼀.概述 45⼆.主要内容与发现 45总体趋势 45总体语⾔趋势 45增速最快语⾔ 46年度最受欢迎的开源项⽬领域 46年度最受欢迎的开源组织 47各地区开源贡献⽐例 47Giee指数 48Giee指数评估维度与算法 482022年Giee指数op10 50总结 512022开源年度报告商业化篇 ! 52⼀. 概述 53⼆. 开源软件商业化步⼊全球化探索阶段 53开源软件商业化步⼊全球化探索阶段 53软件全球化是发展的趋势 57开源软件具有天然的全球化发展的趋势 58开源软件公司的国际化扩张 58开源软件全球化有多⽅⾯的驱动元素 59塑造更成熟的公司形象 59减少对单⼀市场的依赖 59获取新的可持续的发展空间 60商业全球化的挑战与困难调整产品来解决本⼟化需
................................................................................................60........................................................60海外市场运营⾯对多⽅⾯难题 61改变组织架构来适应全球化运作 61开源软件公司⾯对运营全球化开源社区的挑战 61全球化商业化的实现路径 62全球化开源⽣态运营 63全球化服务 64全球化销售(云) 64全球化与本⼟化的选
.......................................................65产品解决的需求是否是全球化需
..........................................................................................65产品的技术特点能否⽀撑全球化 65三. 开源商业化的驱动要素 66开源社区建设是商业化的基础壁
.......................................................................66明确开源社区对企业的重要意
......................................................................................66构筑多元开放的社区⽣态 67丰富社区内容建设 68活动促进传播和增
........................................................................................................69构筑商业化开源产品竞争⼒ 70赛道和创新性共同决定产品市场空间 70商业化产品切中付费痛点 71快速迭代以保持竞争⼒精益治理实现降本增
..............................................................................................................71..........................................................72开源协议是开源治理的前
.......................................................................................................72社区治理是不断壮⼤的社区⽣态的基⽯ 73开源安全问题治理需要⻓期关注 74四. 开源项⽬资本市场情况 75全球市场情况 752022年国际⾦融市场不确定性增加,早期投资热度不减 75商业开源软件资本市场快速增⻓ 75C投资⼈聚焦开源软件市场 77中国开源软件商业化发展情
...................................................78国内开源项⽬多元化,领域持续繁荣 78资本市场对开源项⽬保持⾼度关注 792022开源年度报告问卷篇 ! 81⼀.报告背⼆.重要发
............................................................................................................................82...................................................................................................................83三.问卷结果概览 84四.受访者特征 85基本特征 85已⼯作受访者特征 86已⼯作受访者⼯
..........................................................................86已⼯作受访者所属⾏业 86已⼯作受访者⼯作类型 87已⼯作受访者所在企业开源管理程度 87学⽣受访者特征 88学⽣受访者所属专业 88学⽣受访者实习/实践经历 88公开代码使⽤情况 88五.开源参与情况 89开源社区中的⻆⾊分布 89开源使⽤情况分析 89产品开源在产品选择时的重要性 89使⽤开源软件的原因 89检索开源产品的途径 90选择开源产品的因素 90使⽤开源产品时的问题 91与开源社区的沟通⽅式 91是否与社区有互动 92吸引⽤⼾为开源做贡献的因素 92贡献意愿 92开源贡献情况调查 93参与贡献时⻓ 93贡献类型 93每周贡献时⻓ 93参与的开源项⽬种类与平台 94参与开源贡献的原因 94开源协议了解程度 94贡献开源的回报类型 95开源贡献中编程语⾔分布 95开源社区运维者调查 96社区基本情况 96社区协作情况 97六.国内开源发展调研 98国内开源发展势态 98国内外开源发展差距 98开源的最终⽬的是否是商业化 99开源度量是否有价值 99客观评价开源项⽬的指标 99投资开源的意 100七.总 100源年度报告2022开源年度报告 !概述从2021年开始,我们新增了《开源⼤事记》这⼀栏⽬,当时的想法其实是⽐较简单的:每年在开源界发⽣那么多⼤事,我们挑⼀挑,整理⼀下,再略加评述,也就可以了。到了2022年,我们搜集整理接近300条开源相关的新闻报道,却发现事情反⽽变得棘⼿起来。⾸先是分类:那么多事件,应该如何分类,有些事情似乎既算是社区事件,⼜算是商业事件,⽽且还跟开源安全相关,那怎么办?其次是取舍:怎么才算是⼤事件呢? 每年那么多开源相关的投资,多⼤的投资才值得关注呢?引发⼤量议论?到底是对全球的影响重要,还是应该更加关注对中国的影响呢?最后是总结:当我们尝试着以历史的眼光来看这些当下正在发⽣的故事,有哪些是值得关注的趋势,⼜有哪些可能只是⼀时热闹呢?以下的内容,就是我们将⼀年⼤事,分开源商开源安开源技开源法、“开源社区&⽣态”五⼤分类,尝试作出的年度总结。[1]htps://ww.becloudom/eofsaasops23/2022开源年度报告! 开源⼤事记篇⼀.开源商业⼤事记中国开源商业领域投资降温2022年,国际⾦融市场的重⼤不确定性,以及后疫情时代的经济不振,同样波及到了开源商业领域,在2020-2021持续两年的「开源投资热潮」后,今年我们明显感受到了开源商业领域的投融资逐渐降温冷却。据不完全统计,2022年度中国共有13家开源商业公司获得融资,交易数量⼤约仅为2021年度的1/2。且除Zilliz获得了6000万美元B+轮融资外(也属中早期融资),其他皆为A轮或A轮前的早期投资,交易⾦额较2020-2021更是九⽜⼀⽑。和多位关注开源Infa的投资⼈和创业者沟通,我们发现「降温」后投资⼈会更加回归商业的本质,直⾔「开源是⼿段⽽⾮⽬的」,更关注从开源社区到商业化的可⾏性和执⾏路径,社区⽤爱发电的理念和故事已不再⾜以说服投资⼈「买单」。卫剑钒:“⽤爱发电”当然不能说服投资⼈了,投资⼈要的是回报,爱是不求回报的。对吗。卫剑钒:“⽤爱发电”当然不能说服投资⼈了,投资⼈要的是回报,爱是不求回报的。对吗。「⼤⼚」纷纷设⽴开源管理办公室,开源合规与安全受到⼴泛重视「开源投资热潮」虽已渐渐褪去,但过去两年在资本的加持下,实实在在加速了开源技术在千⾏百业的应⽤落地。随之⽽来也暴露出了⼀系列安全和合规隐患⸺2021年末的og4j漏洞事件影响范围之⼴,波及到了全球范围内近⼀半科技企业,开源项⽬的安全性被提到了新的⾼度。同时,软件⾃由保护协会诉讼Vizio违反GPL,甲⻣⽂诉⾕歌版权侵权案尘埃落定,相关判的讨论成为焦点,也对企业未来开源合规治理具有较⼤的参考意义。越来越多企业开始关注开源规范和规范流程。伴随着开源技术越来越⼴泛的应⽤,开源合规意识和开源规范流程被各企业重视,国内诸多企业开始探索,积极成⽴开源管理办公室(OSPO),通过建⽴⼀套成熟的⽅法论协调企业对内、对外的开源⼯作。•2022开源年度报告! 开源⼤事记篇••对内:OSPO参与企业开源战略决策,为企业引⼊开源软件制定相应的制度流程并提供技术、法律等专业指导,确保开源使⽤与贡献遵从许可证规范,推动企业内部开源⽂化建设以及开源⼈才培养,制定与管理企业内开源⼯作的绩效和激励措施,管理企业内部开源的IT基础设施,推动企业内源社区建设、内部⼯具开发等。•对外:OSPO是企业内部开源团队与外部社区的连接器,与上游社区、开源基⾦会、其他社区保持良好的协作关系,积极指导企业内部技术团队参与外部社区贡献,并在集团层⾯制定企业开源技术品牌传播策略。•边思康O是lmaker”,他们牵引⼀个社区/公司成功的诸多因素,让⼀些原本不可能发⽣的化学反应发⽣,让另⼀些发⽣的化学反应更⾼效。••2022年5⽉,字节跳动公布⼀封内部邮件,官宣开源委员会正式建⽴。⽽在此之前,阿⾥巴巴、华为、兴通讯、腾讯、蚂蚁集团、滴滴、微众银⾏、⼩⽶、百度等均已设有开源委员会/开源管理办公室。•放眼中⽴社区,2022年2⽉,ODOGoup与Linux基⾦会研究合作,发布了《开源项⽬办公室的演变》⽩⽪书;2022年3⽉,开源社ONESGoup官宣成⽴,专注企业开源战略研究;2022年9⽉,在中国信通院起的OSCAR开源产业⼤会上,国内⾸份《2022年OSPO案例汇编(第⼀期)》正式发布,收录了多家企业OSPO实践案例;2022年10⽉,由LinuxoundtionAC布道者团队OSPOSIG发起的OSPOSummit官宣启动。边思康郭雪:开源办公室在中国的形态会更为丰富,可能是开源委员会、开源⼩组等各种形式,可能是虚拟组织亦或实体组织。未来开源办公室在企业的发展可能会遵循标准部⻔的发展路径,负责内外协同总归⼝,拉通各业务团队,制定统⼀规则。开源办公室的发展也再次印证了开源逐步上升⾄企业战略层⾯。边思康开源办公室(OSPO)的种类有很多种,具体的实现其实很值得⾏业去探索和讨论。开源办公室的价值体现在:OSPO是标准化API,能够极⼤降低开源领域的合作成本;OSPO是⼀个“服务”,能对之前⼀些灰⾊地带的问题和挑战负责起来,从⻛险做起,到提升效率,到带来业务结果,提升空间很⼤;OSPO链接起来之后,会成为⼀个“开源价值⽹络”,这个⽹络就是“OSPO的社区”。王伟:
相较于2012年就成⽴的TODOGroup,ONESGroup的成⽴代表着国内对OSPO这个事物的关注与实践才刚刚开始。开源在国内的极⼤发展,⼜给了我们同步世界,实践创新带来了新机会。今年的这份报告,我们已经开始看到诸如OpenDigger(⽊兰开源社区)、DevLake(Apache)、Hypercrx(华东师⼤)等由国内企业、⾼校、政府机构所主导的开源创新项⽬,开始发挥越来越重要的开源治理与数据服务的作⽤了,相信今年OSPOChinaLandscape的第⼀个版本就可以顺利发布,拭⽬以待。2022开源年度报告! 开源⼤事记篇Pr围绕开源合规与开源安全,在投融资市场持续降温的情况下,安势信息逆势获得了 2 笔数千万元天使轮和2022开源年度报告! 开源⼤事记篇Pr围绕开源合规与开源安全,在投融资市场持续降温的情况下,安势信息逆势获得了 2 笔数千万元天使轮和e-A轮投资,也恰恰证明了企业开源代码扫描与合规治理已成为刚需。⼀环,能够客观、科学的为决策者提供决策⽀持,希望⽊兰在孵化OpenDiger项⽬,结合GROUP的平台,未来发挥更重要的技术⽀撑作⽤。2022开源年度报告! 开源⼤事记篇⾛向全球:中国开源商业公司集体出海提到2022年中国软件公司⼝中最常提及的关键词,⾮「出海」莫属。从各个社区的metup,到跨⾏业的增⻓⼤会,再到各个软件企业的⽤⼾⼤会、开发者⼤会,我们在不少社区活动上都看到了关于「出海」的热烈讨论,更⼴阔的国际市场已经成为中国开源商业公司们的共同选择⸺PingCAP、Zilliz、JinaAI、思数据、API7、tamNtive、Spheex、arocks等知名开源商业公司都已着⼿在海外组建或拥有⼀定规模的销售、社区运营与产研团队,由CO亲⾃挂帅。我们观察发现,在诸多软件出海企业中,开源商业公司的步伐往往更快,更易在国际市场获得较⼤关注。这是因为,软件产品研发往往“唯快不破”,开源有助于产品快速获得⽤⼾反馈,同时吸引「同道中⼈」⼊到社区贡献,以其在⽣产环境中的实际体验加速企业产品研发、提升产品质量,反哺社区开发者与ISV态伙伴。同时,开源意味着开放,也更有利于与海外潜在客⼾建⽴信任,潜在客⼾可以看到产品的每⼀⾏码,并通过社区的开放治理了解到产品发展规划、社区投⼊情况等。此外,开源本⾝也是⼀种获客⼿段,较于传统软件冗⻓的付费决策流程,开源产品可以让⽬标客⼾先快速上⼿。据Gartner预测,2022年全球SaaS市场规模会达到1766亿美元,中国虽是⼀个增速领先的市场,但与全球市场相⽐,规模仍然太⼩。我们期待看到更多领先的技术企业带着其在专业领域的钻研成果,⾛上全的舞台。边思康边思康:在这个语境下,“快速获得⽤⼾反馈”是⼀个成功因素,但并不意味着软件产品研发快就是好。其实更多时候,能够深⼊社区和客⼾,聆听⽤⼾反馈,认真思考事物本⾝的逻辑,才是最好的打造产品的⽅法。换句话说,现在的 AIGC 可能是“唯快不破”,但上⽂提到的 SCA 领域,需要的可能就是真正的沉稳思考,以及相应的战略定⼒了。参考资料:OSCAR开源产业⼤会|中国信息通信研究院《2022年OSPO案例汇编(第⼀期)》正式发布AllPublicly-AnnounedGloalCundinginoOSfomJanuary2020-Pesent2022开源年度报告! 开源⼤事记篇⼆.开源安全⼤事记2022年安全成为全社会的共识,如今开源软件已经成为关键基础设施的⽀柱,企业应⽤程序中80%的代来⾃开源软件,95%的开源漏洞存在于可传递依赖项中。开源安全作为⼀个⼤竞技场,将在未来越来越受到企业的重视。开源安全攻击持续⾛⾼,⽹络数据泄露已成为重⼤问题⽹络安全已成为企业的重中之重,⾼达62%的受访企业在过去两年中经历了影响业务的安全事件。频发的络攻击事件对受害企业及其业务⽣态系统造成了严重影响和损失。4⽉12⽇⿊客⽤GitHub⽤⼾令牌从数⼗家企业内部系统窃取信息,⼀名未知的攻击者使⽤被盗的HeouavisCI维护的第三⽅uth⽤⼾令牌从数⼗家企业的私有存储库中下载数据,攻击造成10万npm⽤⼾账信息被窃。Spring4Shell漏洞攻击进⼊爆发期,根据Checkoint的遥测数据,全球受到Spring4Shell零⽇漏洞影响组织中,⼤约有六分之⼀已经成为攻击者的⽬标。根据Spring发布的安全公告,Spring4Shell漏洞影响JDK上的SpringMC和SpringWebFlux应⽤程序,漏洞利⽤要求应⽤程序作为WAR部署在omt上运⾏Spring4Shell漏洞被外界拿来与og4j漏洞相提并论。基础软件VE漏洞频繁出现,影响范围⼤波及范围⼴olkit作为⼀个在类Unix操作系统中控制系统范围权限的组件,通过定义和审核权限规则,实现不同优先进程间的通讯。olkit存在于所有主流的Linux发⾏版的默认配置中,攻击者可通过修改环境变量来利⽤此洞,进⽽提升本地⽤⼾权限。edis作为⼀套开源的使⽤ANSIC编写、⽀持⽹络、可基于内存亦可持久化的⽇志型、键值(eyalue)存储数据库。edis存在代码注⼊漏洞,攻击者可利⽤该漏洞在未授权的情况下,构造恶意数据执⾏沙箱逃逸攻击,最终获取服务器最⾼权限开源安全组织发布开源软件安全指南,多家联盟与企业发布漏洞赏⾦计划2022年OpenSF(开源安全基⾦会)接连发布了4项有关开源软件安全的指南,包括《评估开源软件的简明指南》、《开发更安全软件的简明指南》、《安全研究⼈员与开源软件项⽬协同漏洞披露(CVD)指南》、《NPM最佳实践指南》等多份开源⽣命周期安全指南,给出了开源软件使⽤、开发、漏洞报告、包管理等⽅⾯的安全最佳实践。欧盟为LibeOffie等五⼤开源项⽬提供漏洞赏⾦计划,这五个开源项⽬分别是:流⾏的开源⽂档编辑应⽤序LibeOffie、基于⽹络的实⽤程序,⽤于托管私⼈社交⽹络Maodon、企业ERP应⽤程序Odoo、交换加信息的应⽤程序Cryoad、帮助起草⽴法的软件LEOS。⾕歌推出开源软件漏洞奖励计划,提振软件供应安全,⾕歌推出⼀项新的漏洞奖励计划,奖励从⾕歌开源项⽬中发现并报告漏洞的安全研究⼈员。2022开源年度报告! 开源⼤事记篇开源安全⼯具与开源安全项⽬相继推出2022年⾕歌进军漏洞管理市场,宣布推出免费漏洞扫描器OSSanner,为开发⼈员提供开源项⽬漏洞信查询服务,⾕歌宣称OSSanner提供当前最⼤的社区可编辑开源漏洞数据库。OSSanner使开发⼈员能⾃动将代码和依赖项与已知漏洞列表进⾏匹配,并确定是否有补丁或更新可⽤。此外为强化软件供应链安全,⾕歌启动GC开源项⽬,GC将可以解决整个⽣态系统中迅速发展的⼯作所产⽣的需求,以⽣成软件构建安全和依赖元数据。GitHub也准备将名为sectsanning的免费扫描⼯具,开放给所有公开储存库⽤⼾,帮助开发⼈员避免由程序码泄露登⼊凭证。同时,GitHub 再新增五类⽤⼾,要求在 2023 年 3 ⽉底前强制启⽤双因素验证(2A)。2023年⽹络安全市场预测在数字经济背景下,⽹络安全不仅成为了数字化产业的必须品,⽽且随着全球数字化转型的深⼊,正加速扩展渗透到传统⾏业。⽹络安全⾏业全球市场规模继续保持增⻓态势,2022年预计将增⻓⾄1691.56亿美元,全球宏观经济负⾯影响,2022年全球⽹络安全市场的预期增速也将降⾄2020年以来最低点,但是维持了⾼于7%的增⻓⽔平。Gartner多位顶级分析师分享了他们对2023年的⼋⼤⽹络安全预测。其中包括:供应链和地缘政治⻛险将导⽹络安全、安全⽹格架构将简化安全、零信任将在⻛险管理中发挥关键作⽤DevSecOps 将成为业务关键⾃动化安全运营将增强检测能⼒、以数据为中⼼的⽹络安全⽅法、端点和⼯作负载将需要适应性保护、⼈为作的勒索软件将成为更⼤的威胁。2022开源年度报告! 开源⼤事记篇三.开源技术⼤事记回望2022年,整个世界依旧在疫情、战争和局部不稳定中挣扎,但得益于开源在⾏业中受重视程度的逐渐升,各个⽅向的开源技术继续得到了快速发展。⽆论在企业或社区,对各项开源技术的采⽤也受到技术需求迫切度和技术流⾏度的影响。根据多个官⽅统计,我们看到在过去⼀年中,⼈⼯智能&机器学习&深度学习成为最受关注的领域,其次操作系统、云计算、数据库等也受开源的加持,收获了⼤量的关注和开源贡献。根据Openogic和开源组织OSI发布的《2022eofOpenSoueeport(全球开源趋势报告)》调查发现,77%的受访者在过去⼀年中扩⼤了对OS的使⽤,其中36%表⽰使⽤量显著增⻓。在收集的信息中显出企业与开发者对开源技术的采⽤情况:编程语⾔、框架以及数据库和数据技术操作系统Git公共资源Al/ML/DL框架和⼯ClCD⼯云计算⼯具安全⼯具容器技术数据分析⼯具⽹络可视化⼯中间件桌⾯和个⼈效率⼯具其他同期,edHt发布的《TheeofEnerpriseOpenSoue:AedHteport(企业开源现状:edHt出品报告)》中对全球⼀千⼆百余位技术领袖进⾏了深⼊访谈,发现技术领袖在推动企业积极采⽤和贡献开源技术都有所⾏动,尤其在⼈⼯智能(AI)或机器学习(ML)、边缘计算或物联⽹(IT)、容器和⽆服务器计算等技术上,对开源技术的采⽤有着充分的信⼼和实际的推动。由此,我们重点关注了以下⼏项技术赛道的开源技术过去⼀年的发展,并综合评估出数个对开源领域有⼴影响⼒的事件,回顾其过程、讨论其意义。2022开源年度报告•⼈⼯智能•
开源⼤事记篇AIGC(AI-GeneedConent)相关技术引发全球关注2022年,AIGC(AI-GeneedConent,⼈⼯智能⽣成内容,或⽣成式AI)这⼀领域,取得了突破性的进展,引发了全球全社会的关注,《Sciene》在其发布的2022年度科学⼗⼤突破中,也将AIGC列⼊其中。•Gartner预测,到2025年,企业中流通的30%的信息将由⽣成式AI⽣成,除了软件代码外,还会⽣成各新颖的内容,例如图像、视频、⾳乐、语⾳和⽂本。oreer预测,到2023年,10%的世界500强企业都将采⽤AIGC相关技术。•OpenAI上线升级版⽂本⽣成图像模型ALLE2今年四⽉OpenAI宣布,⽂本⽣成图像模型AL·E的升级版本AL·E2上线,七⽉,⼜宣布开发者可以将•⽂本⽣成图像模型AL·E2,直接集成到其应⽤程序和产品中。•OpenAI发布ChtGTChtGT是OpenAI开发的⼀个⼤型预训练语⾔模型。它是G-3模型的交互式变体,ChtGT能够快速⽣成⾼质量的⽂本内容,并且能够模仿⼈类的语⾔习惯,⽣成通顺流畅的⽂本,它在实现聊天机器⼈、问答系等应⽤中展现出了不凡的实⼒,⽽引发了巨⼤的参与热情。abilityAI连续发布ableDiffusion多个新版本•abilityAI作为今年全球最受瞩⽬的⼈⼯智能公司,在其主导下的开源产品AI绘画机器学习模型ableDiffusion从今年8⽉上线1.0版本⾄现在,连续上线发布多个⼤版本ableDffusion1.0的发布改变了开AI模型的性质,以极低的操作⻔槛,在全球范围内推动了数百种新模型的创新,直接推动了AIGC产业的进步。•英伟达(NVIDIA)开源其LinuxGPU内核模块英伟达(NVIDIA)在今年宣布,将LinuxGPU内核模块作为开放源代码发布。在消息公布前,NVIDIA已经始在GitHub上陆续公开相关代码,这⼀⾏为可以帮助改善英伟达GPU在Linux环境下的体验,与操作系统紧密集成是帮助开发⼈员开展调试、集成和贡献回馈的重要⼀步,这些模块的开源还使得驱动程序在Linux⾏版供应商⼿中更加易⽤。2022开源年度报告! 开源⼤事记篇•阿⾥巴巴开源联邦学习框架edeedSope•阿⾥巴巴在今年五⽉宣布开源的edeedSope框架,使⽤事件驱动的编程范式来构建联邦学习,⽀持⼤规模、⾼效率的联邦学习异步训练,能兼容不同设备运⾏环境,且提供丰富功能模块,降低了隐私保护计算术开发与部署难度,⽬前该框架现已⾯向全球开源。•操作系统•Google发布安全操作系统KaOS•Google在今年发布的安全操作系统KaOS,作为最新专注于运⾏环境,侧重于机器学习⼯作负载的嵌⼊式设备的操作系统。出于将安全性放在⾸位的宗旨,KaOS专⻔使⽤Rut语⾔开发,并基于seL4微内核进⾏了构建。•Linux受欢迎程度⼤幅超越macOS根据 ack Overflow 2022 年开发者调查结果显⽰,开发者将 Linux 作为主要操作系统的⽐例已经达到了40.23%,不仅超过了 macOS,还将差距拉到了 9%。2018-2020 年之间,Linux 的数据分别为 23.2%25.6%、26.6%,⼀直屈居第三。⾃2021年以0.9%的微弱优势⾸次超越macOS,第⼀仍是Windows。•CentOSLinux8退役,CentOStam全⾯接管•!"#%&'宣布(")'*+,-.)/0停⽌使⽤。取⽽代之的是滚动版本(")'*++'1"&2作为!%3-的下游分⽀已经推出并全⾯维护,将持续排查漏洞,让上游版本更加稳定和安全•中国⾸个桌⾯操作系统开源社区开放麒麟正式发布•开放麒麟(openKylin)由麒麟软件、国家⼯业信息安全发展研究中⼼等单位联合成⽴,⽬标通过开放操作系统源代码的⽅式,让更多的开发者共同参与国产开源操作系统的开发,从⽽打造具有⾃主创新技术的开源⾯操作系统。2022开源年度报告Andoid13正式版发布
开源⼤事记篇Google⾯向Piel⼿机率先推出Andoid13正式版,此次Andoid更新进⼀步增强Andoid12中引⼊的Merialou主题,改进了现有的隐私控制,并引⼊了在⽀持的Andoid设备复制和粘贴的功能。•编程语⾔•Newelic:Jaa11占⽐飙升,经典Jaa8退场•Newelic发布的《2022年Jaa⽣态系统状况报告》,提供有关当今Jaa⽣态系统状态的背景和⻅解。数据显⽰,⽬前已有超过48%的应⽤程序在⽣产中使⽤Jaa11(2020年为11.11%);Jaa8紧随其后,占为46.45%。新发布的Jaa17占⽐尚且不⾼,但已经超过了Jaa6、Jaa10和Jaa16版本的份额。对Jaa7的⽀持预计在2022年结束。•ue3:2022年期间ue3的NPM使⽤率增⻓了近200%•今年2⽉,ue的默认版本切换到了3.x;最新的稳定版本是11⽉发布的ue3.2.45。尤⾬溪称,这⼀转变标志着v3框架的所有官⽅部分都已准备就绪,包括对提供最新最佳实践指南的⽂档进⾏重⼤修改。不过其⽬前处于⽣态系统迁移到ue3的过渡期。•JaaScrit最流⾏,Rut最受开发者喜爱•根据ackOverflow2022年开发者调查结果显⽰,JaaScrit连续第⼗年成为最流⾏的编程语⾔,Rut已续第七年成为最受喜爱的语⾔,87%的开发⼈员表⽰他们希望继续使⽤它。•Poch正式加⼊Linux基⾦会•Linux基⾦会在其官⽹宣布,Poch已经正式加⼊Linux基⾦会。Linux基⾦会已经托管并与许多项⽬合作,这些项⽬已经为基础AI/ML项⽬(LFAI和数据)做出贡献,或为其⽤例做出贡献并与其平台集成。(如,LFNtworking、GL、DelaLae、RISV、CNCF、Hyperleder)•Google开源Carbon在今年的CPPNorthC++⼤会上,GoogleCarbon团队宣布将Carbon正式开源,其表⽰希望能够取代C++,虽然并有着庞⼤的代码库,但因诸多历史遗留问题,C++想要进⾏持续改进相对困难。团队认为Carbon在继承了C++现有特性与⽣态的基础上,更加符合当代对编程语⾔的需求,拥有更为⼴阔的优化空间和发展潜⼒。2022开源年度报告Web3以太坊正式合并oS
开源⼤事记篇•今年9⽉,作为开源⽣态最繁荣的公链以太坊,正式合并(TheMee)完成,ETH进⼊2.0时代,从oW机制完全过渡到到oS机制,实现了Web3.0历史上重要的⾥程碑。•Web3.0安全问题频现,损失创历史新⾼在过去的⼀年,由于各类漏洞被攻击、利⽤,2022年成为了⾃Web3.0技术兴起⾄今,资产损失最严重的⼀年。根据相关安全机构的统计,2023年全年因为恶意攻击造成的资产损失接近40亿美元。•作为最流⾏的区块链智能合约开源项⽬Solidity,在全年共进⾏了7次重要更新发布,对其中v0.8.14版本中修复了两项allda的重要漏洞。•Web3.0钱包allyHo开源•allyHo作为开源的去中⼼化Web3钱包,因不满MaMask调整为分层开源的举措,在今年⼀⽉宣布开源,allyHo⽀持Chome与Bave浏览器,将有NFT画廊展⽰、⽀持分类账⼾等功能。•Oa漩涡池智能合约宣布开源•Orca是为Solana⽣态系统⽽建的开源集中流动性⾃动做市商(CLAMM)项⽬,该智能合约是专⻔为Solana虚拟机设计的,强调安全性和效率,⽬前已经完成⽉10亿美元的双重审计交易量•波场TRON⾸个官⽅借贷协议JutendO正式开源•JutendO是⼀个基于TRON的货币市场协议,存款规模已⾼达34亿美⾦,借款规模⾼达1.8亿美⾦,已经通过区块链专业安全机构CertiK的安全审计协议,JutendO今年正式开源。•EVM编程语⾔Huff宣布开源以太坊⼆层隐私解决⽅案AzecNtwork宣布开源EVM编程语⾔Huff。该语⾔由AzecNtwork创始⼈acWilliamson在2019年创建,是⼀种类汇编语⾔,允许开发者直接在EVM机器代码中进⾏编程。•数据库•ogSQL受欢迎程度有超越MySQL的趋势根据ackOverflow2022年开发者调查结果显⽰,专业开发者群体中,ogSQL(46.48%)已经超越MySQL(45.68%)夺得了第⼀名。专业开发者⽐正在学习编程的⼈更有可能使⽤Redis、PostgreSQL、MicosoftSQLServer和Elaticsach。•2022开源年度报告! 开源⼤事记篇•全球开源数据库数量依旧呈增⻓趋势根据国际著名数据库统计⽹站DB-Engines显⽰,2022年间,开源数据库受欢迎指数不断上升,截⽌2022年12⽉,指数已上涨⾄51.64%,该⽹站收录的402款数据库中,209款为开源数据库,这个数字预计还会迎来进•⼀步增⻓。•AacheDruid受到开发者关注•AacheDruid(德鲁伊)是⼀个分布式的、⽀持实时多维OLAP分析、列式存储的数据处理系统,⽀持⾼速的实时数据读取处理、⽀持实时灵活的多维数据分析查询。在过去⼀年中受到了社区内开发者们的好评与推荐,赢得了较⼤的增⻓。•TiDB宣布正式开源分析引擎TiFlash•TiFlash,基于ClickHouse开发,是TiDBHAP形态的关键组件,它是TiV的列存扩展,通过Raftarner协议异步复制,但提供与TiV⼀样的快照隔离⽀持。这个架构解决了HAP场景的隔离性以及列存同步的问题。⾃5.0引⼊MPP后,也进⼀步增强了TiDB在实时分析场景下的计算加速能⼒。•⽯原⼦宣布开源⼀体化实时HAP数据库oneDBoneDB是⼀款全⾯兼容MySQL的实时HAP数据库,⾃研Tianmu引擎对标MySQLHtave架构,具备⾏列混存、⾃适应压缩、知识⽹格和智能索引等核⼼技术特性,能够⾼效解决MySQL在分析场景中⾯临的性能瓶颈,同时⽀持数据强⼀致性的事务特性,具备完整的事务并发处理能⼒,相⽐MySQL原⽣分析能⼒最•⾼可提升100倍。•蚂蚁集团宣布开源云原⽣时序数据库CeesDBCeesDB是⼀款⾼性能、分布式、Schema-less的云原⽣时序数据库,能够同时处理时序型(time-series)以及分析型(analytics)负载。不同于传统时序数据库,CeesDB的⽬标不仅仅是能够处理具备常规时序特征•(Timeseries)的数据,同时也要能够应对复杂的分析型场景。•格睿云宣布开源云原⽣时序数据库GetimeGetimeDB是分布式、⾼性能、存储计算分离的开源云原⽣时序数据库。Getime使⽤Rut构建时序数据库。架构⽅⾯,Gretime实现了存算分离,以Daanode作为核⼼组件,具备时序存储引擎、查询引擎和PythonCopoessor等功能,并且功能可以单独划分为特定的计算池,读、写、分析和Python计算的负载相互隔离,互不影响。•2022开源年度报告! 开源⼤事记篇•Ma宣布开源通⽤向量化执⾏引擎elx•elx是⼀个C++数据库加速库,提供可重⽤、可扩展和⾼性能的数据处理组件。这些组件可以重⽤来构建专注于不同分析⼯作负载的计算引擎,包括批处理、交互式、流处理和AI/ML。Velox利⽤了⼤量的运⾏时化,例如过滤器和连接的重新排序、数组和基于哈希的聚合和连接的ey标准化、动态过滤器下推和⾃适应列预取。考虑到从传⼊的数据批次中提取的可⽤信息和统计数据,这些优化提供了最佳的本地效率。•InfluxDB宣布开源引擎Ix•时序数据库InfluxDB的创建者⽇前宣布了其下⼀代时序存储引擎InfluxDBIx,新引擎将InfluxDB重新定义为⼀个列式实时数据平台,提供⾼容量数据摄取,并针对全部时间序列数据进⾏优化。InfluxDa还增加了对SQL语⾔查询的⽀持,随着SQL的引⼊,InfluxDB现在可以通过商业智能和机器学习⼯具实现⼴泛的分析⽤例。InfluxDB基于Dausion和AacheArow构建了Ix。•Google宣布推出AllyDBor ogSQL•AlloyDB的核⼼是专为ogSQL构建的智能的、数据库优化的存储服务。AlloyDB在堆栈的每⼀层都对计算和存储进⾏分解,使⽤⽀持⼤型Google服务(如oube、搜索、地图和Gmail)的相同的基础架构模块。AlloyDB在分析加速、嵌⼊式AI/ML和数据⾃动分层⽅⾯进⾏了更多的投⼊,以减少处理⼯作负载所需的开销。AlloyDB⽬前并不开源,收录到此,是因为其基于开源数据库ogSQL14开发,关注度较⾼。•Oacle宣布推出MySQLHtaeLaehouseMySQLHeatWaveLakehouse⽤以解决存储在数据库之外的⽂件数据等⾮结构化数据的查询和处理。MySQLHtaveLaehouse是MySQLHtave产品组合的新产品,能够将事务处理、分析、机器学习和基于机器学习的⾃动化结合在单⼀MySQL数据库中。MySQLHtaveLaehouse⽬前并不开源,收录到此,是因为其基于开源数据库MySQL8.0开发,关注度较⾼。多个opensoue/soueaaliale数据库发布重⼤版本ElaElaticsach8.0版本正式发布edis7.0版本正式发布TiDB6.0版本正式发布OanBase4.0Ba版本正式发布openGauss3.0版本正式发布ogSQL15.0版本正式发布Neo4j5.0版本正式发布2022开源年度报告•云计算•
开源⼤事记篇CNCF全年托管20个毕业项⽬•2022年全年CNCF共托管了20个毕业项⽬、35个孵化项⽬和102个沙箱项⽬,这些项⽬来⾃189个国的17.8万多名贡献者推动。•CNCF正式接受Itio成为孵化项⽬•今年九⽉底,CNCF基⾦会宣布,已投票接受开源服务⽹格Itio成为CNCF正式孵化项⽬。Itio作为全球欢迎的服务⽹格,已经有来⾃全世界70多家公司的8000多名开源贡献者为Itio贡献代码。•CNCF正式接受olano成为孵化项⽬•今年4⽉份,CNCF基⾦会宣布,由华为云捐献的业界⾸个云原⽣批量计算项⽬olano正式晋级为CNCF孵化项⽬。olano⾃2020年进⼊CNCF以来,在⼈⼯智能、⼤数据、基因测序等海量数据计算和分析场景得到快速应⽤,并构建起完善的上下游⽣态,⽬前腾讯、爱奇艺、⼩红书、蘑菇街、唯品会、鹏城实验室、锐天投等企业均已将olano应⽤于⽣产环境。•CNCFubede云原⽣边缘计算项⽬发布多项关键突破•ubede是CNCF⾸个云原⽣边缘计算项⽬,CNCF⾸批集成uzzing项⽬。ubede于2022发布《KubeEdge单集群10万边缘节点报告》,《云原⽣边缘计算威胁模型及安全防护技术⽩⽪书》,并于ubedeSummit2022正式开源分布式协同AI基准测试平台Ianvs。⽬前项⽬已完成deMesh⾼可⽤架构,ubedeonopenEuler⽀持,ubedeonopenHarmony⽀持。在下⼀代云原⽣边缘设备管理框架DMI也将给⽤⼾带来更优质的体验。•腾讯开源⼀站式为服务解决⽅案SpringCloudenent•SpringCloudenent实现了SpringCloud标准微服务SPI,开发者可以基于SpringCloudenent快速开发SpringCloud云原⽣分布式应⽤,实现诸如服务注册与发现、配置中⼼、服务路由、限流熔断以及元数据路透传能⼒等分布式微服务场景。•字节跳动开源⾃研数据集成引擎BitSailBitSail⽀持20多种异构数据源间的数据同步,并提供离线、实时、全量、增量场景下的全域数据集成解决案。⽬前,BitSail 服务于字节跳动内部⼏乎所有业务线,包括抖⾳、今⽇头条等⼤家⽿熟能详的应⽤,同时也•⽀撑了⽕⼭引擎多个客⼾的数据集成需求。•TDengine开源三周年,发布TDengine3.0TDengine3.0正式发布,升级成为⼀款云原⽣时序数据库(TimeSeriesDaase),解决了困扰时序数库发展的⾼基数难题,⽀持10亿个设备采集数据、100个节点,⽀持存储与计算分离。•2022开源年度报告! 开源⼤事记篇•华为开源业界⾸个分布式云原⽣开源套件uor分布式云开源套件uor助⼒企业业务跨云跨边、分布式化升级,⽬标是标准化、统⼀分布式云管理,整合Karmada、ubede、olano、ubernes、Itio、Pomtheus等业界主流开源技术栈,为⽤⼾提供多云、多集群统⼀编排,统⼀调度,统⼀流量治理,边云协同,统⼀监控运维等核⼼能⼒,助⼒企业业务跨云边、分布式化升级。四.开源法律⼤事记SC.Vizio,⾸个以消费者⾝份提起的GPL维权案件软件⾃由保护协会(SoftaeeedomConserancy,简称SC)在2021年10⽉起诉电视机制造商认为后者在提供流媒体产品和服务(特别是其SmartCat系统)时没有遵守所采⽤的GPL开源软件许可条款⽽要求其遵守相应的许可要求。Vizio则请求法院驳回SC的违约之诉,认为应该受美国联邦版权法的管辖,⽽排除州合同法的适⽤。但加州中区联邦地区法院在2022年5⽉驳回这⼀请求,认为GPL不仅仅是版权许可,同时也是合同协议,SFC有权提起这⼀诉讼。这意味着SFC可以在州层⾯继续推进违约之诉,⽽且⼀旦胜诉,Vizio的SmartCat系统的所有软件⽤⼾都有权以GPL许可的合同受益⼈的⾝份进⾏维权。该案的特别之处在于SC并⾮以著作权⼈的⾝份提起诉讼,⽽是以消费者的⾝份主张Vizio没有遵守开源软件许可协议的要求,导致下游软件⽤⼾⽆法获得许可所保障的权利,下游软件⽤⼾根据许可条款享有合理预期,即Vizio会向他们开放相关的源代码以供审阅、修改和分发。这是开源社区⾸次出现的真正以消费者(下游软件⽤⼾)⾝份提起的GPL维权案件。梁尧本案的特点在于原告⾝份为消费者梁尧本案的特点在于原告⾝份为消费者/⽤⼾,⽽其中有关 GPL 合同性质的认定于在先判例中早已存在。近年来,国内也出现较多⼿机消费者对某些公司未依照所采⽤开源软件协议公开相关代码的质疑,但尚⽆相关案例,国内亦缺少类似SC这样的维权组织,“SC.Vizio”案或许可以带来⼀定参考借鉴。GitHubCopilt,使⽤开源代码进⾏AI训练引发版权争议GitHubCopilt是由OpenAICodx提供⽀持的⼀款AI结对编程⼯具,主要定位是提供代码补全与建议功能,是VisualtudioCode的⼀个插件,可根据当前⽂件的内容和当前光标位置⾃动⽣成代码。版权问题成其⾯临的主要挑战之⼀,⼈们认为其利⽤开源代码进⾏AI训练并输出相关代码其实是在未遵循开源许可证的情况下对开源代码的使⽤,例如没有标注相关代码的来源、作者、许可证等。2022开源年度报告! 开源⼤事记篇程序员兼律师MthewBuerick联合多位律师对Copilt提出了集体诉讼;软件⾃由保护协会eedomConserancy,简称SC)号召停⽌使⽤GitHub来进⾏抗议。GitHub前CEONtriedman则提到,“在公开数据上训练属于合理使⽤的范畴。”但⽬前全美也还缺少AI训练中“合理使⽤”的相关判例。此外,微软将Copilt输出描述为⼀系列代码“建议”,并强调不会对这些建议“主张任何权利”。同时微软也不会对由此⽣成的代码的正确性、安全性或延伸出的知识产权问题做任何保证。Ntriedman曾声称Copilt的输出结果归属于操作者,其性质与使⽤编译器⼀样。所以只要接纳了Copilt的建议,那⽤⼾⾃⼰需要承担相关责任。但⽤⼾并⽆法在接纳Copilt的建议时,获取代码的来源、作者和许可证等,⽽⾯临侵⻛险。南京未来诉江苏云蜻蜓,GPL抗辩获法院⽀持国内⾸案2022年10⽉,国内⾸个被告根据GPL抗辩获法院⽀持的判决⽣效。原告南京未来⾼新技术有限公司起诉被江苏云蜻蜓信息科技有限公司、刘某某侵害计算机软件著作权,诉讼请求⼆被告连带赔偿原告经济损失2000元。被告律师发现,原告的代码中含有使⽤“GPL+例外”许可证的软件,经过代码分析,认为原告软件不符许可证中例外要求,且没有公开源代码,构成GPL违约。法院认为:主程序系涉案GPL开源代码的衍⽣作品,受GPL协议的约束,且“例外声明”对其不适⽤,原告违反了GPL协议要求提供相应的源代码的义务,构成违约,原告基于GPL协议获得的许可终⽌。法院如果基于原告的该权利认定其他⾏为⼈构成计算机软件侵权,即会保护原告的不当⾏为带来的利益,势必赋于其特殊律地位和特别商事利益,不符合公平、诚信原则。对原告违反GPL协议的⾏为给予侵权法上的保护,势必虚GPL协议关于源代码持续开源的相关规定,对于通过GPL协议让源代码持续开源传播产⽣不利影响。针对原涉案软件的主程序部分,对原告主张两被告构成著作权侵权的主张不予⾤纳,对其要求两被告承担相应的侵责任的诉讼请求不予⽀持。预览程序不是涉案GPL开源代码的衍⽣作品,未被GPL开源代码传染,故不受GPL协议的约束。原告主张该部分软件著作权的保护,以及被告是否侵害该部分软件著作权的判断,均不受GPL议的影响。卫剑钒软件企业使⽤开源软件⼀定要格外注意,尤其是搞清楚使⽤了哪些开源软件,这些开源软件有哪卫剑钒软件企业使⽤开源软件⼀定要格外注意,尤其是搞清楚使⽤了哪些开源软件,这些开源软件有哪些版权要求,研究清楚相关开源许可证的具体条款,并确保⾃⼰相关⾏为合规合法。否则很容易陷⼊违反版权要求⽽不⾃知的窘境。在2022年5⽉20⽇召开的“OSCAR开源先锋⽇”上,中国信通院牵头成⽴“可信开源合规计划”,并发布《开源合规指南(企业篇)》。“可信开源合规计划”为聚焦开源合规的国内开源组织,由中国信通院联合业⽤⼾、科研机构、法律专家成⽴,旨在凝聚各⽅⼒量,聚集⼀⼤批国内开源合规⼈才,整合优质资源,完开源合规标准体系,输出开源合规建设经验,全⾯提升我国开源合规⽔平,为⾏业的发展提供强劲合⼒。共53家⾸批成员单位,包括正式成员22家,预备成员31家。2022开源年度报告! 开源⼤事记篇《开源合规指南(企业篇)》由中国信通院牵头,联合“可信开源合规计划”的成员单位的专家共同编写完成,分析总结了开源合规发展特点,重点围绕开源软件与数据合规⻛险、开源许可协议规定、企业开源合规⻛险防控三⼤环节展开研究,对于企业做好开源合规具有很强的指导意义,为推动我国开源合规建设提供了参考。中国电⼦技术标准化研究院牵头完成⽊兰开放作品许可协议和开源治系列标准在2022年12⽉29⽇召开的“2022⽊兰峰会”上,中国电⼦技术标准化研究院牵头编制的《⽊兰开放作品许可协议》正式发布。⽊兰开放作品许可协议系列(MulanOpenWorksLienses,MulanWLs)是对开放作品的复制、使⽤、修改和分发等⾏为进⾏规范和约束的具有法律效⼒的格式合同,提供了授予专利许可的许可议类别,并对多版本作品提供了署名规范。同时,与许可协议共同发布的⽊兰开放作品中⼼是⽊兰许可证族应⽤平台,为⽊兰开源软件、数据和开放作品的登记、检索和使⽤提供了⽀撑。⽊兰开放作品协议系列与应⽤平台的发布为保护创作者权利、推动开放品发展具有重要意义。同样,在2022年12⽉29⽇召开的⽊兰峰会上,中国电⼦技术标准化研究院宣布其”开源治理系列标准“的制定⼯作已经接近尾声,包括总体框架、企业治理评估模型、项⽬评估模型、社区治理与运营、开发者贡献评价模型,这五⼤⽅向的系列标准经过多轮讨论与共识,将于2023年正式颁布,标志着我国在开源治理权威性、系统性、规范性⽅⾯的⼯作的落地。《开源与标准协同发展研究报告》由国内相关专家共同研究和编制完成,从国内外开源项⽬、社区以及标准研究的实践及成效出发,以更科学的视⻆系统分析并阐明开源与标准的关系,明确新发展趋势下开源的内涵外延,为我国后续系统开展开源标准化⼯作进⼀步打开思路、给出⽅向及建议。梁尧:除上述《开源合规指南(企业篇)》外,国家知识产权局知识产权保护司梁尧:除上述《开源合规指南(企业篇)》外,国家知识产权局知识产权保护司在2022年4⽉发布的《企业知识产权保护指南》中,也针对“使⽤开源软件的知识产权⻛险”、“产品开发涉及的王伟:开源社的多名成员直接参与了中国电⼦技术标准化研究院的开源治理系列标准的编写与制定⼯开源软件是否可免费使⽤”等开源相关主题撰写了专⻔内容。作,既体现出开源社的智库越来越受到⼴泛的认可,也体现出国内这种政府与社区合作新模式的探索,开源的⽂化正在重构传统世界的运转模式。杨丽蕴⽆论是开源许可证还是还是开源标准,都是构建开源规则和开源⽅法论的⼀部分,通过严谨细致的研究⼯作,为我国乃⾄国际的开源发展贡献⼀份⼒量。⽊兰开放作品许可协议是⽊兰开源许可证族的新成员,最近也在与OSI积极接触和交流中,推进开放作品许可协议的国际化进程,开源治理标准需应⽤到OSPO的实际治理过程中,与OpenDiger等开源⼯具串起来、协同配套使⽤,发挥出1+1⼤于2的作⽤。!192022开源年度报告! 开源⼤事记篇五.开源社区、⽣态⼤事记政治⽆处不在,开源也不能独善其⾝2年2⽉4俄罗斯突然发动⼊侵乌克兰的“特别军事⾏动”,俄乌战争打响。随后在开源的世界⾥,也发⽣了多起重⼤事件,看起来远离政治的开源,同样不能独善其⾝。多个著名的开源社区、开源项⽬,在GitHub上、在⾃⼰的官⽹上声援乌克兰,也有呼吁GitHub禁⽌俄罗斯开发者的声⾳出现,以⾄于到了3⽉2⽇Github官⽅就俄乌战争发表声明,承诺“将继续确保免费开源服可供所有⼈使⽤,包括俄罗斯的开发⼈员。”然⽽,封禁的事件依然在发⽣,也有俄罗斯的开发者,甚⾄前俄罗斯公司的雇员、来⾃俄罗斯的开源贡献者被误伤,他们对于开源项⽬的贡献痕迹,也遭到删除。还有不少企业级的“制裁”,开源企业或者暂停在俄罗斯的业务,或者宣布禁⽌俄罗斯的代码贡献。另⼀⽅⾯,过激的⾏为也不断出现,node-ipc事件的爆发终于引起了所有开源⼈的警惕,以开源发声进⾏毒,终于突破了所有正义的底线,直到OSI发布博⽂谴责这⼀⾏为:《开源抗议最终将会伤害开源》。总之,⾯对剧烈动荡的国际政治局势,开源⼈能够做什么,不能做什么,应该做什么,⼜不该做什么?都是⾮常困难的问题!各国政府与开源的关系纷繁复杂在2021年的《开源⼤事记》中,我们观察到“各国开源政策将对开源世界的未来产⽣重⼤影响”,但是主还是从国家政策对于开源产业的促进作⽤来⽴论的。到了2022年,我们观察到了更多、也更加复杂的现象。美国主要关注的是开源安全问题,1⽉和5⽉美国⽩宫两次召集开源基⾦会与IT巨头,共同商讨开源软件全问题,并推出1.5亿美元开源软件保护计划,到了9⽉份更通过两党⽴法保护开源软件安全性。⽽在欧洲,更多的是关注来⾃美国的开源竞争问题。9⽉14⽇,欧盟普通法院作出裁决,维持了之前对⾕垄断⾏为的⾼达41亿欧元的创纪录罚款,罪名是“将⾕歌搜索/Chome与Andoid系统捆绑在⼀起”。⾄于亚洲,⽐较“奇葩”的是印度针对VC的封禁⾏为。从2⽉份开始,印度政府屏蔽了VC播放器项⽬的⽹站及下载链接。到了10⽉份VC播放器开发商威胁起诉印度政府,于是到了11⽉份,封禁解除。从开封禁VC,再到⽬前解禁,印度政府没有进⾏任何表态,也没有向VideoLAN基⾦会以及印度⺠众提供封杀VC的理由,确实令⼈感到疑惑。⾄于中国,继2021年的《⼗四五规划》之后,在2022年国家⼜进⼀步提出了《知识产权强国建设纲要和"⼗四五"规划实施年度推进计划》、《中国银保监会办公厅关于银⾏业保险业数字化转型的指导意⻅》,到了12⽉,三部⻔联合发布的《互联⽹信息服务深度合成管理规定》,也将对AIGC以及开源领域产⽣深远影响。总⽽⾔之,政府针对开源⾏业与开源⽣态,可以施加多种多样的⾏为,制定各种各样的政策,⾄于后果,有待⻓期观察与总结。!202022开源年度报告! 开源⼤事记篇更多中国⼈在开源社区中发挥影响⼒2022年,在国际基⾦会还是传来了不少好消息的。3⽉,姜宁当选Aache基⾦会董事、堵俊平再次当选AI&ABad主席;8⽉,Tinasou当选LFdeBad主席。其中尤为引⼈瞩⽬的是:Tina是第⼀位担任企业互联⽹⼯程任务组(IETF)⼯作组主席的中国⼥性,也是国际电联电信标准化部⻔(ITUT)历史上来⾃亚洲最年轻的报告⼈。她还曾担任Akaino技术指导委员会主席。中国开源贡献者数量,占全球中国开发者主导的开源项⽬,占全球根据中国开源贡献者数量,占全球中国开发者主导的开源项⽬,占全球国际开源项⽬OP50,中国仅占两全球公司开源贡献榜国际开源项⽬OP50,中国仅占两从某种意义上来说:已经很好了,但是还不够好...开源报告与榜单纷纷出炉,喜忧参半从2015年开始,开源社每年都会发布⼀份《中国开源年度报告》,到了2022年,我们终于看到了越来越的同道中⼈。7⽉,《2022中国开源发展蓝⽪书》正式发布;8⽉,InoQ《中国开源发展研究分析2022》布;10⽉,SDN《2022中国开源贡献度报告》发布;11⽉,开放原⼦开源基⾦会、-lab开放实验室和阿巴巴联合出品的《2022年开源⼤数据热⼒报告》发布。⾃2020年起,开源社和Sgmentault思否联合发起《中国开源先锋33⼈之⼼尖上的开源⼈物》年度评选,⾄今已连续举办3年。在2021年,我们开源社Sgmentault思否还⾸次联合OpenDiger项⽬,根据开源开发者在GitHub的协作影响⼒评选出了来⾃中区OP99的开发者,并命名其为《中国开源码⼒》。这本⾝,就是⼀个重⼤的信号!⼀⽅⾯,我们可以看到更多的数据、更多的趋势与排⾏榜,另⼀⽅⾯,我们也能看出,越来越多的机构、业和组织开始关注这些讯息。不过,今年11⽉发布的GitHubOoverse报告,也传来了⼀些不太妙的消息:在今年新增的2050万⽤中,印度、中国和巴西的增幅最⼤,占⽐分别为32.4%、15.6%、11.6%,其中印度的开发者⼈数增⻓超过中国。当然,中国开发者增速看似放缓,这也可以解读为更多的中国开发者增⻓,发⽣在国内的开源平台上了。蒋涛:蒋涛:Github数据中表明来⾃⾹港的开发者增加了100万以上,这当然是不可能的,只能猜这部分数王伟:印度开发者的增⻓以及在开源社区中的活跃程度⾮常值得关注。国际的GSoC、国内的OSPP这据是⼤陆开发者利⽤⾹港服务器访问Github,带上了⾹港IP。类开源暑期夏令营活动,都能够看到印度学⽣的⾝影。未来中印两个⼈⼝⼤国,⼀定会成为⾮常主要的开源开发者的来源,⽴⾜于世界的开源发展更有⽣命⼒。!212022开源年度报告! 开源⼤事记篇开源平台的发展,依然在探索中互联⽹时代,⼀个越来越明显的趋势是:平台为王,即使是开源也不能例外。因此,平台的⼀举⼀动,往也牵动所有⼈的⼼神。2021年5⽉到2022年12⽉GitHub的⽤⼾在18个⽉的时间内从6500万增⻓⾄9400万,⽽在2020年,这个数字还只是5000万。与此同时,国内的Giee平台也在⾼速增⻓,2022年Giee的代码仓库超过了2500万,⽤⼾数量超过了1000万,虽然总量上较之GitHub依然有差距,但是增速却毫不逊⾊。除了上⾯这些好消息,平台的各项措施,却往往会遭遇批评GitHubCopilt遭到质疑,SC甚⾄在呼吁《放弃GitHub,时机已到!》,到了11⽉,⼀项集体诉讼已提交到美国加州北区地⽅法院,要求法院批准亿美元(约649亿⼈⺠币)的法定损害赔偿⾦。⾄于后续将如何发展,咱们2023年再持续关注。⽽Giee推出的新政策“仓库开源必须审核再上线”,Micosoftoe推出的新政策“禁⽌开源软件在平台上的商业销售”,也遭到了⼴泛的批评。总之,平台政策牵⼀发⽽动全⾝,经营者不可不慎啊!开源个体⼾⽣存现状,个⼈英雄主义的⻩昏在⾃由开源软件的早期历史中,我们会遇到⼀个⼜⼀个如雷贯⽿的名字,这些代码英雄们开创了⼀个崭新的时代。⽽到了今天,传来的消息却常常令⼈沮丧。著名开源作者删库跑路的新闻,时有发⽣。或者被平台盘剥,或者遭⼤公司⽩嫖,或者遭受有毒⾔论攻击被迫出⾛,或者因为“申诉⽆⻔”宣布停⽌开发并关闭所有项⽬。还有很多默默⽆闻,守护着重要开源项⽬的⼈们,因为仅仅是默默⽆闻坚守阵地,所以也⽆⼈问津。总⽽⾔之,个⼈英雄主义的时代已近⻩昏。那些孤独的个体⼾们,正在渐渐⾛下舞台,远离众⼈的视线。⽽我们开源世界,⼜将⾛向何⽅呢?源年度报告2022开源年度报告数据篇 ! GitHub数据篇⼀.概述GitHub数据篇分为宏观洞察和项⽬洞察两部分。宏观洞察篇对2022年GitHub全域⽇志数据进⾏探索(共12.6亿条,相较2021年增⻓了约27%)。同时,我们借助OpenDiger的指标及标注数据,从各个⽅⾯进⾏分析。本篇章中,根据-lab开放实验室提出的OpenRank指标对项⽬进⾏评估得到细分榜单,括全球范围内开源项⽬排名、中国开源项⽬排名、中国开发者排名、基⾦会中中国企业排名、技术领域排名、以及项⽬领域排名。项⽬洞察篇借助AacheDevLae⼯具,对选定上榜项⽬进⾏更深⼊的洞察,洞察内容包括项⽬机器⼈使⽤情况、社区成⻓、问题反馈等指标,各社区的⼯作时间分布,并从更底层给出项⽬代码注释覆盖度、静态测试覆盖度、代码复⽤度等指标。⼆.指标介绍OpenOpenankOpenRank指标是由X-lab实验室研发的,基于开源开发者-项⽬协作关系构建的协作⽹络下的⽹络指标。OpenRank不仅能够很好的表征项⽬的整体发展状态、社区参与度,⽽且也引⼊了开源⽣态的要素,在开源⽣态中出于协作关键位置的项⽬也可以被很好的识别出来。详细指标定义:htps://blog.fanzhacn/how_o_masue_open_soue_3活跃度:活跃度是-lab研发的评价项⽬或开发者活跃程度的统计性指标。开发者活跃度由开发者 Issue、PR 及代eview等⾏为加权得到。项⽬活跃度由项⽬中所有开发者活跃度总和进⾏数值处理后得到。活跃度:详细定义请参考:htps://blog.fanzhacn/how_o_masue_open_soue_1ar:指某⼀GitHub仓库中arar:ork:指某⼀GitHub仓库中orkork:2022开源年度报告数据社区指标:项⽬参与者数量:
! GitHub数据篇指某⼀GitHub仓库在某⼀时间区间内参与协作的开发者数量,Issue、PR相关的操作均属于协作范畴。新增贡献者:指某⼀GitHub仓库在某⼀时间区间内新增的代码贡献者数量。新增参与者:巴⼠系数:指某⼀GitHub巴⼠系数:巴⼠系数是⼀个⽤于描述项⽬管理⻛险的指标,定义了项⽬的关键成员数量。它的直接定义是指项⽬可以允许多少位关键成员“被巴⼠撞了”(温和⼀些的表达就是指离开项⽬了)才会导致项⽬陷⼊混乱和瘫痪状态。Issue解决周期:详细定义参考CHOS:htps:/chaossommunit/kb/bus-ao/。在实现上,巴⼠系数是指贡献了项⽬前Issue解决周期:Issue响应周期:指某⼀GitHub仓库在某⼀时间区间内Issue响应周期:指某⼀GitHub仓库在某⼀时间区间内Issue提出后⾸次被响应的时间周期,四个数值分别为⼩于1天,1-3天,3-7天,7天以上的数量。注释覆盖度注释覆盖度:有注释的函数占项⽬中总函数个数的⽐例。注释覆盖度数值越⾼,意味着项⽬中有注释的函数数⽬越多,码的可读性较好。通常建议结合业务逻辑和函数复杂度,梳理项⽬的注释规范,结合业务特征明确注释覆盖度标准,为复杂函数适当添加注释。2022开源年度报告数据篇 ! GitHub数据篇静态测试覆盖度:被测试函数覆盖的函数占项⽬中⾮测试函数总数⽐例。对于各个编程语⾔,我们收集了⼀些主流测试框架的路径要求或者命名规范,根据⽂件路径判断某⽂件是否是测试⽂件。如果该⽂件是测试⽂件,那么⾥⾯定义的函数就归到测试函数的类别。然后根据静态分析,找到测试函数中所调⽤到的函数,认为这些函数即为被测试覆盖。这⾥的调⽤关系具有传递性。即,如果函数A调⽤了函数B,⽽测试函数et⾥调⽤了A,那么A和B都视为被et所覆盖。静态测试覆盖度=被测试覆盖的函数数⽬/项⽬中⾮测试函数的总数=被测试覆盖的函数数⽬/(被测试覆盖的函数数⽬+未被测试覆盖的函数数⽬)测试覆盖度数据越⾼,意味着项⽬中被测试覆盖的函数⽐例越多,代码的可靠性较好。从⻓远来说,提升测试覆盖度,可以提⾼代码质量,减少维护成本,降低重构难度。但是测试覆盖度并⾮越⾼越好,它会加⼤开发者的⼯作量,需要考虑投⼊产出⽐。代码复⽤度:代码复⽤度:代码复⽤度体现的是项⽬中函数的不重复程度。对于当前项⽬中的函数,我们使⽤基于Minhash和SH的⽂本查重算法,寻找出相似度较⾼的函数,认为它们互相之间是重复的函数,并按重复关系分组。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 水产养殖合同协议
- 章程合同协议用在哪里
- 合同协议搞笑
- 二手机动车出让协议合同
- 垃圾运输协议合同
- 导游协议合同
- 水路运输合同协议书模板
- 配餐合同协议
- 夜市股东协议书范本合同
- 防疫志愿者服务协议合同
- Unit 3 Learning better (教学设计)-2024-2025学年人教PEP版(2024)英语三年级下册
- 2025年煤炭生产经营单位(安全生产管理人员)证考试题库及答案
- 莱芜市人民医院院区扩建工程项目可行性研究报告
- 2025年山东省淄博市张店区中考一模历史试题(原卷版+解析版)
- 心肺复苏知识培训课件
- 2025-2030中国太阳能无人机行业市场发展趋势与前景展望战略研究报告
- 2025年拍卖师职业资格考试:拍卖师职业规划与发展路径试题
- “书香博士”引领的整本书阅读评价与推广
- 2025年广西环保产业投资集团有限公司招聘笔试参考题库含答案解析
- 人工智能与人力资源融合-深度研究
- 口腔材料学-课程教学大纲
评论
0/150
提交评论