资讯

新资讯：掘金AIGC正当时，开放、开源的AI大模型是正解

2023-04-20 13:16:44 孙永杰

近期，ChatGPT的火爆，让国内相关企业对于AI大模型再次趋之若鹜，那么问题来了，此番ChatGPT的火爆，给相关产业会带来怎样的影响？国内类“ChatGPT”的发展之路又在何方？

ChatGPT火爆，大模型打开AIGC万亿市场之门

【资料图】

去年11月30日，OpenAI公司发布聊天机器人模型ChatGPT到今年1月，ChatGPT的活跃用户数或已达1亿，成为史上增长最快的消费者应用。

而随着ChatGPT的火爆，有分析师预计，到2030年，ChatGPT有望为AIGC（生成式AI）打开一个万亿的市场规模。具体到中国，根据《中国AI数字商业展望2021-2025》预测，到2025年，中国生成式AI技术应用规模预计上升至2070亿元，2020—2025年年均复合增长率高达84.1%。

究其原因，主要是以ChatGPT为代表的AI大模型能为AIGC的发展提供更好的基础和支持。

例如通过使用大规模的AI模型，可以生成更加准确、自然、丰富的文本内容；研发人员可以更快地生成和调整AIGC的内容，从而加速AIGC的研发过程；实现更加自然、流畅、准确的对话，为用户提供更好的交互体验；在游戏、电影、教育等诸多领域中，可以生成更加逼真、自然的对话和场景，为用户提供更好的体验。

惟开放与开源，AIGC商业前景方无限

如上述，以ChatGPT为代表的AI大模型的发展为AIGC的发展提供了更好的基础和支持（例如可以提高AIGC的质量、加速AIGC的研发、增强AIGC的交互性和促进AIGC的应用等），且前景无限，但事实是，在全球范围内，大模型的落地都还处于早期阶段。至于国内各个大厂所研发的大模型虽然有内部业务的落地场景，但整体上尚未有成熟的商业化模式。

究其原因，大模型是对人类知识体系的抽象与提炼，所以它能够应用的场景和产生的价值是巨大的。但只有通过开放与开源，大模型的应用潜力才能在众多有创造力的开发者那里得到最大程度的释放，并转换为商业价值。

基于此，作为一个人工智能语言模型，尽管 OpenAI提供了API接口供开发者使用，但它并非完全开源，因为其代码和训练数据集仍然是OpenAI独有，并未向开发者开放。而随之而来的问题是，大模型通过开放API所能提供的能力相当有限，难以承担复杂多样的应用需求，尽管目前市场上已经催生出一些具有创意的APP，但整体上还处于一种“小儿科”的阶段，远没有达到大规模产业化的程度。

与之相比，国内AI大模型有的已经走上了完全开放和开源的道路。

例如国内的“源1.0”大模型，其目前已上线开放平台，开放模型API、开源高质量中文数据集、模型训练代码、推理代码、应用代码、面向AI芯片的模型移植开发代码，开放平台已服务超4000名行业开发者，覆盖互联网、金融、教科研和自动驾驶等行业领域，大大降低了不同行业、不同任务的AI应用开发门槛，开发者只需几行代码便可以开发出一个完整应用，使其无需关心底层技术，甚至无需配置编程环境，就可以直接将应用构建于AI大模型的能力之上的应用，在降低开发门槛的同时，让开发人员能够将更多的精力聚焦核心业务逻辑。

以源社区开发者“一键构建专属你的数字人”的数字人生成平台Fay为例，它就是一个完整的开源项目，包含Python内核及UE数字人模型，开发人员可以利用该项目可简单构建各种类型的数字人或数字助理。值得一提的是，该项目各模块之间耦合度非常低，包括声音来源、语音识别、情绪分析、NLP处理、情绪语音合成、语音输出和表情动作输出等模块。每个模块都可以轻松地更换。

不知业内看到这个作何感想？但在我们看来，这套架构相当于给只能文字聊天的ChatGPT装上好看的皮囊，并更像真人般能够实时对话，使ChatGPT更像人。而源大模型如同ChatGPT，在整个数字人流程中充当大模型的大脑和灵魂，能输出智能实施的对话。

那么问题来了，开放与开源的国内AI大模型真的可以充分释放其价值，助力开发者加速AIGC商业化的落地吗？

开发者淘到第一桶金，“源1.0”大模型成助力掘金AIGC标杆

所谓事实胜于雄辩，与当下火爆的ChatGPT商业模式还存有争议、商业化落地还停留在“雷声大雨点小”相比，由于国内AI大模型的开放与开源，开发者们通过AI大模型已经淘到了AIGC的第一桶金。

这里我们以源开发者社区开发者Digital socialworker team为例，其团队在社区志愿服务中心，深刻感受到基层社工的工作的繁琐及困难，便计划用科技帮助基层社工，开发出更智能的产品，为此，他们选择了基于源大模型强大的智能及完善便捷的开发平台，在极短的时间内，便开发出成熟产品“临小助”。

“临小助”可以随时随地为基层社区工作者提供沉浸式、针对性的一对一群众工作能力培训，目前已经开设了疫情防控、加装电梯、业委会换届等8堂社区治理高频情景对话课程，社区工作者通过手机载体与“临小助”进行互动对话形式，提高接待群众服务群众的经验与信心，让社区小白“秒变”服务群众的能人。试用阶段显示，某高频场景中，社区工作人员培训学习效率提升5倍，有效辅助问答建议达75%。目前，该产品已在上海市静安区临汾路街道、嘉定区安亭镇落地，获得一致好评，并成为基层工作智慧化转型的案例在新民晚报、学习强国等媒体重点宣传报道。

不要小看“临小助”这样的数字助理产品，据Digital socialworker team介绍，在基层社工领域，大模型加持的数字助理，将有广阔的商业前景。按民政部网站数据，截至2020年底，中国共有38741个街道（镇、乡）级政府。按15%的渗透率计算，基础服务部分市场规模就高达5.57亿元/年。当然，这还仅仅是AIGC应用落地的冰山一角。

又如来自于源开发者社区开发者的郭泽斌，其基于源大模型构建的“一键式构建专属数字人”的开源架构，已被深圳某公司应用到平板中充当自个人助力，产生了巨大商业价值。一些主打情感陪伴的儿童玩具公司也从这套架构中挖掘出巨大商业价值，在儿童玩具中搭载这套开源架构，目前已投入生产，即将上线售卖。

其实，数字人的未来远远超出仅作为人类的助力，当通用人工智能充分发展，如Chat的变革。未来，数字人或被当作虚拟世界的独立个体，，甚至把它作为生活中的主体当成独立的人格，甚至赋予它法律的权利，给具有看起来独立人格有趣灵魂，外表皮囊又很像人的数字人，或者甚至于是机器人，应不应该给他一个独立的主体资格，甚至于赋予它一些法律权益。

总之，AI大模型给了我们充分的想象空间。

不仅如此，除以上数字人以外，源大模型在不同的领域都发挥着巨大价值。例如在智能客服领域，大模型加持智能客服大脑荣获《哈佛商业评论》新技术突破奖，数据中心专业问题解决率高达80%，可将复杂技术咨询问题的业务处理时长降低65%，提升整体服务效率达160%；

在反诈领域，基于“源1.0”大模型，社区开发者开发出一个能够无障碍进行微信聊天的人工智能“反诈AI——小源”，并在与诈骗犯的真实对话场景中进行测试，小源不仅能发现诈骗犯的动机，精准识别诈骗套路，甚至能将计就计在对话过程中反击，成功套路到诈骗犯520元红包，为公众树立反诈榜样增加公众反诈骗意识和识别能力，守护公众安全，从而实现科技向善。

通过上述国内AI大模型的应用，我们认为，无论是现在，还是将来，AI大模型的发展已经呈现出“安卓”生态的发展模式。

众所周知，安卓之所以成为当前全球最大的移动生态（拥有最多的开发者和用户），首先就得益于其将安卓系统及其应用等开发工具、代码等的开源（等同于“源1.0”大模型的开放与开源），让开发者基于此开发出更符合不同市场和用户需求的第三方应用（等同于开发者基于“源1.0”开发出的各种应用，例如我们上面提到的“临小助”、“数字人”等），其次，作为安卓系统本身，也会结合开发者的反馈不断改善自己的系统、开发工具等，并以新的系统更新的形式反哺给开发者，让他们开发出更好、更新、更多的应用，以此往复形成良性的移动生态闭环（等同于“源1.0”大模型根据开发者的反馈不断进化，让开发者据此开发出体验更好、更多的应用）。而这种生态最终带来的是基于安卓的数百万应用及给开发者带来的真金白银和满足数十亿用户的需求。

基于此，我们认为，AI大模型的开放和开源与全球最大的移动生态安卓类似的发展模式，同样会吸引众多开发者加入其中，从而形成AI大模型的“安卓生态”，未来对于开发者和AIGC商业化落地的价值不可估量，而从加速AI产业化和产业AI化，赋能千行百业的高度，更会产生经济与社会效益兼备的“大模型”效应。

智算时代加速到来，算法基建化势在必行

除上述之外，当我们站在更高的产业维度去看当下ChatGPT的火爆，以及国内AI大模型在AIGC领域的落地，一个不争的事实呈现在我们眼前，即智算时代正在加速到来。

而众所周知的事实是，智算时代是算力时代，智算中心是领先形态的数据中心、智慧时代的必要基础设施，就像水利之于农业社会，电力之于工业社会，已经成为当下数字经济发展中业内的共识。不过，随着数实融合的不断深入，为满足千行百业AI化和AI产业化的需求，未来的智算中心不应只包含算力基础设施，还要有算法基础设施，才能让更多的企业享受普适普惠的智算服务。

基于此，如果说此前我们国内在算力基础设施上走在前列，那么基于开源的基础模型开发者开发出的各种场景化商业应用的大模型这种类“安卓生态”（基础模型就是安卓系统，开发者开发的场景应用就是基于安卓系统之上的各种APP，二者相互协同，相互促进，不断壮大）的发展模式的形成，无疑为我们国内在加快算法基建化及最终实现算法基础设施方面树立了前行的标杆，未来可期。

写在最后：众所周知，未来的竞争是基于AI的竞争，而鉴于当下ChatGPT初期呈现出的其对于某些行业、产业及市场的颠覆性，大模型未来的重要性、潜能及影响更是不言而喻。但事实是，出于商业利益等因素的考量，ChatGPT并未在数据集和算法上开放和开源，也就是说在决定AI发展和应用水平三要素的数据、算法和算力上，如果我们不能推出自己国产的AI中文大模型的话，在未来AI（两个重要博弈点缺失）的竞争中将处于相当不利的地位，甚至可能出现被“卡脖子”的风险，进而延缓AI的发展和应用。

所以，在不确定性的市场和产业环境下，无论是对于当下具体应用层面的AIGC，还是更高产业维度的数实融合，促进中国数字经济发展来说，都决定了我们必须走经济效益、社会效益及国家利益兼顾，符合中国国情、自主研发的中国版“ChatGPT”之路。

为你推荐