首页
搜索 搜索
资讯

APUS多模态大模型“AiLMe”发布

2023-04-21 02:45:05 砍柴网

4月18日,APUS在“AiLMe·最懂你”发布会现场发布自研多模态人工智能大模型“AiLMe”。AiLMe参数已达千亿规模,具备对文本、图像、视频、音频的理解和生成能力。针对具体应用场景,APUS从AiLMe内蒸馏出文本模型“异雀八”、图像模型“异雀三”、视频模型“异雀四”、音频模型“异雀六”四个垂直领域精炼模型,并基于此创新研发出“智能问答大师、简笔成画、墨染、Daily Astro、Star Night、KJV Bible Now、PicPik”等系列AI产品。

AiLMe问世的 “前世今生”

人工智能大模型“利用深度学习模型生成文本、图像、音频或视频等内容”,让处于“手工”时代的信息化产业一跃迈入“工业”时代。在APUS创始人兼CEO李涛看来,今天人们的生产生活是生长于“信息化”平台之上的,而在未来,AI将取代信息化成为万物生长的土壤。“人工智能是AI时代的操作系统,将重塑信息产业、农业、制造业、服务业等所有产业,起到大规模提质提效的作用。”


(资料图)

当下,全球AI产业百舸争流,但能够实现超千亿参数的大模型研发并非易事。大模型尤其是多模态大模型的塑造是结合算力、算法、数据、场景的综合性系统工程,这决定了大模型的锻造绝非一朝一夕之功,而是要有对AI的前瞻布局和长期积淀。

人工智能产业赛道长坡厚雪,与大模型有关的技术也已存在近十年的探索蓄力,APUS是最早开始关注并投入人工智能的入局者之一,“我们在2018年就进行了AI技术布局,并在2018年推出了多款基于AI技术的应用如CutCut、PickU 、Vieka等,用户可以体验智能抠图,变老变年轻等功能”,李涛介绍。

李涛在发布会上阐述了APUS转型人工智能的契机,在ChatGPT“出圈”前两个月,APUS就因为全球化经验感知到了人工智能挥动的“蝶翼”,“今年一月我们就已经在内部所有系统接入人工智能,用来提升工作效率;随后便进行产品的改造升级;大模型AiLMe也是我们阶段性的重要成果”。全球超24亿用户积累、领先的产品和技术、多元化场景和海量数据,让APUS入局人工智能“有能力、有潜力”。此前,李涛在接受媒体专访时表示,人工智能发展将遵循“四步走”,即现有信息系统提效,现有产品服务改造与重构,新场景、新物种,以及全产业升级, APUS自身的发展路径也印证着这一观点。

APUS大模型“AiLMe”的架构与能力

3月,首次具备对图像理解能力的GPT-4发布,让“多模态”大模型在行业普及并进入大众视野。多模态的“多”有哪些能力?大模型的“大”又从何而来?AiLMe的架构与能力又有哪些特别优势?发布会现场还发布了国内首份多模态大模型技术白皮书《AiLMe技术白皮书》。

所谓“多”就是指其在大语言模型的基础上,又融合了对图像、视频、声音的理解和生成。而参数规模决定着大模型整体的理解和生成能力,大模型的“大”即是大规模参数,参数越大,存储的知识越多,模型能力越强。

AiLMe的技术架构设计:在文本、图像、视频、音频的“理解”部分,采用目前业内主流的Transformer架构。同时,AiLMe吸收了目前人工智能最前沿的研究成果,设计了一套“插件式”架构,可以自主学习和使用“工具”,这些“工具”以插件的方式接入到AiLMe的平台中,可以极大提升AiLMe的能力。在文本、图像、视频、音频的“生成”部分,AiLMe则沿用了目前业内主流的扩散模型(Diffusion Model),并继承了开源社区的生态。

在AI大模型时代,数据、算法和算力正在经历新的演变,大模型参数量以指数级速率提升,数据量也随着多模态的引入进行大规模增长,导致算力需求剧增。AiLMe在模型训练时,分为预训练(Pre-trained)阶段和微调(Fine-tuning)阶段。为解决算力问题,APUS在国内郑州和新加坡分别建设了两大智算中心,还融合自建GPU服务器算力和第三方的算力协同作用。在数据方面,目前大模型的训练数据一般来自于互联网公开的语料库、网页以及行业公开数据,但在APUS绘制的训练数据图中可以看到,其自有数据也占了很大比重——在为全球用户提供产品和服务时,APUS积淀的高质量专有数据成为其研发全球性大模型的优势之一。

AI技术发展日新月异,在全球AI研究人员的共同努力下,行业对AI大模型的理解进一步深入,逐渐认识到,“决定大模型效果的因素按照重要性来排序:训练数据质量>训练数据规模>参数规模。”因此今天AI技术研究的前沿,已经告别了单纯增加大模型参数规模的阶段,而要在提高训练数据质量和加大训练数据规模上下功夫。AiLMe采用高质量的海量训练数据来训练模型,实现了较好的效果。

今天的AiLMe已具备了自主学习能力。Chat GPT支持插件被认为是AI自我进化的雏形,但过程中尚需要用户手动选择插件;而AiLMe在设计时,紧跟AI技术发展前沿,采用了插件式架构,后续能够通过迭代开发补充各种插件来扩充自身能力,并且可以自主学习调用插件,无需用户干预,就能够使大模型实现目标驱动,进行自我进化。

把“数据库”变“智慧岛”,实现人机共智,强大的多模态大模型AiLMe便是这背后的强大“引擎”。通过自主学习和人类反馈不断解锁新能力,AiLMe还将更高效地解决个性化、开放式的海量任务。目前,AiLMe已在多个To C场景中落地,在场景多样性、任务复杂度上显示出能力与潜力。

据悉,AiLMe将会向客户开放API接口和服务,届时,客户可根据实际应用需求,调用AiLMe的各项AI技术能力。

AiLMe能力释放,推出系列AI创新产品

聊天对话、创作文章、作诗谱曲、慰藉心绪……在AiLMe之上,智能应用焕发出了全新生机。

从AiLMe大模型蒸馏出的异雀(八、三、四、六)系列精细模型,分别对应着文、图、视、音四个垂直领域,基于四款精炼模型,APUS创新研发了多款人工智能产品。

KJV Bible Now是一款面向海外市场的《圣经》产品,让用户拥有自己的专属牧师助手,帮助其解答用户困惑,释放情感。PicPik,是一款AI图片、视频、娱乐创作工具,能够帮助用户高质量、高效率、低门槛的创作。Daily Astro是一款面向海外市场的塔罗牌产品,让星座、占卜爱好者实现牌面占卜、运势解析。Star Night是一款助眠类产品,除了能为用户提供白噪音音频等帮助用户快速入睡,还能依据用户喜好勾勒出理想的数字睡眠伴侣,让它来朗读睡眠故事。智能问答能够在对话之间帮助用户快速完成撰写报告、论文、程序、简历及解答生活疑问等;简笔成画则让用户变身“神笔马良”,只要在手机屏幕上画出草图,寥寥几笔,它就会自动补全图案,形成精美绘画;墨染作为AI绘画工具素材创作社区,功能丰富,除了有慕夏、毕加索等30多款创作风格可选,还具备文案优化等功能。

AiLMe的能力释放让AI产品更加智慧、场景更加多元,既丰富了APUS的产品矩阵,也为开发者打造了创新平台。

目前,国内AI行业的发展可谓百花齐放、百舸争流,越来越多的企业和机构开始投入大量资金和人力来研究和开发AI技术,推动了AI产业的快速发展和创新。期待APUS的AiLMe大模型越来越强大,为用户提供更加全面、精准的服务体验,同时随着技术的不断发展有更广泛的应用场景与更出色的表现。