大模型混战,阿里百度华为谁将成就AI时代的“新地基”?

自2022年稳定扩散模型的进步推动了AIGC的快速发展之后,年底,ChatGPT作为“破圈者”,迅速“吸金”上亿粉,在全球范围内掀起了一股AI浪潮,促使众多海外巨头发布了自己的大模型。

在国内,其实很早以前,阿里、华为、腾讯等公司就已经布局了:2019年,阿里开始布局大型模型研发,并于去年9月发布了“依桐”大型模型系列的多款大型模型;2021年,华为联合鹏程实验室发布了基于盛腾AI的鹏程盘古模型。腾讯的思路和阿里差不多,发布了混合AI模式。第二梯队的JD.COM、网易、360、字节跳动等企业也已正式宣布在AI大模型中的布局。

从2023年开始,随着文心词的发布,成为国内第一款类似ChatGPT的产品,各种大型号也陆续出现。一时间,中国似乎陷入了“大模特大战”。

截至目前,百度文新大模、华为盘古大模、商汤大模、阿里大模都已亮相,接下来还有很多大模准备以BLACKPINK亮相。

那么,这种仓促发布的背后,是技术真的成熟了,还是鱼龙混杂?各大模特实力如何?

本文将从语言大模型、计算能力和技术基础、具体应用层面三个角度对已发布的大模型的技术基础、应用场景、用户生态进行分析研究,看看哪些大模型更有可能在这场混战中成功突围。

一个

ChatGPT不应在C端停止

ChatGPT作为第一款大规模模型产品应用,其问答的流畅度和准确率很能体现NLP模型的水平。

目前国内厂商百度、阿里也发布了类似的机型。那么,相比之下,温燕和表现如何呢?

首先,最近在对话式AI中经常出现的一个典型问题,当面对不在他们知识库中或者本身就是错误的问题时,他们仍然可以谈论侃侃的错误描述,简称为严重废话。

于是,我先问了童益谦这个问题:你知道唐僧为什么上梁山吗?

依桐钱文想了想,给出了这样的答案:先是简单介绍了一下唐嫣,然后带入了《水浒传》中宋江这个角色,但最后又回到了《西游记》,说“这个情节体现了唐嫣的坚定和决心,也体现了他作为一个有信仰的人的形象。”

大模型混战,阿里百度华为谁将成就AI时代的“新地基”?

同样的问题给了文一个词,却得到了一个更短但同样荒谬的答案:唐僧之所以上梁山,是因为他被迫离开,被唐朝通缉,无奈之下上了梁山。

大模型混战,阿里百度华为谁将成就AI时代的“新地基”?

在这次考试中,依桐钱文犯了和文心同样的错误。然而,在我纠正他之后,依桐倩文也犯了一个积极的错误,表现出了良好的连续问答能力,而文心没有“理解”我的纠正。

接下来,我问了他们一个经典的数学问题——鸡和兔子在同一个笼子里。“鸡和兔子在同一个笼子里,10个头,28只脚。有多少只鸡和兔子?”

得到问题后,依桐·钱文很快给出了答案,为我列出了计算问题所需的方程,并在后面贴心地注明了方程的由来。

大模型混战,阿里百度华为谁将成就AI时代的“新地基”?

而文心更直接的一句话,回答了我的问题。

大模型混战,阿里百度华为谁将成就AI时代的“新地基”?

除了这两个问题,我还让他们一起写代码,一起欣赏诗歌,一起写文章。

一般来说,面对用户的提问,依桐钱文和文心安怡在大多数情况下都能给出正确答案,而面对C端用户的提问,两款产品表现出了不相上下的实力。

然而,在C端的激烈竞争下,阿里牺牲了B端这种同类竞争对手无法比拟的服务能力。

除了C端用户,依桐钱文特别邀请企业用户共同测试。企业可以基于依桐钱文打造专属大模型。在企业专用大模型空中,他们不仅可以调动依桐钱文的所有能力,还可以结合自己的行业知识和应用场景,训练出自己的企业大模型。

具体来说,除了常见的场景,企业由于业务特点不同,对大规模模型服务有特殊的需求和要求,希望将通用的大模型变成企业专用的大模型,以支持企业的各种应用和服务。

阿里云希望通过产品化,满足企业专用大模型从生成到部署的全生命周期的需求。

发布会当天,阿里云宣布将与智能云安第斯共同打造OPPO大模型的基础设施,完成基于依桐钱文的大模型持续学习、微调和前端提示项目,为其未来海量终端用户打造AI服务。

与此同时,中兴通讯、吉利汽车、智机汽车、奇瑞新能源、Millicent智行、太古可口可乐、波司登、掌阅科技等多家企业也表示,将与阿里云在大模型的相关场景进行技术合作探索和创造。

或许,除了极具竞争力的C端,为企业打造大型模型的能力才是依桐钱文真正的优势。

而相关专家也在交流中表示,依桐钱文将帮助企业在各自领域打造大模型,带来更好的生态系统和商业模式。

2

大模型背后的算力争夺战谁领先?

纵观国内发布的大模型可以发现,相比国外前沿的AI公司,中国还像个蹒跚学步的孩子,在这条路上才刚刚起步。

在大型模型开发的道路上,最重要的其实是最基础的计算能力资源的多少,以及如何使用计算能力。那么国内顶尖大型模型企业的存储几何?

【/s2/】首先,同样在近期发布了大模型的商汤科技,在之前的交流中与商汤科技内部的相关专家就公司的计算能力进行了沟通。

中国目前最先进的显卡是英伟达的A100GPU。商汤科技在美国禁止在中国销售之前就提前囤积了数万片A100芯片,在中国是有足够计算能力资源的厂商。

除了Nvidia的显卡,商汤还在采购国产GPU,而且专家表示早在去年就有很多寒武纪和广海信息的GPU卡已经适配大型设备,但是目前商汤还面临着国产GPU卡如何训练适配大型机型的问题。

在商汤之外,华为的盘古模型也引起了人们的关注,但在计算能力资源方面,华为略显尴尬。

因为美国的长期制裁,华为不得不全部使用国产加速芯片。目前阿森松岛系列中最先进、应用最广泛的机型阿森松岛910只有70%的性能,从长远来看将制约大型机型的发展。

计算能力的不足也直接影响了华为的发展策略,选择性的放弃了C端的发展,专注于B端产业模式的应用。

而说到计算能力资源储备最大的企业,除了云时代的领头羊阿里,再无其他企业。

但从阿里云的角度来看,云上至少有上万个A 100 GPUs。综合来看,阿里云的计算能力资源至少可以达到10万。如果继续抬眼,从整个集团的计算能力资源来看,将是阿里云的5倍数量级。

除了英伟达的芯片,阿里云还有很多国产GPU芯片。近期项目中选择了寒武纪MLU370,性能基本通过测试(A100的60-70%),厂商态度积极,愿意与阿里对接,已经用于CV等小模型的训练和推理。

2023年,阿里云的计算资源增长率也将达到30%-50%。

得益于云时代的绝对领先,阿里拥有远超其他公司的计算能力资源,在AI时代自然占据上风。

但是,数千亿参数的大规模模型的研发,不是简单的GPU堆砌就能实现的。这是一个包含底层计算能力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统工程,需要AI-云计算的全栈技术能力。

阿里是全球为数不多的在这些领域有深度布局和长期积累的科技公司,也是为数不多的拥有超万亿参数大型模型研发经验的机构。

在AI算法方面,阿里达摩院是国内最早开始大规模模型研究的机构之一。2019年开始投入大型模型研发,在中国大型模型领域一直处于领先地位。2021年,阿里发布了国内首个超百亿参数的多模态大模型和语言大模型,随后训练并实现了全球首个10万亿参数AI模型。

在智能计算能力方面,阿里打造了国内最大的智能计算中心“天妃智能计算平台”,千卡并行效率达90%。自主研发的网络架构可以为万卡AI集群提供无拥塞、高性能的集群通信能力。基于天妃智能计算的阿里云深度学习平台PAI,可提升计算资源利用率3倍以上,AI训练效率11倍,推理效率6倍,覆盖全链路AI开发工具和大数据服务,深度支撑依桐大模型研发。

阿里云的全栈AI技术体系从机器学习平台、大模型即服务、工业智能三个层面不断丰富AI服务,通过全栈技术驱动千万个行业的发展和应用。

大模型混战,阿里百度华为谁将成就AI时代的“新地基”?

可以说,阿里在云时代的成功在一定程度上延续到了AI时代。相比那些计算资源相对不足的竞争对手,阿里在计算能力和技术基础上有着无可比拟的优势。

大模式带来业务聚合的飞跃

有了计算能力资源和技术基础,大规模的模型能力要想惠及大众,触达所有人,需要应用层面的生态建设,这也是很多厂商“见红刺刀”的战场,很多厂商根据企业发展的不同做出了不同的选择。

比如华为盘古机型,受计算能力资源不足和公司业务导向的影响,选择了在B端玩。

在盘古大模型发布会上,华为并没有重点介绍NLP模型,而是强调了CV大模型和科学计算大模型的应用实例。

盘古CV模型主要应用于智能巡检、智能物流等场景。

比如与能源公司合作的盘古矿模型,矿址是40米长的矿机,宽度只有2米左右。传统相机很难一次性捕捉到所有画面,只能使用画面中的九格视频画面。并且通过5G+AI全动视频拼接综采屏幕卷并传输到地面,未来地面工作人员可以实现地面控制机采,实现井下无人少人安全作业。

盘古气象模型在气象预测方向也超越了传统的数值计算方法。

盘古气象模型在关键要素和常用时间范围的精度高于最先进的预报方法,速度比传统方法提高1000倍以上。比如盘古气象模型在台风路径预报任务中,与传统的数值天气预报方法相比,可以降低20%以上的位置误差。

对于阿里来说,其领先的大型模型能力和国内众多的业务板块,使得阿里能够在各个领域大展拳脚。

阿里云智能集团CEO张勇在峰会上表示,未来阿里巴巴所有产品都将接入“依桐钱文”模式,进行彻底转型,包括天猫、钉钉、高德地图、淘宝、优酷、盒马。

大模型混战,阿里百度华为谁将成就AI时代的“新地基”?

对于阿里起家的电商赛道,大模式有很多应用场景。

对于商家来说,大模型最实际的应用场景是智能客服。随着电子商务行业的逐渐成熟,消费者对服务质量的要求与日俱增,客服这个岗位对降本增效有着巨大的需求。

依桐钱文转型后,还将推出能够理解消费者话语和诉求的智能客服机器人,这些机器人将基于机器学习、大数据、自然语言处理、语义分析和理解等多项人工智能技术,为消费者提供最佳服务。

对于平台来说,大模式可以有效提升用户的购物体验。比如用户有时候可能不知道自己明确的需求,但是通过和AI导购沟通,可以获得相当多的指导信息和购物清单,比如一个生日聚会需要做哪些准备,买什么工具化妆等。

除了电商场景,依桐钱文之后接入办公场景也将实现很多新功能。

例如,在钉钉文档中,你可以在依桐·钱文的帮助下自动绘制地图、创建文章、撰写电子邮件和生成计划。在会议中,可以记录、总结、制作待办事项;甚至可以帮助总结未读群聊消息中的要点。……

大模型混战,阿里百度华为谁将成就AI时代的“新地基”?

可以说,无论对于B端企业还是C端用户,只要有阿里产品存在的地方,接入依桐钱文后,其智能化水平和易用性水平都会迅速提升一个档次。

对于阿里来说,作为中国最大的商业集团之一,有了依桐钱文的加持,提升将不局限于某一条业务线或某一个方向,而是整体实力的飞跃。

写在最后

AI大模型的浪潮开启了一个新时代,让所有互联网厂商回到了同一起跑线上。

在2023阿里云峰会上,阿里巴巴集团董事局主席兼首席执行官、阿里云智能事业群CEO张勇也表示,“面对AI时代,所有产品都值得用大模型重做。”

在所有应用都被重建后的AI时代,核心竞争力是什么?也成为了厂商需要思考的首要问题。

在我看来,坚实的计算能力基础和良好的用户生态将是AI时代成功的两个必要条件。

在中国,谁拥有最高端的计算能力资源和强大的算法进化能力,谁就在这场大模型大战中拥有无可比拟的独特优势。

本文内容及图片均整理自互联网,不代表本站立场,版权归原作者所有,如有侵权请联系admin#jikehao.com删除。
(0)
极客号的头像极客号
上一篇 2023年 4月 14日
下一篇 2023年 4月 14日

相关推荐

合作联系:1152QQ041010