在全球最大芯片上训练！AI芯片初创公司Cerebras新推出七种开源语言模型

极客号 • 2023年 4月 1日 06:25 • 业界 • 阅读 100

ChatGPT 国内免翻版！免费 AI写作! 史上最全 AI模型！ ECS服务器5折起！虚位以待

AI芯片初创公司Cerebras宣布进军大规模语言模型领域，推出7款全新开源语言模型。称为脑波强化器-GPT的模型系列的大小从1 . 11亿个参数到130亿个参数不等。

据这家初创公司称，这些模型是使用DeepMind的龙猫公式训练的，旨在使任何人都能以更低的成本使用它们，这是迄今为止公开可用的模型中消耗能量最少的。

脑波强化器决定建立并提供这些开源模型。它认为准入应该更加开放。Cerebras ML的研究科学家诺兰·戴伊(Nolan Dey)在博客中写道:“最新大型语言模型OpenAI的GPT-4在没有关于其模型架构、训练数据、训练硬件或超参数的信息的情况下发布。该公司越来越多地使用封闭数据集来构建大型模型，并且仅通过API访问来提供模型输出。为了使LLM成为一种开放和可访问的技术，我们认为获得最先进的模型是重要的，这些模型是开放的，可复制的，并且对研究和商业应用是免费的。”

Cerebras模型的数据集还没有公开，目前可以通过HuggingFace访问模型本身。

在世界上最大的芯片上训练模型

脑波强化器因其WSE-2芯片而闻名，这是世界上最大的芯片之一。它类似于一个8×8英寸的平板，每个平板包含2.6万亿个晶体管和85万个“人工智能优化”的核心。

大脑的CS-2系统包含大量的WSE-2AI芯片。这家初创公司采用了16个这样的系统来支持其人工智能超级计算机Andromeda。Andromeda于去年11月发布，旨在大大减少训练大型语言模型所需的时间。

这家初创公司甚至声称，超级计算机可以处理序列长度巨大的大型语言模型，这是传统GPU根本做不到的。在去年年底接受《人工智能商业》采访时，脑波强化系统的首席执行官Andrew Feldman说，仙女座菌株帮助了新冠肺炎的研究。

这家初创公司已经将注意力转向大型语言模型，以展示其技术能力。

脑波强化器-GPT模型在仙女座上进行训练，脑波强化器表示可以“快速完成训练，不需要传统的分布式系统工程和GPU集群上需要的模型并行调优。”通过Cerebras AI Model Studio，还在云中提供了用于训练Cerebras-GPT模型的集群。

推动大语言模型的普及

各大人工智能实验室做了大量工作来开发语言模型，但他们隐瞒了底层系统如何工作的信息。例如，OpenAI本月早些时候发布的GPT-4引起了人们的愤怒，它只透露了一些技术规格，但没有提到确切的数据或使用的尺寸细节。

许多人，如斯坦福大学的AI研究人员，认为研究这些技术的潜在影响更加困难，因为OpenAI等公司已经关闭了他们的模型。

Cerebras设计了新的模型来提供更广泛的采访，并表示希望这些模型将“作为有效培训的秘密，并作为进一步社区研究的参考。”

大量销售编号注意:

Cerebras-GPT官方博客网址:https://www . cerebras . net/blog/cerebras-GPT-a-family-of-open-computer-efficient-large-language-models/

脑波强化器-GPT模型拥抱脸网站:https://huggingface.co/cerebras

本文内容及图片均整理自互联网，不代表本站立场，版权归原作者所有，如有侵权请联系admin#jikehao.com删除。

赞 (0)

极客号

0

旅客自带盒饭用高铁微波炉被拒系铁路规定
上一篇 2023年 4月 1日

NIKE、李宁等6大品牌在天猫App举办3D跑鞋新品发布会
下一篇 2023年 4月 1日

微信支撑一切腾讯可能很难像阿里那样重组
凤凰网科技讯北京时间3月29日消息，阿里巴巴集团的重组计划受到市场欢迎，这让外界猜测腾讯可能会效仿阿里进行类似的重组。但外媒指出，腾讯与阿里不同，依靠微信为其他业务提供源源不断的流…
极客号
2023年 3月 30日
0
华为7月特惠手机免费贴膜换电池99元
华为7月有着特惠服务，到店有着6大权益，华为手机免费贴膜，99元换原装电池活动回归。六大专属权益包括： -华为手机可享免费贴膜、清洁、保养、系统升级服务，华为笔记本电脑、指定型号…
极客号
2023年 7月 9日
0
假期过半！中秋国庆假期第4天你在干什么
10月2日消息，今天是中秋国庆假期第4天，假期已过半。双节假期第4天，你在干什么？这个假期，全国多地开启人从众”模式。在这个长假里，我们想去的地方似乎都人山人海。身处不同景区的人…
极客号
2023年 10月 2日
0
童年记忆的黄桃罐头为啥突然火了？专家建议不要盲目囤
黄桃罐头作为一款经典的国产零食，应该是所有水果罐头中销量最好的，也是很多人的童年记忆。最近黄桃罐头突然在网上火了。事情的起因是有网友戏称黄桃罐头可以治感冒发烧，吃了黄桃罐头感冒症…
极客号
2022年 12月 11日
0
文心一言VS天工大模型，究竟谁才是国内“首个”ChatGPT？
最近，昆仑万伟和百度因为最近大火的大语言模型“联手”了。 4月17日，昆仑万伟正式启动“天宫”大模型，并于当天开放测试邀请。当时昆仑万伟的对外宣传语言是“中国第一个真正实现智能出现…
极客号
2023年 4月 26日
0
人类首次月球背面采样返回嫦娥六号探测器预计2025前后发射
快科技4月10日报道，我国嫦娥系列月球探测器已完成绕行和返回三步走的目标，未来还将有嫦娥六号、七号和八号任务空，其中嫦娥六号预计在2025年左右实施。中国航天科技集团公司在官方微…
极客号
2023年 4月 11日
0
女子名叫“单单单”医院叫号遇尴尬：回应称不会改
父母给孩子取名字，有时候画面一时变化，后续可能会给孩子的生活带来一些困扰甚至不便。据网友分享的一段短视频显示，3月24日在北京，名叫shn dāndān的单女士正在医院等待叫号。…
极客号
2023年 3月 26日
0
对话刘闻洋：从《赘婿》到《卿卿日常》，他的套路与反套路
表面创新的背后，真正发挥更底层作用的是刘闻洋及其团队对内容的底层理解，以及基础原则的坚定落地。「你想不想演?」《卿卿日常》的监制兼总制片人刘闻洋看着对面的女孩，接连问了三遍。在…
极客号
2022年 12月 13日
0
两周爆卖5万台，创始人吕骋回应Rabbit R1到底是什么？
在拉斯维加斯举行的 CES 2024 上，一款名叫 rabbit r1 的消费级 AI 设备首次亮相，便抢走不少产品风头，首批 1 万台迅速售罄。紧随其后的几个批次也在短短几日内卖完。该设备在引爆 CES 后，被捧为 AI 领域的一大突破，创造了一种「后智能手机的体验」。与此同时，技术社区和媒体对 rabbit r1 褒贬不一，既有不少 AI 硬件角度的积极评价，有对设计缺陷的关注和对存在意义的质疑。
极客号
2024年 1月 27日
0
Chrome产品经理介绍了向Manifest V3新扩展标准迁移的详细时间表
在周三的一篇 Chrome 开发者博客文章中，Google 产品经理 David Li 详解了向 Manifest V3 转进的更多细节。通过提供更高的透明度和权限控制、添加严格的协议以访问扩展程序上下文之外的资源、并确保扩展程序…
极客号
2022年 9月 30日
0

合作联系：1152QQ041010