IBM 的类脑芯片可能是迄今为止运行人工智能速度最快的芯片

位于加利福尼亚州圣何塞的 IBM 研究人员开发了一款脑启发式计算芯片，该芯片可以通过更快速和更低功耗的工作方式，加速人工智能（AI）的发展。

他们的大规模 NorthPole 处理器芯片消除了频繁访问外部内存的需求，因此可以比现有架构执行图像识别等任务更快，同时消耗大大少于电能。

巴黎萨克雷大学帕莱索分校的纳米电子研究员 Damien Querlioz 表示：「它的能效令人叹为观止。」该项工作发表在《Science》杂志上，显示了计算和内存可以大规模集成，他表示：「我认为这篇论文将撼动计算机架构的共识。」

NorthPole 运行神经网络：多层次的简单计算单元数组，编程用于识别数据中的模式。底层接收数据，例如图像中的像素；每个后续层检测日益复杂的模式，并将信息传递给下一层。顶层生成输出，例如可以表示图像中是否包含猫、汽车或其他物体的可能性。

尽管某些计算机芯片可以有效处理这些计算，但它们在每次计算一个层次时仍需要使用称为 RAM 的外部内存。通过这种方式在芯片之间传输数据会减慢速度，这被称为冯·诺依曼瓶颈，以数学家约翰·冯·诺依曼的名字命名，他首次构思了基于处理单元和单独内存单元的标准计算机架构。

冯·诺依曼瓶颈是减慢计算应用（包括 AI）的最重要因素之一。它还导致能源效率低下。研究合著者、IBM 的计算机工程师达 Dharmendra Modha 表示，他曾经估计，在这种类型的架构上模拟人脑可能需要相当于 12 座核反应堆的输出。

NorthPole 由 256 个计算单元或核心组成，每个核心都包含自己的内存。位于 IBM 圣何塞阿尔马登研究中心的 IBM 脑启发式计算首席科学家 Modha 表示：「你正在核心内减轻冯·诺依曼瓶颈的影响。」

这些核心被连接成一个网络，灵感来自于人类大脑皮层各部分之间的白质连接。这和其他设计原则——大多数原则在此之前已经存在，但从未被结合在一个芯片上——使 NorthPole 在图像识别的标准基准测试中大大超越了现有的 AI 机器。尽管它没有使用最新和最微型化的制造过程，但它仍然比最先进的 AI 芯片的能耗低了五分之一。作者估计，如果采用最新的制造工艺来实现 NorthPole 设计，其效率将比当前设计高 25 倍。

但是，即使 NorthPole 的 224 兆字节 RAM 也不足以运行大型语言模型，比如聊天机器人 ChatGPT，即使在最精简的版本中，这些模型也需要几千兆字节的数据。此外，该芯片只能运行需要在分开的机器上预先进行「训练」的预编程神经网络。但论文的作者表示，NorthPole 架构在速度关键的应用中可能会非常有用，如自动驾驶汽车。

NorthPole 将内存单元尽可能靠近核心中的计算元素。在其他地方，研究人员正在使用新材料和制造工艺开发更激进的创新。这些使内存单元本身能够执行计算，从原理上可以进一步提高速度和效率。

本文内容及图片均整理自互联网，不代表本站立场，版权归原作者所有，如有侵权请联系admin#jikehao.com删除。