研究人员推出压缩框架QMoE：可将1.6万亿参数模型高效压缩20倍

极客号 • 2023年 10月 31日 18:12 • 业界 • 阅读 47

ChatGPT 国内免翻版！免费 AI写作! 史上最全 AI模型！ ECS服务器5折起！虚位以待

极客号（Daydx.com）10月31日消息:最新研究来自ISTA的科学家提出了一种创新的模型量化方法，称为QMoE，可以将庞大的1.6万亿参数SwitchTransformer压缩到令人难以置信的160GB以下，每个参数仅占用0.8位。这一方法实现了高达20倍的压缩率，为解决大型模型的高昂成本和内存需求问题提供了新的解决方案。

GPT-4等大型模型的发展使混合专家架构（MoE）成为研究的焦点。虽然MoE可以显著提高模型的准确性和训练速度，但由于庞大的参数数量，需要大量的显存才能运行这些模型。例如，1.6万亿参数的SwitchTransformer-c2048模型需要3.2TB的GPU显存。为解决这一问题，ISTA的研究人员提出了QMoE，这一框架利用专门设计的GPU解码内核，实现了高效的端到端压缩推理。

论文地址:https://arxiv.org/pdf/2310.16795.pdf

QMoE的独特之处在于采用了数据依赖的量化方法，允许在底层的位宽下实现高度压缩，同时仍能维持准确性。实验结果表明，即使在仅有2位或三元精度的情况下，与未压缩模型相比，精度的损失非常小。这一研究的成果为大规模混合专家架构模型的高效压缩和执行提供了新的可能性，将其适用于消费级GPU服务器，减少了内存开销，并降低了运行成本。

尤其令人印象深刻的是，QMoE的高效性，小型模型甚至可以在一小时内完成压缩，而大型模型如c2048也只需要不到一天的时间。虽然在执行速度方面与未压缩模型相比略有下降，但这一方法在大规模模型的压缩方面具有重要潜力。总的来说，QMoE为解决大型模型的内存需求问题提供了创新的解决方案，实现了高度的压缩和高效的执行。

然而，这项研究也存在一些局限性，因为目前公开可获得的大规模精确MoE模型数量有限，因此需要更多的研究和实验来进一步验证其适用性。这一创新性研究将有望为未来的深度学习和大型模型研究开辟新的方向。

本文内容及图片均整理自互联网，不代表本站立场，版权归原作者所有，如有侵权请联系admin#jikehao.com删除。

赞 (0)

国家邮政局对极兔速递、顺丰速运进行安全生产行政约谈

上一篇 2023年 10月 31日

外卖漏送米饭被要求191元整单退款老板诉苦：等于请客吃饭

下一篇 2023年 10月 31日

黑鲨冰封背夹3Pro纯白配色发布最高可降温30℃
极客号（Daydx.com）7月18日消息:黑鲨外设近日宣布，黑鲨冰封背夹3Pro纯白配色正式发布。首先，设计方面，黑鲨冰封散热背夹3Pro采用了上下出风口设计，避免吹到手部，…
极客号
2023年 7月 18日
0
苹果向老机型推送iOS 17.0.2：修复数据迁移问题换iPhone 15更快
快科技9月27日消息，前两天苹果专门为iPhone 15准备了一版系统更新，iOS 17.0.2修复了数据迁移的问题。今天，苹果向老机型也推送了这版更新，所有用户都能升级了。最…
极客号
2023年 9月 27日
0
OPPO K11曝光官方：拥有旗舰影像体验
极客号(Xqh8.com) 7月17日消息:近日，OPPO中国区总裁刘波对外公开了OPPO K11手机的预热信息。他表示，OPPO K11将致力于为5亿大众用户打造一部好手机，…
极客号
2023年 7月 17日
0
广东女子拍到雷电劈下瞬间：离人只有3米
7月17日消息，广东东莞一位女子在晚上摆摊，在12点左右打算收摊时，突然狂风暴雨，于是跑到亭子下面避雨并拿手机拍视频，正好拍到雷电瞬间劈下，众人吓到大叫。当事人黄女士称，雷电离人…
极客号
2023年 7月 17日
0
“最像人”的机器人学会绘画：Ameca接入GPT-3生成式AI模型
快科技7月4日消息，长久以来，Ameca都因为极为细致的面部表情被称为世界上最像人”的人形机器人。现在，Ameca背后的开发商Engineered Arts宣布，为该机器人接入了…
极客号
2023年 7月 5日
0
员工每天带薪上厕所3至6小时被解雇：法院判了
职场上有一种调侃叫带薪上厕所”，不可否认，人有三急，但要是如厕时间过长甚至夸张，恐怕性质就变了。据媒体报道，王某于2006年4月进入公司工作。2014年12月王某因肛肠疾病在医院…
极客号
2023年 5月 25日
0
淘宝十一月份有什么满减活动
喜欢网购的小伙伴对于淘宝平台每个月的促销活动也都十分感兴趣，尤其是跨店满减优惠最能吸引消费者参与。那么，淘宝十一月份有什么满减活动？随着十一月份马上就要到了，对于这个电商促销月大家…
极客号
2023年 8月 24日
0
游戏性能问题终于解决：微软解除Win11升级限制
此前微软表示，由于部分设备会受到Win11游戏性能bug的影响，这些设备的系统升级功能会受到限制。今天微软宣布在KB5020044的累积更新中，Win11中的游戏性能问题已经修复…
极客号
2022年 12月 17日
0
因挖呀挖走红的桃子老师称很焦虑很少直播，没挖到一套房
近日，在杭州某幼儿园工作的毛女士(化名陶老师)在某短视频平台上发布了一段“在小花园里挖呀挖呀”的手指歌谣视频。但随之而来的是一些关于“花园里种花”原创视频的争议。对此，毛女士表示…
极客号
2023年 5月 6日
0
早阳早好？专家:奥密克戎易再感染
有关新冠疫情防控大家还是非常重视的，虽然国内疫情逐渐开始解封开放，不过民众对于疫情一些防控措施还是需要注意。近日网上出现了早阳早好的言论，对此有关专家表示奥密…
极客号
2022年 12月 11日
0

合作联系：1152QQ041010