华人团队推出Medusa简单框架可将LLM推理速度提高2倍

极客号 • 2023年 9月 13日 12:20 • 业界 • 阅读 48

ChatGPT 国内免翻版！免费 AI写作! 史上最全 AI模型！ ECS服务器5折起！虚位以待

极客号（Daydx.com）9月13日消息:来自普林斯顿、UIUC等机构的华人团队提出一个用于加速大型语言模型（LLM）推理速度的简单框架Medusa，并于9月12日开源发布。测试结果显示，Medusa可以将LLM的生成效率提高约2倍。

Medusa是一个简单的框架，它让大家也可以使用多解码头技术来加速大型语言模型的生成。目前，许多热门的加速技术如speculative decoding都存在一些痛点，比如需要一个不错的draft模型作为基础，系统复杂度高，采样生成时效率不高等。

项目地址:https://github.com/FasterDecoding/Medusa

Medusa的方法是在原有的语言模型上增加额外的“解码头”，让每个头同时预测多个可能的未来词元。在使用Medusa增强模型时，原有的模型保持不变，仅新增的解码头在训练中进行微调。生成时，这些头并行产生多个可能的词，然后通过一种基于树的attention机制合并处理，最后使用一般的采纳策略从候选中挑选出最长的可信前缀进行解码。

研究人员通过以下几点设计，来解决speculative decoding存在的问题:

1）不引入新的模型，仅在原模型上新增解码头，训练时参数效率高。

2）生成时不需要严格匹配原模型的分布，使非贪婪生成甚至比贪婪解码还快。

第一个版本主要优化了每个batch只有一个样例的场景，也就是本地机器上常见的使用方式。在这种配置下，Medusa可以为Vicuna系列模型带来约2倍的加速。研究人员称正在积极扩展Medusa的应用场景，集成到更多的推理框架中，以获得更高的性能提升。

Medusa核心功能:

– 在现有语言模型上增加多解码头

– 高效训练参数

– 生成时树形attention机制合并多个预测

– 非贪婪生成模式下实现更快速度

本文内容及图片均整理自互联网，不代表本站立场，版权归原作者所有，如有侵权请联系admin#jikehao.com删除。

赞 (0)

苹果官网iPhone 14全系降价最高降1000元

上一篇 2023年 9月 13日

iPhone 15 Pro曝光：配8GB内存和1TB存储容量

下一篇 2023年 9月 13日

Redmi K60曝全系2K屏碳纤维后盖
卢今天正式公布了红米K60手机的一些细节，还声称该系列回归硬核设计风格，性能跑车的表现感觉犀利而富有朝气；第二，要精致。简单之下，有很多细节可以推敲；同时也有惊喜。给同价位段一个更…
极客号
2022年 12月 26日
0
压力给到用户！iPhone 15生产成本增长将高达20%
快科技4月26日报道，苹果将于今年晚些时候发布新款iPhone 15系列。预计将搭载最新的A17处理器，采用TSMC的3 nm工艺制造。据博主Revegnus报道，与iPhone…
极客号
2023年 4月 27日
0
小米13 Ultra同款基材！Redmi K60至尊版搭载华星C7屏
快科技8月11日消息，Redmi公布了K60至尊版的屏幕参数。该机采用第二代1.5K旗舰直屏，使用了华星最新的C7发光材料，功耗大幅降低。此前上市的小米13Ultra就是采用华星…
极客号
2023年 8月 11日
0
顾客在星巴克沙拉里吃出虫门店：第三方食品厂制作
9月17日消息，上海一位顾客在在星巴克（迪士尼小镇店）点沙拉吃出虫子，而且虫子还在动。因为是密封的，不可能是后续飞进去的，自己已经吃了一半，很怕会有细菌病毒。对此，涉事门店工作人…
极客号
2023年 9月 18日
0
京东双11高端手机销量榜TOP10：苹果霸榜前3 小米、华为各2款
快科技11月2日消息，根据最新的京东高端手机榜单显示，苹果、小米、华为三家瓜分了TOP10。其中苹果独占6款，并且霸占前3名： iPhone 15 Pro Max起售价9199元…
极客号
2023年 11月 2日
0
微信广告上线朋友圈橱窗广告全面开放竞价推广能力
Dashiaohao(Daydx.com)12月12日消息:今日，微信广告在朋友圈宣布上线橱窗广告，满足了广告主对更丰富的素材展示的诉求。朋友圈的橱窗广告支持一主三辅的配置，组合形…
极客号
2022年 12月 13日
0
女生从俄罗斯花2分钟回国学校离家仅约500米
据介绍，女孩宁说，学校离家700米，坐船只要一分半钟。宁家在黑河市，9月份将去俄罗斯布拉戈维申斯克国立师范大学读研究生。宁说，早上起床后可以坐最早的船去那边学习，晚上坐船回国吃饭。…
极客号
2023年 3月 27日
0
历史一刻！贾跃亭的FF91量产车正式下线：百公里加速2.3秒交付时间又“跳票”
4月15日，快科技报道贾跃亭迎来历史性时刻，FF 91量产车今日正式下线，但交付时间再次跃升。”. 法拉第未来宣布生产其首款量产车FF 91 Futurist，并在加州…
极客号
2023年 4月 15日
0
OpenAI推出新版人工智能图像生成器DALL-E 3
9月21日消息，据外媒报道，当地时间周三，OpenAI推出了新版人工智能（AI）图像生成器DALL-E 3。 DALL-E 3是一个文本转图像生成器，可根据书面提示生成图像。Ope…
极客号
2023年 9月 21日
0
江南烟雨色歌词完整版分享
现在许多短视频都会配上当下最热门的歌曲做背景音乐，“我看过江南烟雨色暮霞逐云波却都不及你一个眼神独特”这首歌相信大家在很多视频中都会听到吧。据了解，这首歌的歌名为《江南烟雨色》，那…
极客号
2023年 5月 6日
0

合作联系：1152QQ041010