免费试玩!商汤绘画大模型 RAPHAEL 出手即大作,击败 Stable Diffusion XL

极客号(Daydx.com)7月13日 消息:商汤大模型团队提出的文生图大模型 RAPHAEL,可以生成具有高度艺术风格或者摄影风格的图片,速度极快。RAPHAEL 通过 Space-MoE、Time-MoE 和 Edge-supervised learning 三个组件实现。

免费试玩!商汤绘画大模型 RAPHAEL 出手即大作,击败 Stable Diffusion XL

论文地址:https://arxiv.org/pdf/2305.18295.pdf

Space-MoE 找出了文本中每一个 token 在图片中对应的区域,用不同的 expert 来处理不同的区域,最后融合;Time-MoE 使得模型能够在不同的 timestep 上选择不同的 expert,形成一系列的 diffusion path,用于绘画不同类别的名词、动词或形容词;Edge-supervised learning 模块使用物体的轮廓纹理来监督 attention 模块的学习。

RAPHAEL 在 FID 指标上击败了 Stable Diffusion 和 DALL-E2,同时在图文匹配度和生成质量上超过了其他模型。

RAPHAEL 在线试玩链接:https://miaohua.sensetime.com/zh-CN/

建议将步数调整到100以获得更佳的图片质量。

本文内容及图片均整理自互联网,不代表本站立场,版权归原作者所有,如有侵权请联系admin#jikehao.com删除。
(0)
极客号的头像极客号
上一篇 2023年 7月 13日
下一篇 2023年 7月 13日

相关推荐

合作联系:1152QQ041010