LP-MusicCaps:基于 LLM 的伪音乐字幕生成方法

极客号(Daydx.com)8月3日 消息:LP-MusicCaps 是一种基于 LLM 的伪音乐字幕生成方法。该项目的目标是为音乐生成字幕。它通过将大型语言模型应用于标签数据集,生成了一个大规模的音乐字幕数据集,为研究者们提供了更多的训练数据,以便成功训练音乐字幕生成模型。

LP-MusicCaps:基于 LLM 的伪音乐字幕生成方法

项目地址:https://github.com/seungheondoh/lp-music-caps

其核心功能包括:

1. 标签到字幕:利用现有标签,使用 OpenAI 的 GPT-3.5Turbo API 生成高质量、上下文相关的音乐字幕。

2. 音频到字幕:使用音乐音频和伪字幕对,训练端到端的跨模态编码器 – 解码器模型,用于音乐字幕生成。

3.系统性评估方案:LP-MusicCaps 提出了一种系统性评估方案,通过多种定量评估指标和人工评估来评估大规模音乐字幕数据集的质量。

4.零样本学习和迁移学习支持:LP-MusicCaps 训练的模型在零样本学习和迁移学习场景下表现良好,证明了基于大型语言模型的伪字幕的有效性。

LP-MusicCaps:基于 LLM 的伪音乐字幕生成方法

本文内容及图片均整理自互联网,不代表本站立场,版权归原作者所有,如有侵权请联系admin#jikehao.com删除。
(0)
极客号的头像极客号
上一篇 2023年 8月 3日
下一篇 2023年 8月 3日

相关推荐

合作联系:1152QQ041010