AI 音乐 | 2.23 资讯
作者:叮当不是机器猫 |分享AI音乐动态,探索AI与音乐的无限可能!
公众号:智音Brook 2024-02-23 23:07
原文:https://mp.weixin.qq.com/s/1Ss-mVtXYKenRVyQ7I4fpQ
目录
Suno 更新 V3 Alpha,向可控音乐进发
AI 音乐初创公司 Daaci 推出开放测试版及 Natural Drums 插件
MusicMagus:通过扩散模型进行零镜头文本到音乐编辑
SingVisio:歌声转换扩散模型的可视化分析
音乐地图:探索流行音乐流派的终极谱系
Suno 发布 V3 Alpha,向可控音乐进发
链接:https://app.suno.ai/
今日,Suno AI 在社交平台发布 Chirp V3 早期版本 Alpha,向专业及高级用户开放测试,官方已向付费用户添加 300 免费积分。
V3 Alpha 的特点:
- 拥有更好的音频质量和更高的表现力 + 其他强烈要求的功能。
- 最大剪辑长度增加至两分钟。
- 生成速度更快。
- 增加专门的乐器生成功能。
- 扩大语言覆盖范围。
- 延续功能可选择上一片段的任一位置继续生成。
- 仍然保留 V2 版本,可自由切换。
注意事项
V3 Alpha 在遵循某些提示(如调性和 BPM)方面存在困难,其歌曲听起来不总是完美混音和母带处理。应广泛要求,V3 Alpha 制作更长的歌曲,但在提供短提示时也可能容易产生幻觉。
V3 Alpha 仍在开发中,这个早期版本有时仍会在歌曲结构上采取创造性自由。您可能需要与 V2 不同地提示 V3 Alpha 以获得最佳结果,而且随着我们继续开发并努力通过在这些领域进行改进来全面发布,V3 Alpha 会在不通知的情况下发生变化。
AI 音乐初创公司 Daaci 推出开放测试版及 Natural Drums 插件
链接:https://daaci.com/natural-drums/
英国初创公司 Daaci 在 AI 音乐领域引起轰动,成功推出其开放测试版和首个创作者插件——Natural Drums。该插件能实时创造鼓点节奏,助力音乐人快速制作节拍或进行即兴创作。Daaci 的这一步骤不仅得到了 Music Ally SI:X 奖的认可,也展示了其对音乐技术合作和包容性的重视。通过开放测试社区,Daaci 旨在与更广泛的音乐创作社区共同塑造未来的音乐制作工具。
MusicMagus:通过扩散模型进行零镜头文本到音乐编辑
论文:https://arxiv.org/abs/2402.06178 演示:https://www.notion.so/MusicMagus-Zero-Shot-Text-to-Music-Editing-via-Diffusion-Models-8f55a82f34944eb9a4028ca56c546d9d?pvs=4
MusicMagus 通过文本提示进行音乐编辑,能够让用户自由修改音乐的特定属性,如风格、情绪和乐器,同时保持音乐的其他方面不变。通过将文本编辑转化为潜在空间的操作,并引入额外的约束以确保一致性,MusicMagus 实现了与现有预训练文本到音乐扩散模型的无缝集成,无需进行额外训练。
为了验证 MusicMagus 的效果,研究团队设计了两项主要实验:音色转换和风格转换。在音色转换实验中,从 AudioLDM 2 生成的 60 个音频样本中随机挑选,这些样本包含三种不同乐器的音色对换。风格转换实验则选取了 50 个样本,涉及多种风格的转换,比如将爵士乐转换成古典乐。
实验中,使用了 AudioLDM2-base 作为基础模型,并在推理过程中设定 DDIM 步骤为 100,生成 5 秒长的音频片段,全部过程在单个 NVIDIA A100 GPU 上完成。为了提高样本的一致性,实验还涉及了 Transplayer 模型和 MusicGen 模型的使用。这些设置确保了实验能够有效评估 MusicMagus 在音乐编辑方面的表现。
实验结果显示,该模型在音色和风格转换上优于基准模型,特别是在保持音乐的结构和音高上表现突出。但在语义转换上,该模型与基准模型的表现相似,说明它能在风格变换时保持音乐的结构和音高,而语义上的改变并不比基准模型更显著。
SingVisio:歌声转换扩散模型的可视化分析
论文:https://arxiv.org/abs/2402.12660
SingVisio 推出了一种交互式可视分析系统,旨在解释用于歌声转换的扩散模型。该系统由香港中文大学(深圳)和上海 AI 实验室的团队开发,通过可视化展示扩散模型的生成过程,提高了模型的可解释性和用户友好性。SingVisio 允许用户对不同条件下的声音转换进行侧面比较,提供对逐步去噪过程及其对声音转换影响的深入理解,从而弥合了复杂 AI 模型与实际音乐制作需求之间的差距。通过 SingVisio,用户可以直观了解和分析扩散模型在歌声转换中的应用,增强了扩散模型的可解释性和互动性。
音乐地图:探索流行音乐流派的终极谱系
链接:https://musicmap.info/
Musicmap 是一个旨在提供流行音乐流派之间关系和历史的最终谱系的平台,经过七年多的研究和超过 200 个来源的列表以及许多其他视觉谱系的交叉检验。它试图在易于理解、准确性和可访问性之间找到一个微妙的平衡。Musicmap 通过将密切相关的流派分组、为更大的流派组使用颜色编码,并引入较小影响的子流派层次,力图达到这种平衡,总结了 234 个中间或主要流派。Musicmap 不仅是一个教育工具,也为音乐元数据和自动分类提供了一个补充框架,旨在提供所有流行音乐流派几乎完美的概览。
#参考资料
https://x.com/suno_ai_/status/1760779055094177895?s=20
https://musically.com/2024/02/21/ai-music-startup-daaci-launches-open-beta-and-natural-drums-plugin/
https://x.com/Yixiao_Zhang_/status/1756862906980081937?s=20
https://x.com/ArxivSound/status/1760168444454961488?s=20
我是尾巴
感谢您观看至此处,如果文章对您有帮助,点个赞、在看、转发三连支持一波!您的支持是我最大的动力!
叮当不是机器猫
您的支持是我最大的动力
喜欢作者