跳转到内容

AI 音乐 | 3.9 资讯

作者:叮当不是机器猫 |分享AI音乐动态,探索AI与音乐的无限可能!

公众号:智音Brook 2024-03-09 21:05 广东

原文:https://mp.weixin.qq.com/s/fL3yzDmtwqiwNJ_iL6I1-A

目录

Suno 试行教师计划:助力打造个性化课堂

人工智能贝斯手:索尼对音乐制作新范式的构想

MusicLang 🎶 - 基于 Llama 2 的音乐生成模型

Melisma:云端音乐合成服务革新创作流程

ByteComposer:基于语言模型代理的类人旋律创作方法

Suno 试行教师计划:助力打造个性化课堂

链接:https://docs.google.com/forms/d/e/1FAIpQLSeKaqAMTua31_nCgz7VWx9kENDBhIQXb4Zhk1j76jMVSFBRjg/viewform?pli=1

Suno 的教师计划现已在 Suno 平台试行,旨在支持教师们在课堂上与学生共同创作音乐。无论是为微积分课程定制歌曲,还是为学生的第一天破冰活动或生日创作特别旋律,甚至是在午睡时间引导学生体验乐器演奏,Suno 都能成为教师教学工具箱中的得力助手。

Suno 团队表示:“我们非常高兴能够支持教育工作者,让他们能够利用音乐的力量,为学生创造更加丰富多彩的学习环境。我们期待与教师们一起探索音乐与教育结合的无限可能,共同让学习变得更加美妙。”

为了鼓励更多教师参与,Suno 提供了免费积分,让教师们能够无障碍地使用这一工具。点击上方链接,加入 Suno 的教师计划。

人工智能贝斯手:索尼对音乐制作新范式的构想

论文:https://arxiv.org/abs/2402.01412

索尼计算机科学实验室(Sony CSL)的研究团队推出了一款创新的 AI 工具,这一工具通过潜在扩散模型技术,为音乐制作带来了新的可能性。该模型能够根据音乐轨道的风格和音调,自动生成与之完美契合的低音伴奏。这一突破性的 AI 技术不仅能够捕捉音乐的核心特征,还能在音乐制作过程中灵活适应艺术家的独特风格。

在 arXiv 上发表的研究论文中,研究人员详细阐述了他们的发现。他们指出,尽管 AI 音乐生成技术日益成熟,但现有的工具往往无法满足艺术家对于个性化创作的需求。为了解决这一问题,索尼 CSL 的研究人员开发了一种能够分析艺术家创作过程中的中间成果,并据此提出新声音的生成音乐工具。

该系统的核心是一个音频自编码器,它能够将包含人声、吉他等多种音源的音乐混合高效地编码为压缩表示。随后,这种压缩编码被用作一个基于潜在扩散技术的先进架构的输入,该技术在压缩空间中生成数据,从而提升了生成音乐的性能和质量。

通过在包含多种音乐轨道示例的低音吉他编码数据集上进行训练,该模型学会了如何生成与输入音乐轨道和谐配合的低音线。此外,研究人员还提出了一种 “风格定位” 技术,允许用户通过提供参考音频文件来定制生成低音的音色和演奏风格。这一技术的推出,标志着音乐制作领域的一个重要进步,为艺术家和制作人提供了更加个性化和灵活的创作工具。

MusicLang 🎶 - 基于 Llama 2 的音乐生成模型

试玩:https://huggingface.co/spaces/musiclang/musiclang-predict

代码:https://github.com/MusicLang/musiclang_predict

MusicLang 是一个基于 Llama 2 的音乐生成模型,它为音乐创作带来了革命性的深度学习技术。这个开源项目专注于提供高度可控的音乐创作体验,允许用户细致调整节奏、和弦进行、小节范围等元素。MusicLang 的核心优势在于其音乐符号化机制,它能够将复杂的音乐信息转化为一系列符号,从而在生成过程中精确地捕捉和应用音乐理论的深层结构。点击链接即可试玩!

Melisma:云端音乐合成服务革新创作流程

试听:https://soundcloud.com/kagura-music-pub/sets/melisma-demo-all?utm_source=clipboard&utm_campaign=wtshare&utm_medium=widget&utm_content=https%253A%252F%252Fsoundcloud.com%252Fkagura-music-pub%252Fsets%252Fmelisma-demo-all

神乐音乐出版公司近日推出了一项创新的云计算服务——「Melisma」,这一服务标志着音乐制作领域的一次重大进步。通过「Melisma」,用户现在可以将乐谱直接上传到云端,利用先进的音乐合成技术,生成听起来如同真人演奏的自然乐器声音和歌声。

「Melisma」服务的核心优势在于其高度逼真的音频合成能力,它能够精确地捕捉乐器的细微动态和人声的丰富情感,为用户提供了一个既高效又便捷的音乐创作和制作平台。无论是专业音乐制作人还是业余爱好者,「Melisma」都能帮助他们将乐谱转化为生动的音频作品,而无需实际的录音设备或现场演奏。

这一服务的推出,不仅简化了音乐创作流程,降低了制作成本,还为音乐家和作曲家提供了更多的创作自由。随着云计算技术的发展,「Melisma」的出现预示着音乐产业即将迎来更多创新的可能性,为音乐爱好者带来更加丰富和多元的音乐体验。

ByteComposer:基于语言模型代理的类人旋律创作方法

论文:https://arxiv.org/abs/2402.17785

ByteComposer 是一个由字节跳动人工智能实验室开发的创新音乐创作代理,它利用大型语言模型(LLM)的强大能力,模仿人类创作旋律的过程。这个系统通过四个关键步骤——概念分析、草稿创作、自我评估与修改、审美选择——来生成旋律,旨在提供一个与人类作曲家相媲美的创作体验。

在概念分析阶段,ByteComposer 深入分析输入文本的主题,并将其转化为音乐语言,识别与文本内容相关的音乐元素,并选择适当的音乐属性。接着,在草稿创作阶段,系统使用这些音乐属性作为种子,通过各种作曲生成模块创作出初步的旋律。在自我评估与修改阶段,系统会根据音乐理论识别并纠正草稿中的任何客观错误。最后,在审美选择阶段,系统会在所有无误的作品中进行主观评估,选择最具审美价值的作曲。

ByteComposer 的核心模块包括专家模块(Expert)、生成器模块(Generator)、投票器模块(Voter)以及记忆模块(Memory),这些模块共同协作,确保创作过程的连贯性和用户交互数据的记录。此外,系统通过精心设计的提示(prompt)来激发LLM的音乐理论知识,并通过交叉验证来优化提示设计。

在实验中,ByteComposer 在 GPT-4 和其他开源大型语言模型上进行了广泛的测试,证明了其在音乐创作方面的有效性。专业音乐作曲家的评价也显示,ByteComposer 在音乐创作的各个方面达到了初级作曲家的水平。

总的来说,ByteComposer 是一个先进的音乐创作工具,它通过结合LLM的交互性和知识理解能力,为用户提供了一个直观、可控且富有创造性的音乐创作平台。

#参考资料

https://x.com/suno_ai_/status/1766156666259505369?s=20

https://techxplore.com/news/2024-03-ai-bassist-sony-vision-paradigm.html

https://www.musicradar.com/news/sony-ai-bassist?utm_medium=social&utm_campaign=socialflow&utm_content=computer-music&utm_source=twitter.com

https://x.com/computermusicuk/status/1765416442453782829?s=20

https://x.com/reach_vb/status/1766115433885651137?s=20

https://computermusic.jp/2024/03/kagura-music-melisma/

https://x.com/universe_ex/status/1766424370107535812?s=20

https://x.com/ArxivSound/status/1765966986469691773?s=20

我是尾巴

感谢您观看至此处,如果文章对您有帮助,点个赞、在看、转发三连支持一波!您的支持是我最大的动力!

叮当不是机器猫

您的支持是我最大的动力

喜欢作者