跳转到内容

AI音乐 | 2.19资讯

作者:叮当不是机器猫 |分享AI音乐动态,探索AI与音乐的无限可能!

公众号:智音Brook 2024-02-19 21:30 广东

原文https://mp.weixin.qq.com/s/m6stdYOlt2g2OyNUKZu7oQ

目录

ElevenLabs() 即将推出 AI 音效

革命性地改变音乐创作:AI 音乐生成应用的兴起

Google 团队推出 SingSong:为人声创造伴奏

Meta 的 MAGNeT:文本转音乐和文本转音频

探索创新与音乐的交汇点:蓝晶石的最新动态

ElevenLabs 即将推出 AI 音效

申请链接:https://form.typeform.com/to/gg0xzZW4?typeform-source=t.co

革命性地改变音乐创作:AI 音乐生成应用的兴起

在当前数字化时代,人工智能(AI)技术正日益融入我们的生活各个领域,音乐产业也不例外。该文深入探讨了 AI 音乐生成应用如何根本性地改变了音乐制作、分发和创作的方式,预示着这一领域未来的发展方向。

文章指出,AI 音乐生成应用已经成为音乐产业中的一项革命性工具,尤其是对企业客户和创业者而言。以 Moises 为例,这类平台能够解构和重构音乐轨道,为用户提供了前所未有的创作自由度和控制能力。这不仅推动了音乐创作的创新,也使得音乐的生产和分发过程变得更加高效和灵活。

文章中提到的数据显示,2022 年 AI 音乐市场的估值为 2.29 亿美元,并预计到 2032 年将达到 26 亿美元。这一迅猛增长的预测突显了 AI 技术在音乐产业中的扩大影响和未来潜力。

AI 音乐生成应用的发展带来了一系列引人深思的问题,包括如何在创造性与自动化之间找到平衡,这些技术对音乐产业传统角色和工作方式的长远影响,以及随着 AI 技术的进步,人类音乐家的角色将如何演变。

行动启示方面,文章建议音乐产业的企业客户和创业者应考虑如何利用 AI 音乐生成应用来增强创造力、提高效率和竞争力。同时,对于音乐创作者和制作人来说,探索和实验 AI 音乐生成工具不仅可以开辟新的创作渠道,甚至有可能改变他们与音乐的互动方式。

总的来说,AI 音乐生成应用正在为音乐产业带来前所未有的变革,为企业客户和创业者提供了创新的音乐创作、生产和分发方法。这一变革不仅仅体现在过程的自动化上,更在于它引入了新的创造性和效率层次,预示着音乐产业未来发展的新趋势。

Google 团队推出 SingSong:为人声创造伴奏

Google 的一支研发团队,由 Chris Donahue、Antoine Caillon、Adam Roberts 等人领衔,推出了名为 SingSong 的创新系统。这一系统利用人工智能技术,为单独的人声旋律自动生成音乐伴奏,代表了 AI 在音乐创作领域的一大突破。

技术原理:SingSong 团队采取在独立人声中添加噪声,以淹没乐器的残留声音,迫使模型从人声中学习,从而提高伴奏生成的准确性和质量。

实现方法:基于 AudioLM 系统,通过同时关注音频的小尺度和大尺度特征来生成音频。这种方法使得生成的伴奏能够更加精准地匹配人声的节奏和情感。

数据集构建:构建了一个包含 100 万录音的数据集,总计 46000 小时的音乐,这些录音被分割为 10 秒长的片段,包括匹配的独立人声和乐器轨道,并对人声轨道进行了噪声处理。

模型训练:使用 T5 变换器,根据噪声处理过的人声标记生成对应的乐器标记。

成果展示:听众测试中,SingSong 生成的伴奏与原始人声配对的版本比随机伴奏、最相似的伴奏以及原始乐器轨道更受欢迎。

数据增强应用:SingSong 项目中的数据增强应用与常规的机器学习实践不同。通常,数据增强用于防止模型记忆个别样本。但在这个项目中,增加噪声的目的是阻止模型从数据中的伪像(如残留乐器声音)中学习,确保模型能够正确地学习人声和伴奏之间的关系。

Meta 的 MAGNeT:文本转音乐和文本转音频

体验链接1:https://huggingface.co/spaces/fffiloni/MAGNet

体验链接2:https://replicate.com/lucataco/magnet

论文:https://arxiv.org/abs/2401.04577

代码:https://github.com/facebookresearch/audiocraft

MAGNeT,一种直接在多个音频标记流上运行的掩码生成序列建模方法。与之前的工作不同,MAGNeT 由单级非自回归变压器组成。

在训练期间,我们预测从掩码调度程序获得的掩码令牌的范围,而在推理过程中,我们使用多个解码步骤逐渐构建输出序列。

为了进一步提高生成音频的质量,我们引入了一种新颖的重新评分方法,其中我们利用外部预训练模型对 MAGNeT 的预测进行重新评分和排名,然后将其用于后续的解码步骤。最后,我们探索了 MAGNeT 的混合版本,其中我们融合自回归和非自回归模型,以自回归方式生成前几秒,同时并行解码序列的其余部分。

我们展示了 MAGNeT 在文本到音乐和文本到音频生成任务中的效率,并考虑客观指标和人类研究,进行了广泛的实证评估。所提出的方法与评估的基线相当,同时速度明显更快(比自回归基线快 7 倍)。通过消融研究和分析,我们阐明了组成 MAGNeT 的每个组件的重要性,并指出了自回归和非自回归建模之间的权衡,考虑了延迟、吞吐量和生成质量。

探索创新与音乐的交汇点:蓝晶石的最新动态

申请链接:https://form.typeform.com/to/tmwGiBmY?typeform-source=www.linkedin.com

蓝晶石为创新者们带来了最新的精彩更新,支持了一系列令人兴奋的项目,这些项目将音乐、科技和创意艺术无缝结合,开辟了全新的探索领域。

🧘♀️ 来自 KU Leuven 的工程与科学系博士生 Amir Shahhosseini 和 Zhenxiang Cao 正致力于开发一种独特的音乐到灯光翻译器。这一创新项目旨在通过调节环境光线来改善人们的情绪健康,为我们如何与音乐和光互动提供了全新视角。

🔊 在 Budapest University of Technology and Economics,Kristóf Kasza 正在研发名为 MusiQ 的智能排队系统。MusiQ 能在各种活动中实现音乐的共享,让音乐选择变得更加民主和互动。

✍️ Berklee College of Music() 的 Mansidak Singh 正开发一款革命性的写作软件,这款软件通过提供生成的氛围、音乐和图像来营造一个冥想空间,旨在使写作过程变得更加愉快和富有成效。

Cyanite for Innovators 是一个专为音乐、人工智能和创意艺术的融合而设计的平台,致力于推动创造力和创新。通过这个平台,成功的申请者将能够访问我们的 API 和技术资源、专业知识以及支持他们原型开发的早期工具。

如果你心中有创新的火花,想要将音乐与科技的界限推得更远,蓝晶石的门户为你敞开。现在就来申请,和我们一起探索音乐和创新的无限可能性吧! 🎶🤖🎭

#参考资料

https://x.com/elevenlabsio/status/1759240084342059260?s=20

https://medium.com/@apoorv-gehlot/revolutionizing-music-creation-the-emergence-of-ai-music-generator-apps-6302cc2c55be

https://www.deeplearning.ai/the-batch/singsong-a-tool-that-generates-instrumental-music-for-unaccompanied-input-vocals/?utm_campaign=The Batch&utm_content=279324023&utm_medium=social&utm_source=twitter&hss_channel=tw-992153930095251456

https://x.com/_akhaliq/status/1745115636680757447?s=20

https://x.com/camenduru/status/1747080264281444762?s=20

https://www.linkedin.com/posts/cyanite-ai_company-funded-innovators-programme-application-activity-7163166427099688961-sBT-?utm_source=share&utm_medium=member_desktop

我是尾巴

感谢您观看至此处,如果文章对您有帮助,点个赞、在看、转发三连支持一波!您的支持是我最大的动力!

叮当不是机器猫

您的支持是我最大的动力

喜欢作者