跳转到内容

格林:SUNO提升音质Tips

🏝

作者:格林

在这里介绍两种提升SUNO音质的办法,其中母带处理已经在前文中有过推荐使用AI母带处理平台,所以第一部分只是一些补充,重点是第二个方法。

一、母带处理:

指通过专业软件对发布前的音频进行EQ、限制、声场、压缩等处理,以提升音质听感(统一声音风格质感等等……)。最明显的效果包括响度和细节的增强,使音频听起来更加清晰和饱满,如增强响度、强化低音或者提升人声和器乐的清晰度。

注意:母带处理是音乐工程中相当重要和专业的最后一环,正常情况下需要很多相关的专业知识,所以最好自己自行查阅资料学习一些基本概念。

推荐的两种母带处理方法:

  1. 1.OZONE:一款专业的音频处理VST插件,需要一定的音频处理软件基础,也有很方便的一键母带功能。可以在B站搜索教程了解详细使用教程。
  2. 在线AI母带处理平台:推荐一个免费的工具 https://app.bakuage.com/,如果不理解参数设定,可以请教像GPT这样的AI助手,适合快速简单处理。

可以访问前文有简单介绍。如何让自己的歌曲发布时更“好听”

再次需要注意:如果没有专业的知识判断处理的音频好坏,以自己喜欢的听感为准!多用几个设备听。

二、利用UDIO的REMIX功能进行音质改造:

UDIO的REMIX功能可以称之为神器,这里只介绍用来改造SUNO音频的音质、音色、细节。

REMIX功能原理是让AI根据上传的音频参考,然后按prompt的要求与参数设置生成相似(或相当不一样)的音频。这和EXTEND功能是完全不同的应用效果。在此不做详细的说明,可以仔细看看官方说明或者实际操作一遍就能明白。

我们用以下两个示例进行演示:

第一组(人声音乐):
  1. 这是SUNO生成的音频片段

PROMPT是:Downtempo, Alternative Pop, Piano, Trip Hop, Minor keys,

  1. 这是将音频片段上传到UDIO进行REMIX之后的音频片段1

PROMPT保持一致,参数Variance(方差值,值越小约相似)设置为0.15

可以明显听出人声的细节和质量都好了很多,最为惊艳是间奏部分的lead被重新演绎成了女高音。

  1. 这是将音频片段上传到UDIO进行REMIX之后的音频片段2

PROMPT保持一致,参数Variance(方差值,值越小约相似)设置为0.25

区别更明显,人声原来朦胧的音质被重新演绎成了叠加的处理效果,演唱细节也更多了,间奏也同样是被演绎成了女高音,但是更像是合成器人声。

第二组(纯器乐):
  1. 这是SUNO生成的音频片段

PROMPT是:Fingerstyle, Acoustic guitar solo,

这段音频是上传了岸部真明的指弹歌曲进行引导生成的,音质已经是SUNO能参照生成的最好效果。

  1. 这是将音频片段上传到UDIO进行REMIX之后的音频片段1

PROMPT保持一致,参数Variance(方差值,值越小约相似)设置为0.15

吉他声音更靠前,音色更透亮,混响声被弱化,弹奏细节更多

  1. 这是将音频片段上传到UDIO进行REMIX之后的音频片段2

PROMPT保持一致,参数Variance(方差值,值越小约相似)设置为0.25

吉他声音更靠前和透亮了,一开始的揉弦让人印象深刻,细节增加了非常多,包括明显的滑刮弦的声音,触弦质感,动态,都很好。但是AI并不是真正理解弹奏,所以,有时很多细节未必是正确的,需要自己对该类型乐器演奏有正确了解。

总之,对比之后可以明显的听出,方差值越大,和原版音频的偏差越大,AI会进行自由发挥。但是无论如何,新生成的声音细节,都是远超原版SUNO的。

所以,调整参数需要考虑的是,如果SUNO原版音频的配器和旋律已经觉得满意了,那就把方差值调小,尽量让AI不要进行太大的改动。如果希望UDIO尽可能的改造更多,那就拉大方差值,直到生成一个符合你对配器、音色要求的音频。

注意,以下是重点内容:

当使用UDIO进行参考音频REMIX生成时,AI会完整地参考音频文件中的所有声音细节,包括任何噪音。如示例2,这段生成的原声吉他演奏,所得到的音频文件除了包含吉他本身的声音外,往往还会包含弹拨声、底噪、混响以及其他杂音。使用频谱图查看这些音频文件时,可以清楚地看到这些细节。

在人类听觉中,我们通常只会注意到吉他的声音而忽略其他细节。但对AI来说,无论是吉他声还是其他声音,都是参考的重要信息。因此,音频信息越丰富,AI参考时生成的音频信息也会相对增多(一般情况下只多不少)。例如,AI可能会将一个随机的“咔哒”声理解为鼓点,在生成的音频片段中,这个声音就被转换成了鼓声。同理,其他的杂音也可能被AI转化为各种不同的声音。

我们第一组例子里,0.15的REMIX片段,在48秒开始的uplifter,有奇怪的震荡抖动声,这实际上就是UDIO AI根据SUNO的音频噪声重新解释生成的。因此,尽管UDIO会给我们很多细节,但类似的奇怪声音会让整体听感变差,这并没有达到我们的期望。

所以,如何更理想地实现音质提升?

一个方案是,在上传音频给UDIO进行REMIX之前,使用传统音频处理手段对音频进行降噪和去杂音处理。这些技术比较专业,但值得学习,因为不只是提升SUNO音质这一个目的能用到。

本人经常使用的工具包括WAVES的X-NOISE插件、RX11音频修复软件以及Audition的采样降噪功能等等。市面上类似的软件和插件众多,可以在B站找到相关教程。

需要注意的是,所有的降噪处理都是有损的,去除噪音的同时也会移除一些原有声音的细节,这需要通过不断的实践和调参来找到一个平衡点。

同时,一副比较好的耳机和一双相对灵敏的耳朵是必备硬件,毕竟如果听不出来区别,也就没什么必要去折腾了。

关于音质的探讨,可以向微信群内大神@jyzhang 请教,本人不做进一步科普。

另,以下问题不在本文范围,请群里讨论:

UDIO为什么不能上传音频?(付费)

UDIO的REMIX怎么用?

UDIO的REMIX只能32秒或2分11秒,音频超长怎么办?

………………