Suno 操作指北 V2
感谢刘润梓、陈浚嘉投稿
他们在做AI音乐相关的内容,公众号叫:智音Brook
右侧可以扫码关注
方便更充分的探讨交流,建立了一个微信群【通往AI音乐之路】,可以填写问卷:https://waytoagi.feishu.cn/share/base/form/shrcnuLtIpBNzE5bcQtZbS8UEjh
或添加AJ(微信号AAAAAAAJ)备注你的音乐成就,拉你进群
简介
又是一个大工程!去年制作过一期 Discord 版本的 Suno 操作教程Suno 操作指北 V1 ,但一些知识点解释的不清楚,可能对新手玩家不够友好,而且官方在 Web 上推出 Chirp V2 版本模型后,之前的一些操作方式也迭代了,所以最近花了些时间重新整理一份新的教程。在编写过程中,也参考了社区大佬做的非官方 wiki,并尝试把一些知识点给讲透讲清楚,希望能带给读者们不一样的启发🎵
Suno 是一家研究驱动型的人工智能公司,其专门研发的生成式 AI 模型,为创意工作者提供强大的创作工具。公司推出的 Chirp 模型,通过文字描述就能实现逼真的音乐和声音效果,包括配乐、人声、音效等,可广泛用于游戏、短视频、播客等领域。
下面是 Suno 更新信息时间轴👇
目前,Chirp V2 版本模型的最大生成时长为 1 分 20 秒,延续的最大生成时长为 60 秒,下面将详细介绍如何在网页上使用它!
PS:以下内容需要科学上网,请自行解决
Chirp 操作模块详解(非新手可跳过)
登录
链接入口:https://www.suno.ai/
主界面功能介绍
Explore
探索界面展示了玩家们发布的作品,根据播放量和点赞量进行排名。通过Remix/Continue功能,你可以生成类似的作品
Create
Create界面有默认
和自定义
两种模式,点击 “Custom Mode” 按钮进行模式切换。默认模式使用的是 ChatGPT 3.5 模型,只需向它描述你想要的歌曲即可生成,跟在 Copilot 上使用的方法一样;在自定义模式中,你可以输入想要的音乐风格和歌词,或者让 AI 帮你写歌词(这里也用到了 ChatGPT)。
生成的歌曲片段会被展示在界面中间区域,方便你随时编辑它(图一)。
想续写当前歌曲时点击 Continue From This Clip 选项,即可跳转到延续的编辑页面(图二),被选中延续的片段会显示在编辑栏底部,接着输入你想要的歌词和音乐风格,点击 Continue 生成。
在生成第二个片段后,如果你想把第一个和第二个片段拼接起来,可点击界面右侧 Get Whole Song 选项(图三),Chirp 会生成一个完整片段给你。
Tips:Chirp 一次生成两首歌曲,共消耗 10 积分,让 Chirp 生成合并音乐片段或其生成的歌曲时长较短时,不会消耗积分。
Library
你可以在这个界面查看生成记录,以及点赞和发布的歌曲,同时支持对歌曲进行编辑操作。
xx credits left
该处显示用户剩余积分,新用户注册后会有 50 积分,如果没有显示积分,请退出后再重新登录。
Subscribe
订阅方式 |
|||
基础计划
|
专业计划
|
高级计划
|
更多直接与 Suno 公司联系,为企业量身定制生成计划。
|
Help/FAQs
官方解答一些常见的问题,这里不多赘述。
Discord community
获取进入 discord 社区的方式,如果失效,可点击下方👇链接进入。
邀请链接:https://discord.gg/dZqM3mcHeX
Chirp 基础知识
支持的语言
Chirp 可使用多种语言进行演唱,甚至在歌词中切换语言,不需要特别的提示,语言是自动检测的。在推出 V1 版本时,官方声明 Chirp 模型能够支持 50 种语言,下面是官方发布的 Chirp 语言清单,感兴趣的读者自行查看。在后续发布的 V2 版本中,官方没有发布声明,但据了解现在大多语言是能在 Chirp 上使用的。
官方链接:https://suno-ai.notion.site/Supported-Languages-16550b00a3f04ee6bab541d135eaf713
元标签
元标签(Metatags)是一种特殊的提示,用来在创建内容时提供方向性的指引,但它们自身并不会被直接说出或演唱。元标签可用来指导歌词和音乐的间断,帮助 Chirp 从一个部分过渡到另一个部分。
官方最早提出的元标签是诸如 [verse] [chorus] 这类歌曲结构,原本打算将 Chirp 培养成一个优秀的音乐模型,但还是低估玩家们的探索热情,在玩家们的轮番 “洗脑” 下,Chirp 开始走向了不归路 ...
如今的 Chirp,你可以把它看做一个表演艺术家,只要提供足够清晰的台本,它就能帮你演绎出来(想象力即创造力)。在推出 V1 版本时,官方发布了一份 Chirp 的元标签清单,但只列出了一些做参考(官方统计不过来)。
官方链接:https://suno-ai.notion.site/Using-Metatags-34944efe09ec41d693e314f13af44695
两类特色功能
这部分我将介绍自定义模式
里的风格提示和歌词提示两个功能的原理和技巧。
风格提示
这个功能是在更新 V1 版本时推出的,你可以在该功能框输入一个完整的句子,或者由逗号隔开的一系列乐器或音乐元素,或者是流派和风格词汇的混搭(提示词没有先后之分),同样的提示词,生成结果也会有所不同。
音乐知识科普:什么是流派?什么是风格?
流派(Genre):
音乐流派是指一群共享特定音乐特性和传统的作品集合,是分类音乐多样性的一种方式。诸如摇滚、爵士、古典、电子和乡村音乐等,都是独具特色的流派。这些分类主要基于作品的结构、节奏、和声以及乐器使用等关键因素。每个流派都是音乐历史长河中的一部分,不仅代表了一段时间的音乐趋势,还深受其历史和文化背景的影响。音乐流派的形成和发展,不仅是艺术表达的演变,也是文化交流和社会变迁的见证。
风格(Style):
风格在艺术领域,尤其是音乐创作中,主要指艺术家或作品所展现的独特特征和创作手法。它是艺术家个性化的音乐表达,不受限于单一流派,而是可以跨越和融合多种音乐风格。例如,一位流行音乐艺术家可能通过其特有的唱腔或舞台表演风格,展示其独特的艺术个性。这些元素共同构成了艺术家独一无二的音乐风格,使其作品与众不同,成为其艺术标识的一部分。
提示词技巧
- 尽量精确到某个流派或者该流派的子流派,Chirp 的生成会更准确。
- 描述一种情绪的状态。
- 描述歌曲的主题或应用场景。
- 尝试混合不同的流派和风格。
- 列出特定的乐器。
- 描述人声。
- 指定一个特定的时间段或历史时期。
- 简短的提示可能出来的效果更好。
拓展
- 在使用上,HipHop(嘻哈)可能默认为城市风格男声,Country(乡村)通常会有西部口音的演唱,Jazz(爵士)可能为深情的女性声音。
- 当你将风格提示留空,Chirp 会使用随机的流派或风格生成,当然会参考你的歌词提示。
- 在延续上,当你将风格提示留空,Chirp 会根据你上一段的旋律继续创作。
资源
整理自非官方 wiki 提供的音乐流派、风格词汇大全。
歌词提示
这个功能是最早出现的,在发布 V0 版本时,官方声明可使用 verse,chorus 以及一些音乐流派来指导歌词,在更新 V1 版本时,推出的风格提示功能,在一定程度上为歌词提示功能 “减负”,同时增强了可操作性。
歌词提示功能常见有三种输入形式,分别是元标签 + 文本、纯元标签、纯文本。
书写格式
- 使用像 [verse]、[chorus] 这类元标签格式来引导文本生成(元标签内容不区分大小写)。
- 歌词行数官方建议是 4-8 行,生成效果最好,但具体还是看个人需要,无硬性要求。
- 每个部分(比如verse—chorus)之间要空一行。
- 歌词中的即兴或旁白的部分,用 () 表示。
音乐知识科普:歌曲结构
- Intro(引子或前奏):歌曲的开始部分,通常用来建立歌曲的基调和氛围。引子可能包含一些基本的旋律或节奏元素,但通常不包括主要的歌词。
- Verse(诗歌部分/主歌):这部分是歌曲的主体,通常包含歌曲的主要故事或情感内容。每个诗歌部分可能有不同的歌词,但通常保持相同的旋律和节奏模式。
- Chorus(合唱部分/副歌):通常是歌曲中最具辨识度的部分,重复出现,包含主要的主题和旋律。合唱部分是歌曲中最易被记住的部分,往往包含“钩子”(hook)—— 一种特别引人入胜的旋律或歌词。
- Bridge(桥接部分):这一部分出现在歌曲后半部,提供了与前面诗歌和合唱部分不同的旋律和节奏,用来增加歌曲的多样性和深度。
- Outro(尾奏):歌曲的结尾部分,与引子相似,但用来结束歌曲。尾奏可以是对引子的重复,或者提供一种平静下来的感觉,渐渐带出歌曲。
- Pre-Chorus(前副歌)(可选):在某些歌曲中,前副歌作为从诗歌部分到合唱部分的过渡。它可以增加歌曲的动态范围,为合唱部分的到来建立情感张力。
- 间奏(Interlude)(可选):间奏是歌曲中的一个部分,其中不包含歌词,只有乐器演奏,通常用于连接两个不同的歌唱部分,如两个诗歌部分或诗歌部分到合唱部分之间,提供歌曲的情感转换或增强歌曲的整体感觉。
歌曲结构顺序
歌曲结构顺序千变万化,比较常见的歌曲结构顺序是按 前奏—主歌—前副歌—副歌—间奏—主歌—副歌—桥段—副歌—尾奏 这样去进行,当然,具体结构顺序看创作者根据歌曲的内容、风格和目标听众来进行排序选择。
如果想深入了解关于歌曲结构的知识,可以参考这篇博客:https://blog.native-instruments.com/jp/song-structure-101/
拓展
- 有些风格提示功能中的词汇也可以作为元标签在歌词提示功能中使用,像 Female Narrator,Diva Solo,Gospel Choir 。
- 歌词提示功能中可以使用名称元标签来生成不同的声音。
辅助工具
分享几个音乐工具,用来理解和学习相关音乐知识。虽然 GPT 能快速赋予你’ 音乐人 ‘的能力,但还是缺少 “沉浸式” 体验。当下的 AI 时代,请铭记:「人工」+「智能」=「最优解」
Sonoteller
Sonoteller.ai 是一个智能的音乐分析网站,只需要输入链接(目前仅支持油管视频链接),等待 1-2 分钟,它会生成一份歌曲的分析报告给你,包括歌曲的主题、风格、氛围、配器、节奏等。
链接入口:https://sonoteller.ai/ (其实点击标题可跳转对应网页hh,只是怕有朋友不晓得~)
Every noise at once
Every noise 是基于 Spotify 里 6000 多个音乐流派的数据分类网站,在使用时只需点击词语就能播放对应的音乐示例,在每个词语后面会附带 » 符号,可跳转至该流派的艺术家地图。
链接入口:https://everynoise.com/(其实点击标题可跳转对应网页hh,只是怕有朋友不晓得~)
Chosic
Chosic 也是基于 Spotify 的音乐库而制作的一个分类网站,包含各种音乐信息,搜索功能也是十分强大,唯一缺点就是广告有点多。
链接入口:https://www.chosic.com/(其实点击标题可跳转对应网页hh,只是怕有朋友不晓得~)
音乐术语查询器
界面非常的简单,功能只有一个搜索栏,但很好用,支持中英文输入。
链接入口:https://nicechord.com/terms/(其实点击标题可跳转对应网页hh,只是怕有朋友不晓得~)
维基音乐术语大全
链接入口:https://en.wikipedia.org/wiki/Glossary_of_music_terminology(其实点击标题可跳转对应网页hh,只是怕有朋友不晓得~)
Chirp 进阶知识
Chirp 的采样
这个特性我在之前出 V1 版本教程的时候有讲过,就是 Chirp 会在第一个生成片段的最后 10 秒进行采样,然后将这个采样呈现在第二个以及后续的生成片段中,采样的内容可以是人声、旋律等,在音乐上称为 Hook(钩子)。如果在这 10 秒内声音出现减弱或杂乱,Chirp 会停止这部分的采样并在下一个片段生成新的内容。
在新版本的测试中,我发现 Chirp 会记住第一个生成片段的最后一个 Hook,并在后续生成中使用它,当你在第一个生成片段中使用两段相同歌词时,Chirp 会将该歌词默认为 Hook 并进行采样,即使第二段 Hook 没唱完,在下一个生成片段中,Chirp 也能接上并唱好它。下面示例中我采用 verse-chorus-verse-chorus 的结构顺序,以此展示 Chirp 的采样效果。
采样效果演示
元标签的书写
括号格式
元标签的括号没有固定格式,像 (verse)、[verse]、{verse} 都可以。
内容
元标签的内容可以是名词,比如[verse]、[spoken],可以是形容词+名词,比如 [emotional Verse]、[Happy Chorus],也可以是句子,比如 [War is about to begin]。
注意
句子尽量保持简短,不要过长,不然 Chirp 会把它当做歌词唱出来。
❌[call and response between percussion and bass]
常用格式
格式 |
示例 |
---|---|
[***] .... |
[verse] .... |
[***] [***] [***] |
[beatbox] [tempo shift] [funky beats] |
[***,***,***] [***] |
[saxophone,coronet,trombone] [melodic instrumental] |
[***:描述] |
[verse:Match vocals at starts] |
注意
在元标签 + 文本的结构中,如果元标签中存在声音效果词汇,如 fade in,reverb,那需要在你每个元标签 + 文本的部分之间增加一个空行,防止 Chirp 有时把它们当成同个部分去创作生成。
实战
这部分我会列举一些技巧和示例,方便读者理解以及使用它们。不过由于 Chirp 的随机性,所以下面提供的方法不能保证百分百成功,仍然需要读者动手去实践。
歌曲生成
这里我使用一个简单的歌曲结构顺序 [intro]—[verse 1]—[chorus]—[verse 2]—[chorus]—[bridge]—[chorus]—[outro],歌词和风格提示由 GPT 生成,先来跑一遍,然后逐步分析其中的问题。
案例演示
前奏
这里需要科普一个东西,叫 “同类合并”,Chirp 在读取元标签的时候会按照它认为的方式进行,就像下面这样。
我输入的 |
Chirp 认为的 |
---|---|
[intro] [verse] |
[intro,verse] |
案例里就是这种情况,intro 和 verse 1 被 Chirp 处理成同一部分,这明显不符合我们的预期,所以为了得到一个前奏,我们需要让 intro 部分看起来像是 “独立” 的部分。
解决方法
方法 |
提示词 |
效果演示 |
---|---|---|
参照我之前教程里的一种写法,将 [intro] 改为 (intro)。
|
(intro)
[verse] ....
|
|
增加一些器乐描述,提示 Chirp 这里需要一段器乐演奏。
|
[intro] [instrumental]
[verse] ....
|
|
[build] [melodic instrumental]
[verse] .... |
|
|
[Medium-Length Instrumental Intro]
[verse] .... |
|
|
[Instrumental Intro: Build]
[verse] .... |
|
|
在主歌前添加一些语气词,提示 Chirp 主歌前有声音。 |
(ooh-yeah) [intro] [instrumental]
[verse] .... |
|
(ooh,oh-oh-oh-oh) [verse] .... |
|
|
输入多个[intro],提示 Chirp 这里有前奏。 |
[intro][intro][intro] [intro][intro][intro] [intro][intro][intro] [intro][intro][intro]
[verse] .... |
|
知识科普:乐器与器乐的区别
乐器(Musical Instrument)
乐器是用于制作音乐的工具。它们可以是弦乐器、管乐器、打击乐器、键盘乐器等,用于演奏音乐。乐器是指物理对象,即用来创造声音的实体设备。
器乐(Instrumental Music)
器乐指的是仅由乐器演奏的音乐,不包含人声。它是一种音乐形式或类别,强调乐器的声音和演奏技巧。器乐可以是单独一个乐器的独奏,也可以是多个乐器组成的合奏或交响乐。
注意
某些时候会出现前奏过长或者 Chirp 不唱歌词的情况,这是因为:
- Chirp 不知道如何唱这段文本。
- Chirp 觉得这首歌需要一个很长的前奏。
- Chirp 收到了冲突的指令并卡住了。
解决方法 |
提示词 |
---|---|
在风格提示功能中添加人声的描述词 |
比如 upbeat female vocals、sultry male singer |
在前奏之前添加一段短暂的发声,或者一段阿卡贝拉(无伴奏歌唱) |
(Ahh ahh ahh) [Catchy Hook] [Verse 1] Dancing in the neon lights… |
拓展
如何在前奏中使用具体的乐器演奏?
方法 |
提示词 |
效果演示 |
---|---|---|
添加一些相关的乐器元标签,比如我是 pop,funk 风格的歌曲,就选用 funk 节奏 + 低音贝斯来铺垫前奏部分。 |
[intro] [funky beats] [electric bass] [melodic instrumental]
[verse] .... |
|
主歌、副歌部分
回到前面的案例,在 verse 2 唱完后,几乎没有停顿,直接进入了 chorus 部分,以至于节奏出现错误,Chirp 也出现了 “幻觉”。这里出现的问题也是随机的,那么假设,如果我们需要 Chirp 在两个部分之间停顿一下,该怎么办呢?
停顿的片段,一般是器乐演奏,所以我们需要让 Chirp 停止人声的部分,可以使用以下方法。
解决方法
方法 |
提示词 |
效果演示 |
---|---|---|
添加 break 描述让 Chirp 进入一段器乐演奏。 |
[verse] ....
[break]
[chorus] .... |
|
[verse] ....
[break] [melodic interlude]
[chorus] .... |
|
|
添加乐器元标签创造一段乐器 solo,或者器乐描述也可以。 |
比如 [bass drop]、[percussion breakdown]、[melodic flute interlude]、[guitar solo]、[melodic instrumental]
|
|
注意
在同一个片段中,当你使用类似 [break] 指令让 Chirp 做休整,需要在指令后继续用 chorus 部分或一个新的 verse 部分来保持人声 “温暖”。如果人声沉默太久,Chirp 可能会 “忘记” 那个声音应该是怎样的,并创造一个新的声音来继续歌曲。
结尾部分
前面案例中,我在结尾处使用 [Outro] 来表示尾奏,[Outro] 在这里的意思是告诉 Chirp,我想在结束前再进行一段音乐,再结束歌曲,但 Chirp 经常不这么 “认为”。
原因就是,当 Chirp 完成一个歌曲循环时,它会随机生成一个带有结尾的片段,这个时候就能很自然的结束掉歌曲。如果它还有更多的循环部分要完成,它可能抵制结束。
如果出现最后一个片段的时长少于 1 分钟的,那大概率 Chirp 会在这个片段结束歌曲,但偶尔会在看似快结束的时候突然来个强烈的鼓点,然后又开始了歌曲 ... 挺无语的。
解决方法
方法 |
提示词 |
效果演示 |
---|---|---|
使用结束元标签,提示 Chirp 该考虑结束歌曲了
|
比如 [big finish]、[end]、[fade out]、[fade out and end] |
|
[outro] .... [fade out] [fade out] [fade out] |
|
|
[Song Ends]
[Song Ends] |
|
注意
在使用这些元标签时,尽量留出一整个片段给 Chirp 慢慢淡出或结束,如果没有结束,重复使用上述方法直到它停止。
案例改版展示
纯音乐生成
纯音乐,也称为器乐音乐,是指不包含歌词和人声的音乐。它通过各种乐器的演奏来表达情感和故事,不依赖于文字的描述。纯音乐可以包括古典音乐、爵士乐、电子音乐、新世纪音乐等多种风格。这种音乐形式给听众提供了更广阔的想象空间,让人们通过音乐本身的旋律、节奏和和声来感受和解读。
方法 |
提示词 |
效果演示 |
---|---|---|
在风格提示功能中输入相关提示词,然后将歌词提示功能留空。 |
advertisement jingle music,ukulele,hawaiian,tropical,island,happy,upbeat |
|
在歌词提示功能中使用乐器元标签并进行堆叠,跟前面生成前奏的方法一样。 |
[fade in,intro] [rhythmic handclaps] [rhythmic fingersnaps] [funky bass] [melodic instrumental]
[fingerstyle electric guitar] [saxophone,coronet,trombone] [melodic instrumental] |
|
注意
有些流派在你把歌词提示功能留空的情况下会自发唱歌,即使在风格提示功能里添加器乐描述也没用,解决办法是往歌词提示功能中添加一个 [Melodic Instrumental]
。
拓展
如何生成一首没有人声的伴奏?
方法 |
提示词 |
效果演示 |
---|---|---|
将元标签后的文本改为 Chirp 检查不出来的符号或表情。 |
[verse] 😁😋🤣
|
https://app.suno.ai/song/a7fb72c3-19ea-49de-8ac2-ad118a27e22d |
元标签后的文本用[instrumental] 表示 |
[verse] [instrumental] [instrumental] .... |
https://app.suno.ai/song/1838d428-da8e-47c7-8328-ffbd11e51c53 |
常见问题
1.歌词的延续
- 如果歌词被切断,那么在下一个片段开始,接上它们停止的地方。如果一个单词被切成两半,用下一个单词开始继续的歌词。
- 不要再次使用被中断的元标签。例如,如果你的 [Chorus] 被切断了,那么在下一个片段中,你接上的歌词不要添加 [Chorus] 这个元标签,如果添加了,Chirp 会认为这是新的 [Chorus] 并开始新的生成。
- 如果 Chirp 尝试重复它刚唱过的完整行,或者逐字重复合唱,使用 [Break] 来打断歌曲流程。
- 考虑回到之前的片段,重新使用延续功能生成。
2.进入一段器乐后,如何让它停止并进入歌词
试着在歌词前加入语气词,比如 (Ohh,Ohh ohh),来提示 Chirp 这里有人声,让它做好过渡准备,有时有用。
3.“无法生成”或“尝试另一个提示”的错误
意味着你的文本请求被阻止了。被拒绝的提示将退还积分。
一个歌曲提示可能因为多种原因被阻止:
- 你的歌词受版权保护。
- 你的音乐风格或歌曲描述使用了真实的乐队或艺术家名称。
- 你的歌词包含违规词汇。
- 你的实际积分用尽了,但网页没有同步。(刷新页面。)
- 在默认模式或“生成随机歌词”按钮下,AI 无法理解如何将你的请求转化为歌曲。
更多
神器——SunoBeats
由社区大佬 Josh Barton 制作,为 Suno AI 量身定制的 GPTs,质量很高,尤其是流派和风格方面,把控的很准,只是需要注意在使用时得把元标签的内容改下,像 [Verse 1-Ancient Poetry Essence],你需要把 Verse 1 后的描述删掉,当然保留也行,只是保留后生成的质量不稳定。同时,它还能读取图片,根据图片内容写出对应的风格和歌词。
参考资料
非官方 Suno wiki:https://www.notion.so/suno-ai-wiki/4e24aa838bf84fffaf383b1f9ed50748?v=755ec8954abd4e3f9f5c899950f0f315
我是分割线ヽ( ̄ω ̄( ̄ω ̄〃)ゝ
到这里,Chirp 的东西基本讲完了,这些干货足够你从 0-1 完成一首歌曲,至于其他形式的内容,请大伙自行脑洞,嗨🎵翻全场吧!
最后以一首我最喜欢的摇滚乐结尾~
by猫叔:经过两天的测试,目前看提示词是可以包含不少东西的,在Style of Music里可以输入的内容有:
类型+流派.歌手性别(Female\Male).语言(比如粤语Cantonese).音域(中高低音之类).年代.乐器.声音特点(如scratchy沙哑).速度(快慢).背景音(比如街道人声).和声等等
KEEN补充:情绪/氛围也有用,比如energetic,joyous