定焦(dingjiaoone)原创
作者王璐
编辑魏佳
“不开心就让 Suno 给你写首歌吧。”
近期,AI 音乐生成类工具 Suno 发布最新版本,凭借着低门槛、速度快、歌曲完成度高的强大功能,被网友誉为音乐界的 ChatGPT,甚至一些词曲创作者开始担心,自己要失业了。
这是国外 AI 初创公司 Suno 研发的一款文本生成音乐工具,目前推出的是 V3 版本,用户只需输入几句歌词或者歌名,并自选音乐风格,便可在一分钟内得到两首时长在两分钟内的歌曲。Suno 支持中文在内的多种语言输入,且免费向用户开放。
近两年,在文生图、文生视频领域分别诞生了 Midjourney、Sora 等效果炸裂的应用。在 AI 生成音乐领域,类似的工具也不少,比如国内有网易的网易天音、腾讯的 TME Studio,以及灵动音科技(创始团队来自清华大学)的 BGM 猫等。国外更不用说,比如谷歌的 Magenta Studio,以及号称不会复制任何歌曲、生成独一无二曲子的 Soundful 等。但这些都没有引起大范围关注,直到 Suno 的出现。
此刻,圈外用户用 Suno 创作各种搞笑歌曲,过了一把音乐人的瘾,圈内从业者也将自己写的词放上去,试图一探自己和 AI 作曲的高低,结果被高完成度震惊。很多人觉得,Suno 带来的震撼可以与上一次引发影视圈热议的 Sora 相提并论。
随着 Suno 的火热,其幕后团队的相关信息也出现在公众视野,这家坐落于麻省剑桥的公司,目前共有 12 名员工,四位创始人曾来自同一家公司,为机器学习专家,其中有两位还是音乐爱好者。
与市场上众多 AI 音乐生成类工具相比,Suno 究竟强在哪?它会颠覆音乐圈吗?
“傻瓜式”操作,一分钟生成两首歌
业余音乐爱好者科科在社交平台上偶然刷到了 Suno 的相关内容,其能让小白用户在一分钟内完成歌曲创作的强大功能,让他忍不住尝试了一把。
在随机输入了一串没有任何逻辑性的数字加字母后,不到半分钟,科科便拿到了曲子。“这么拗口的歌词配上旋律居然十分流畅”,他感到十分意外。
其一键成曲的低门槛让网友们玩嗨了。有人让 Suno 一本正经地唱菜谱,还有人将自己打工的心酸经历输进去,生成歌曲发到网上。不少网友表示,自己被 Suno 创作的曲子笑到肚子疼。
图源 / Suno 官网
Suno 为什么火了?它究竟强在哪?
首先得益于它的低门槛,让普通用户找到了自己写歌的快乐。
很多网友表示,自己被 Suno 的“省事”所吸引。用 Suno 创作一首歌,只需简单四步。登录官网注册、点击 AI 创作、输入文字、点击创作按钮,便可拿到两首歌词相同但旋律不同的歌曲。
从打开软件到生成歌曲,全程不到一分钟。如果用户不会作词或者懒得作词,也有解决办法,用户只用选择希望的曲风,它就能自动生成。
Suno 还十分智能,比如它支持歌曲进一步优化。
如果用户觉得生成的某一首歌不错,但还想再精进一步,只需要点击“生成类似“选项,类似于妙鸭相机的“我想更像我一点”按钮,几秒钟后便又可得到一首作品。
此前 Suno 支持用户每天免费使用 5 次,也就是生成十首歌,但不允许商用。不过目前,根据官网显示,用户首次注册可获得 20 积分,且第二天不会再赠,而每次生成一首,会消耗 5 个积分,也就是只能免费玩 2 次。如果想多玩几次或者商用,也有办法,交钱即可。
选择界面上的会员充值按钮,有 68 元-498 元不等的 4 种套餐可选,价格越高,获得的创作次数越多。比如 68 元对应的是 136 首歌曲,498 元则是 1328 首。官网标注,这些歌曲可被商用。
普通用户惊讶于 Suno 的一键生成速度和操作的低门槛,而部分圈内人士更关注其专业度,甚至产生了危机感。
音乐制作人樊宇镈用了好几个“非常”形容自己的惊讶程度。他告诉「定焦」,如果之前的 AI 音乐类工具是小学生水平,那 Suno 至少是上初中了。
在 Suno 之前,他尝试过用很多 AI 工具写歌,但效果一般。用他的话说,费半天劲训练 AI,结果生成的更多是伴奏模型,或者是聚焦某一环节,比如辅助作词、自动编曲、生成人声、制作专辑封面等。整体计算下来,自己用 AI 时投入的时间和精力,和不使用差不了太多。
但这次 Suno 已经能做到自动生成歌词+选择谱曲风格+人声演唱,“发展到可以自动写 solo 的程度了。”而且他还发现,其创作的曲子还有和声,“不少初级音乐制作人都做不到这种程度,秒杀了那些在淘宝定价 800 元一首的初级编曲。”
和「定焦」的交流过程中,多位专业人士认为,Suno 生成的歌曲有的能达到商用程度,即在不涉及版权风险的情况下,直接对外出售。
爱梦科技 CEO 雷鸣把一位新生代歌手的词放到 Suno 里一键成曲,听完后他觉得,AI 创作的歌曲反而更接近行业标准。“做出来的歌质量很高,有的甚至能达到唱片级别。”
音乐从业者小杰也告诉「定焦」,自己和身边的音乐人朋友都在感慨 Suno 的强大,“本就吃不饱饭音乐圈又迎来了一波雪上加霜。”
Suno 虽好,但不必神化
虽然 AI 生成类的音乐工具不少,但一些圈内人士觉得,之前的工具在曲作质量上存在明显问题,操作也不够便捷,所以更多是“狼来了”的故事,直到 Suno V3 版本出现,大幅刷新了他们的认知。
有着十年大厂编程经验,同时也密切关注 AI 的佐罗告诉「定焦」,他觉得 Suno 带来的影响可能和 Sora 差不多,是音乐、影视领域创作的一次重大突破,而且其已经处在公开免费使用阶段。
据了解,Suno 背后主要由自研的两个大模型支撑,分别是基于 transformer 的 Bark 语音模型和 Chirp 音乐模型,前者主要用来生成人声,后者提供音乐旋律和音效。两者让 Suno 生成的音乐旋律更智能化、复杂化,这也是这家公司的核心技术。
不过,Suno 也不完美,它在时长、语言理解力,以及音乐分轨等方面都有问题。
首先,目前 Suno 生成的曲子都不到两分钟,无论是普通用户还是专业音乐制作人,都明显感觉到很多作品经常戛然而止,这直接影响了听觉效果。
其次,虽然 Suno 支持多国语言创作,但其最了解的还是英文,在理解中文歌词及音乐风格上,存在明显偏差。
樊宇镈频繁使用过十几次后发现,在生成电子、R&B、摇滚等音乐风格时,Suno 能处理得很好,但华语流行风格不太行。「定焦」在尝试用 Suno 创作时,风格上选择“民谣”,其创作出来的两首曲风都更像二次元。
他还遇到过主副歌不分的情况,将自己创作的中文歌词输入进去,并将主副词做了明显标注区分,但 Suno 依然把副歌的最后一句唱到了主歌上。
此外,Suno 创作出的作品不支持调整分轨,专业人士没有办法对生成的歌曲进行调整,这也是目前困扰 Suno 商业化的最大难点。
雷鸣表示,虽然目前 Suno 生成的音乐能轻松达到广告配乐、影视配音标准,但如果客户听完一遍后,还想修改一些细节,Suno 就办不到了,只能再次随机生成另一首曲子。
樊宇镈觉得,在这一点上,网易的 AI 音乐工具——网易天音就比较友好,支持导出音轨。不过,相比 Suno,网易天音生成的曲子还比较初级,且需要音乐人认证。
图源 / 网易天音官网
AI 研究者 Cyrus 则提出,目前 AI 生成音乐音频清晰度不够高,这也让其很难改编。即便 Suno 能导出来,曲子的高频和低频都会损失比较严重,还会伴有杂音、噪音等。所以目前 Suno 更多的是用来娱乐。
在 Cyrus 看来,文生图和视频的核心在于如何更完美地模拟物理世界,而音乐最重要的是,如何还原人的情绪。但 Suno 的歌曲旋律较为单一,使用的乐器也不够丰富,且生成的音乐时长还不够,这些都阻碍了情感传递。
想要解决这些问题,需要数据、时间和一定的技术突破。
人工智能在读博士、做过相关大模型研究的牛小博从技术端解释,目前 Suno 的底层技术还是大模型用到的 diffusion、transformer 的底层架构,但在多模态上有所突破,比如文字(含歌词)、声音(人声、曲子)、图像(能生成封面,但很简单)的多模态。而其生成的歌曲只有不到两分钟,很有可能是算力不够。
一位业内人士也告诉「定焦」,“目前 AI 生成音乐的一大技术难点是,大模型难以在学习复杂音乐乐理的同时,理解、模拟词曲情感,如果还要复制市面上特定风格、某一歌手的表达方式,那会更加复杂,这需要大量数据和算力。”
Cyrus 觉得,Suno 有所突破,但在技术层面并非革命性的创新。“Suno 代表的 AI 生成音乐,可控度和复杂度远不及文生图,还有较长的一段路要走。”牛小博表示。
Suno 会抢谁的饭碗?
目前,Suno 以及 AI 生成音乐工具被热议,不过普及速度似乎不如想象中那么快。
「定焦」询问了几家国内音乐厂牌,以及大众熟知的歌手团队,大多数人表示,这类工具不会影响到他们的日常创作,甚至还有一部分人没有听说过 Suno。
这主要有两方面原因。
一是音乐人或者公司使用 AI 的主要目的是提高效率,但之前从业者需要反复调教 AI,才能达到使用效果,调教 AI 的时间和其单独创作所花费的时间差不多。而且,当音乐人自身灵感爆发时,速度往往更快。
更主要的原因是,目前 AI 生成的音乐还满足不了用户/客户想要个性化歌曲的需求。即便是已经很强大的 Suno,虽然歌曲质量在线,但缺乏有创造力的点。
归根究底,目前AI 生产出的还是工业化产品。
牛小博表示,目前这类工具最大的难点是获取优质数据和相关版权。版权问题主要靠平台的努力,优质数据则考验运营能力。如果越来越多优秀音乐人能在 Suno 平台上持续产出高质量的音乐数据,AI 便有可能产出更多高质量、有灵魂的歌曲。
不过,Suno 所代表的 AI 生成类音乐工具,其更新迭代速度,已经让很多从业者感到恐慌。
去年 4 月推出文本转音频模型 Bark,7 月在音频生成模型上增加人声音乐,12 月用户可以在网页上使用,再到如今推出 Suno V3 版本,这家成立不到两年的公司,在不到一年时间内,实现了 AI 音乐专家口中需要数年才能完成的突破。
有网友将 Suno 升级的三个版本对比发现,其修复自身 BUG 的速度也非常快。输入相同一段歌词,V1 版本还将古风爆改成流行,V2 就变成了很明显的古风,比如在开头加入古筝弹奏,而 V3 的人声和旋律一体化程度非常高。如果将来 Suno 再迭代,加上大量数据训练,取代一些工作岗位不是不可能。
图源 / Suno 官网
而短期来看,它将很快会对两类人产生影响。
一类是普通用户。Suno 联合创始人 Shulman 曾表示,他们的目的是,降低用户创作音乐的门槛,让每个普通用户都能成为创作者,Suno 并不是想取代艺术家。而从目前的用户反馈来看,这一工具已经让很多音乐小白体验到了不懂乐理就能写一首歌的快乐。
另一类便是批量写歌的公司。
在交流中,大家都认同,Suno 无法取代乐队这种需要团队合作的音乐种类,也不会影响知名音乐人的饭碗。“不过将替代掉 95% 以上没有那么厉害的从业者,”雷鸣表示,那些不追求独特性,喜欢批量写歌的公司和一些把音乐当伴奏的领域,将迅速被 AI 取代,比如广告配乐、环境音乐、影视配音,甚至一些同质化的网络歌手和短视频神曲。
Cyrus 也觉得 Suno 对编曲、混音要求不高,特别是市面上那种几百块一首的口水歌打击很大。而对熟手来说,比如作曲、作词、编曲混音从业者,可能会带来利好,毕竟这些工作可以一个人完成了。
据了解,国外已经有公司收到了 AI 批量作曲的需求,且专业人士也将 AI 应用到了《芭比》和《奥本海默》等影视音乐中。国内目前还没有将 AI 音乐大规模投入到商用中的情况,不过从业者已经开始尝试。
需要注意的是,除了技术,AI 所带来的版权问题,也是影响 Suno 以及 AI 作曲未来发展的一道门槛。
“音乐圈抵制 AI 作曲”、“部分歌手被怀疑借助 AI 作曲引发网友不满”、“音乐公司要求 AI 使用自家歌手声音时得到授权”……自从 AI 作曲出现后,这些声音就没有断过。
佐罗从另一方面分析,Suno 也会给行业带来一些良性影响。“像影视剧、短视频等的 BGM 就不会有太多版权纠纷了,毕竟每位用户都可以用 AI 生成符合特定场景的音乐。”
现在,Suno 公司已经宣布 Suno V4 正在开发中,并会推出一些令人兴奋的新功能。到时,AI 和人类又将开启新一轮的较量了。
*题图来源于 Unsplash。