文章来源:万象ai发布时间:2025-07-14 16:27:37
音乐如今早已成为大多数人日常生活的一部分,我们在听歌的时候,很少去想这首歌是如何完成的。今年,随着Suno的推出,音乐生成也走进了大众的视野,音乐产业“变天”也一度成为热议话题。
一首歌从创作到制作,再到最终发行,中间需要经历多道工序,是一个复杂的团队协作过程。AI生成音乐之所以能够引起广泛关注,正是因为AI将复杂的工序流程做了极大简化,每个用户只需要输入自己对音乐的需求,就可以在极短的时间内得到一首完整的歌曲。
这样跨越式的“进化”是如何产生的?在这样的颠覆下,音乐产业会有哪些变化?AI音乐会有哪些应用和进一步的发展?基于对AI音乐市场的调研和观察,智库在《AI音乐应用产业报告》中给出了系统性的回答。
核心观点包括:
音乐符号模型打开AI音乐生成的大门,音频模型找到AI落地音乐应用的方式音频路线成为研究热点,为应用爆发奠定技术基础生成式AI改变音乐产业,简化音乐制作流程,提供音乐创作新思路流媒体平台或成为AI音乐商业化中最确定的一方,传统的音乐工程在此轮变革中是受冲击最大的一方数据是技术迭代和商业化过程中最关键的一环,生成音乐中对情感表达的把控是产品迭代的关键具体细节我们逐一来看。
了解AI音乐,先从梳理AI音乐生成的基本流程开始。
第一步要进行数据收集,包括音频文件、MIDI序列、乐谱或其他音乐数据。接着,对收集到的音乐数据进行预处理,包括去噪、分割、标准化等。
在此基础上,去提取音乐数据里的特征,包括音高、音色、节奏、动态变化等,这些特征是理解音乐的关键。接下来要选择合适的深度学习模型处理数据。循环神经网络(RNNs)和长短期记忆网络(LSTMs)擅长处理序列数据,变换器模型(Transformers)在处理长序列和并行计算方面表现出色,而生成对抗网络(GANs)则用于生成新的数据样本。
进入训练阶段,模型通过不断调整内部参数来最小化预测误差。模型在训练数据上迭代多次后,逐渐学会识别和生成音乐的复杂模式。随着训练的进行,模型开始识别音乐中的重复模式和结构,如和弦、节奏、旋律动机等。
训练完成后,模型就可以用来生成新的音乐。目前一键生成完整的歌曲是音乐生成中最受关注的类型;此外,也有产品生成的是背景音乐、一段旋律等。
最后,还需要对生成的音乐进行评估和优化,其中涉及主观评估和客观指标,如音乐理论的一致性和听觉效果的愉悦度。根据评估结果,模型会进一调整和优化。
有了基本操作流程后,需要明确具体的技术路线。在音乐生成领域,目前有两种主流技术路线,音频生成和符号生成。
符号生成模型的研究早于音频生成模型,它的优势是生成的音乐具备可编辑性,符合专业音乐人的需求。而其缺点在于生成的音乐需要进行整合,才能形成一首完整的曲子,这个过程对于非专业音乐人来说有一定难度。此外,符号生成模型在最终的音乐效果上有明显的“AI感”,听上去比较机械。
2023年,谷歌和Meta相继推出自己的音频模型,将技术热点转向音频生成。今年3月Suno发布其V3版本产品后,产业界的目光也聚焦到音频生成模型上来。
音频生成模型,直接使用海量音频数据进行训练,使用深度神经网络和VAE或Transformer等方法,端到端直接生成音乐,并且能够输出一首完整的歌曲,生成的作品听上去也更加流畅。然而这个路线也有其局限性,音频生成对算力的需求庞大,每秒有超四万个数据点,想要更好的音质,需要极大的算力投入。其次,端到端生成也导致音乐的不可编辑性,无法对生成的音乐进行修改。
可以看出,两种技术路线都有各自的优势和局限。未来,两种技术路线将逐渐融合,形成互补。
在音乐产业链的各环节上,AI都有一定程度的渗入。
音乐产业的核心动力来自于创作部分,属于音乐从0到1的阶段;而音乐制作是音乐从1到100的过程,包含大量的音乐工程。音乐产业在进入工业化阶段后,音乐作品供过于求、创新力不足等问题逐渐突显。
AI音乐生成的出现,能一定程度上为音乐产业带来新的创作思路,让更多人加入到音乐创作当中。创意能够在诸如Suno等产品的帮助下,直接转化成音乐作品。
此外,AI对于音乐产业的一大变革在于音乐制作流程的极大简化。原先不同步骤的工序需要不同的人/团队来完成。AI出现后,一个人可以完成所有工序。其中,生成式AI更多运用在创作部分,在制作和发行流程中,也会加入其他AI技术。本报告主要聚焦于生成式AI对音乐产业中部分环节的变革。
在具体应用当中,AI在音乐制作中的应用已经相对成熟,在母带处理、混音等工程含量较高的环节已经得到很好的应用,如Landr通过AI进行母带处理并由此形成稳定的商业模式。然而,在音乐创作中,AI的应用处在早期阶段。Suno属于这个赛道上第一家出圈的公司。昆仑万维、网易天音等是中国市场中的领先者。
智库将AI创作分为一键生成、AI作曲和AI作词三类,并以此绘制了AI音乐产业图谱。
一键生成类产品是目前业内最火的应用方向,AI作曲和AI作词的产品要早于一键生成类产品,其中AI作曲产品主要面向专业音乐人,生成的音乐具备可编辑性,操作界面也更加专业。
一键生成类产品是面向广大音乐爱好者/听众,能够零基础创作的音乐生成工具。
今年3月,Suno发布V3模型。用户只需给出风格和主题词,几秒钟便可以生成一首两分钟的原创歌曲。一个月后,另一款有相似功能的产品Udio也正式推向市场。
「一键生成」成为了AI音乐市场最热的话题,中国市场中网易、昆仑万维、腾讯等公司也推出了音乐生成产品。生成式AI在音乐领域,开启了「人人皆可创作」的时代。
从产品表现上看,Suno最新发布的V3.5,已经能够完成4分钟的音乐创作,在歌曲的完整度和情感表现上,都较V3.0版本有所提升。
在中文歌曲的呈现上,Suno等海外产品在人声上会出现明显的瑕疵(如声音不够稳),而中国本土的音乐生成软件不论是对中文歌的旋律、节奏等的把控,还是对歌词的理解上,都有更好的表现力。也因此,本土产品在生成音乐的曲风上更加符合本土市场需求。
「一键生成」音乐产品的出现,在大众层面引起了使用热潮。Suno自推出首款产品以来,用户量已经超过1000万。对于专业人士来说,「一键生成」类产品还远未达到高阶音乐水平,AI的作用更多地体现在制作环节的提效和对音乐人的创意激发。
场景选择是AI音乐落地的关键。当前,影视和游戏是AI音乐产品落地的两大场景。
AI音乐在影视上的应用可大致分为两个方向:电影配乐和短剧音乐。
电影配乐既是观众情绪的助推器,也是电影剧情的“提示词”,这意味着AI想要达到影视配乐的标准,需要对电影从整体和细节上都准确把握。目前,生成式AI类产品尚无法做到这点。在电影配乐环节,生成式AI更多的是充当灵感激发和效率提升的作用,在创作环节还是由作曲家来把控。
而在短剧领域,对于音乐的要求更简单,更加注重音乐传播度,音乐首先服务于传播效果。因此,在音乐的选择上也偏向于有记忆点,旋律简单易于传唱的类型。生成式AI已经能够很好地完成这种类型的音乐创作。正因为这样的适配度,使得AI音乐率先落地在短剧领域。
在游戏领域,音乐、音效、语言是游戏声音设计中的三个基本元素。这份报告主要讨论生成式AI对游戏中音乐和音效的影响。
音效可简单分为单音轨音效和多音轨音效,前者在生成上难度最低。在音乐生成上,主要有角色定制曲和游戏主题曲两类,二者在音乐风格上有较大差异。游戏主题曲的商业价值和品牌影响力更高,其对音乐的要求更加严格,创作和制作过程也更加复杂,因此也是生成难度最高的。
明确了落地场景后,商业模式是音乐产业变化中的最后一环。
目前,AI生成音乐能够触达的是中低端音乐市场,也就是长尾部分。在这个市场中,平台模式是最合适的商业化手段。这个阶段,付费群体主要是C端用户。个人创作者通过音乐生成软件创作音乐,在网易云音乐、Spotify等平台发布并收取版费。
此外,生成式AI工具的出现,为音乐产业带来了新的生产工具,也因此为音乐产业带来变化。首先,音乐生成软件的出现,将创作者的范围进一步扩大。中低端音乐市场的竞争加剧,高端市场受到的冲击较小。其次,音乐生成软件极**利了创作者的创作流程,处在中间环节的工程化部分的成本得到大幅下降,这部分的工作也将减少。最后,音乐生成软件公司将会在软件的基础上,搭建音乐分享平台,以此来保持网站的访问量和使用量。
目前,音乐生成产品在情感理解和表达上相对简单,无法完成更高水准的音乐创作。一方面是当前的模型在情感的理解上有局限。未来,跨模态理解有望帮助AI模型更好地理解人类情感。
此外,AI音乐也将通过强社交属性打开音乐市场,获得更多受众。AI音乐+社交的组合带来“人人皆可创作”的效应,使其成为天然的社交高地。类比于短视频时代的视频创作,当创作门槛被拉低后,每个人都能够成为创作者和分享者。创作平台不仅承担了发布渠道的功能,也衍生出分享和社交的功能。
完整报告下载地址:
https://jkhbjkhb.feishu.cn/wiki/W5D7wuDcbiPXDLkaRLQcAJpOn8f?fromScene=spaceOverview
相关攻略 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
最新资讯 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
更新时间:2025-07-25
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
更新时间:2025-07-25
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
更新时间:2025-07-25
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
更新时间:2025-07-25
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
更新时间:2025-07-25
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
更新时间:2025-07-25
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
更新时间:2025-07-25
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
更新时间:2025-07-25
宁德时代领投,「银河通用」完成超10亿元新一轮融资
更新时间:2025-07-25
【译】万字长文解读:生成式AI的21个设计模式、示例及应用策略
更新时间:2025-07-25