文章来源:万象ai发布时间:2025-07-11 10:07:39
AIGC系列深度研究报告:《AIGC专题:中国AIGC文生图产业白皮书》
(报告出品方:中国 AIGC 产业联盟 x 无界 AI)
AIGC,即 Artificial Intelligence Generated Content,人工智能生成内容。它是 生成式 AI(Generative AI)技术所激发的新一轮内容创作者经济浪潮;让人人都 可以简易、便捷、低成本地借助 AI 的力量完成文本、图片、视频、音频等多媒体内 容的高效高质量生产;是对以短视频、自媒体等为代表的大规模 UGC(用户生成内容)经济的进一步范式升级,故称“AIGC”。AIGC 擅长制造和传播爆款内容,尤 以图片、视频等视觉形态最为突出。
AI“新西湖”全名为《新西湖繁盛全景图》,由人类画师与 AIGC 共同参与完成。主要用到三项主流的 AI 绘画技术:线稿上色(controlnet Lineart)、无限拓展(Outpainting)、建筑模型训练(Dreambooth & Lora)等。创作方将该作品的使用权无偿捐赠给杭州市贸易促进会、中国国际 动漫节执行委员会、杭州西湖风景名胜区管委会、杭州万事利丝绸文化股份有限公司、杭州灵伴科技有限公司(Rokid)等多家单位和企业以共创、推广 杭州文化,共享 AI 作品版权。
AI“古温州”,则以温州朔门古港遗址的资料为基础,以“千年商港,未来温州”为主题,借助 AI 工具为古港遗址勾勒出了一幅“东方威尼斯”繁华景象。2023 年 3 月 29 日,这幅图片刊登在温州日报,成为温州日报“商周刊·文博”板块元宇宙主题报道的靓丽一笔。
案例虽小,管中窥豹,可见一斑。从 2022 年至 2023 年,国内 AI 绘画产业正是从这样微小的案例开始了举世瞩目的产业应用浪潮,从最初的静态图片 走向复杂、交互式的 AIGC 产业应用场景。
2022 年春,国内掀起的 AI 艺术热潮源于海外 A 技术在图像生成领域的革命性进步,以 DiscoDiffusion、Stable Diffusion、Midjourney 等为头部代表的扩散模型(Diffusion Model)开始在数字艺术领域大放异彩!这一关键节点要早于随后大火的 ChatGPT 以及大模型(LLM)风口。因此可以认为,国内第一批全民级大规模参与 AIGC 活动的用户群来自 AI 绘(即文生图)领域。
故事始于 2022 年春天,Disco Diffusion 的开源打开了 AI 绘画的浪潮之门——
2022 年 4、5 月份:AI 绘画只擅长抽象之美或者色彩美学,以令人“眼花缭乱”的色彩涂抹构图向世人展 示出 AI 艺术的别样魅力。这段时期人们常用的工具是 Disco Diffusion 以及 Midjourney 初代版本。
2022 年 6、7、8 月份:AI 绘画开始集中突破绘画的逻辑性和质量,可以逐步写实、产出具有艺术性的作 品。这段时期以 Midjourney 为主要工具代表。
2022 年 9 月份:AI 绘画最重要开源力量 Stable Diffusion 成为社区大热门,且凭借成本低、高质量、高逻 辑性、更强的通用绘制能力以及快速生成等优势迅速占领市场,AI 绘画的艺术质量和逻辑能力开始进入“飞轮式”发展,且 Midjourney 也开始引入其开源技术。
2022 年 10、11 月份:AI 绘画的第一个现象级潮流“二次元模型”横空出世,以 NovelAI 等开源产品和力量为突出代表,进一步蔓延到整个 Stable Diffusion 社区,更多的开源模型和产品加入到这个队伍中,生态力量开始形成。二次元模型的高质量性和现实影响力也令世人展开了对 AI 绘画版权的争议。11 月份,国内 AI 绘画第一波大浪潮启动,抖音迅速推出的“抖音 AI 绘画(二次元)”流量成功辐射数以千万计网民,国内第一波千万级 AI 绘画用户群形成。 2022 年 12 月份:紧接着二次元浪潮,人们仿佛打开了“通往异次元的大门”,开始让三次元、2.5 次元照 进 AI 绘画,于是新一波浪潮“ AI 真人模型”形成。传统互联网上充斥着大量由 AI 生成的“美女”、“真 实场景”、“平行时空新闻”等新形态内容。与此同时,闭源力量 Midjourney 也几近 AI 绘画的艺术巅峰, 各行业的大量设计师与内容工作者群体开始用 Midjourney 生成极高质量且满足现实生产需求的 AI 图片。
2023 年至今:AI 绘画在极高质量、通用逻辑能力、细节完美度以及精准控制层面已经开始大范围“侵蚀”各行各业的生产与消费过程,各产业以及互联网都到处充斥着 AI 生成的内容。第一波 AI 大范围赋能产业的 共识正逐步形成。Stable Diffusion 生态力量和 Midjourney 产品力成为当下人们唯二选择。
我们在 2022 年曾预测,2023 年数以亿计的 AIGC 内容将充斥着整个互联网,绝大多数网民在刷抖音或者小红书时都会在 不知不觉中浏览到 AIGC 内容,占比可能达到 5~10%;以小红书平台为例,都会将疑似 AI 生成的内容打上“疑似包含 AI 创作信息,请注意甄别真实度”的标签以供用户警惕。一时间,泛娱乐场景成为 AI 文生图商业化的“第一阵地”。
面对 AI 绘画一年来指数级的进化速度,2023 年 AI 绘画正式开启“全面商用”时刻。从多样性的艺术维度冲击多样性的行业商业,在流量平台等虚拟内容经济的加持下,数以千万甚至上亿计的互联网用户群深受其影响。其中以“摄影模型”和“真人模型”等为代表的“真实世界模型”对现实世界的冲击最为显著,包含商业应用、泛娱乐消费甚至诸多负面影响。
一切都始于 CLIP 开源,CLIP 是一个通过自然语言监督有效地学习视觉概念的神经网络。通过使用 CLIP 可将文本和图像连接在一起。
CLIP(Contrastive Language–Image Pre-training)是文本和图像对照的预训练模型,数据集使用的是 LAION-400M,包含 4 亿组从互联网上收集的文本图像对。文本编码器 提取文本特征,图像编码器提取图像特征,两个放到一起对比相似度,从而让 AI“掌握”文本图像的匹配关系。
2022 年 8 月,AI 绘画最为重要的开源力量 Stable Diffusion 正式向全世 界开放其模型代码、训练数据集、生产内容的版权归属协议。完全自由的开源运动激起了全世界开发者、创业者、产业公司和普通爱好者的热忱, 在短短半个月时间内,SD 的谷歌搜索趋势彻底超越大名鼎鼎的 DALL·E,成为人们谈论 AI 绘画不可规避的话题。SD 的开源也令 AI 巨 头们倍感震惊。
2022 年,Stable Diffusion 的开源发布由两大公司实体驱动,分别是 Stability.Ai 和 RunwayML。二者共同促进了 SD 大版本的成功。
截止 2023 年 7 月份,Stability.Ai 已将 SD 开源版本迭代至 Stable Diffusion XL 1.0(SDXL 1.0)。
SD 所基于的开创性的“潜在空间”(Latent Space)技术将扩散模型 (Diffusion Model)再次推上新的台阶,是 AI 绘画走向大规模商用化的 关键一步(如 latent 空间让快速生成高分辨率图像成为可能,对比之下, 过往的 DALL-E2 和 Google Imagen 则是基于传统的 pixel 空间)。
仅依靠 SD 官方基础版本大模型并不足以产生五彩缤纷的 AI 绘画体验,它只是一 个基础的“通用底子”,需要更多开发者在其之上进行更多样化、更高质量的风格 化训练。便有了以模型广场、精准控制、训练框架为代表的开源模型生态的繁荣。 可以适配千行百业的垂直模型开始涌现,同时也造就了行业应用 AI 的场景涌现。
2023 年初,Stable Diffusion 生态重要控制组件 ControlNet 横空出世,给出了 一条完美解决 AI 绘画发展进程中“精准控制”难题的道路。
该开源技术使用了一种称为 “Conditional Generative Adversarial Networks”(条件生成对抗网络)的技术来生成图像,与传统的生成对抗网络 不同,ControlNet 允许用户对生成的图像进行精细的控制。
例如它将传统意义上的【设计】抽象分解为 AI 或者计算机视野下的【线/轮廓】、【深度】、【语义】、【姿势】 等众多基础原子操作。根据应用场景, 随心所欲地组合这些基本原子和元素, 实现绘制的整体可控性和对大千世界通 用场景的绘制。
腾讯 AI 实验室开源推出的 IP-Adapter 模型为 Controlnet 生态做出了突出贡献,可识别参考图的风格和内容,然后生成相似的作品,且可搭配其他控制器使用。
报告共计:48页
上一篇: OpenAI2024头号重磅!GPT Store上线,企业客户新品也跟着来了
周三,OpenAI推出了两款新的产品和服务:GPT Store和ChatGPT Team。先前由于人事的动荡,公司延后了这一功能的推出。 图片来源:OpenAI官网截图 ChatGPT Team是OpenAI企业产品的较小版本,适用于用户数量少于150
下一篇: AI生活节,打开AIGC品牌营销共荣新代际!一场充满创新和变革的营销活动
2023年,生成式AI热潮引发了全球的关注,人工智能的发展从“辨别式AI”走向了“生成式AI”。AIGC也成为创新营销的破圈抓手。百度作为国内人工智能领域的佼佼者,积极推动AI技术从科技创新到落地应用,通过生成式AI技术力
相关攻略 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
最新资讯 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
更新时间:2025-07-25
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
更新时间:2025-07-25
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
更新时间:2025-07-25
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
更新时间:2025-07-25
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
更新时间:2025-07-25
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
更新时间:2025-07-25
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
更新时间:2025-07-25
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
更新时间:2025-07-25
宁德时代领投,「银河通用」完成超10亿元新一轮融资
更新时间:2025-07-25
【译】万字长文解读:生成式AI的21个设计模式、示例及应用策略
更新时间:2025-07-25