文章来源:万象ai发布时间:2025-07-09 16:37:44
《科创板日报》12月14日讯(编辑 宋子乔) 多模态AI年末有多卷?谷歌用实际行动回答你。
12月6日,谷歌上线原生多模态大模型Gemini单挑GPT-4,随即其媲美Gen-2、比肩Pika的文生视频模型W.A.L.T面世。就在12月14日,谷歌又上线了文生图模型Imagen 2,该模型被称为DALL•E 3和和Midjourney的最强竞品。
在多模态这条路上,谷歌已全面出击。
据谷歌介绍,基于谷歌最先进的文本到图像扩散技术,Imagen 2不需要复杂、专业的提示词,可根据自然语言提示生成高质量、逼真、高分辨率、美观的图像;具备强大的图像理解能力,可进行视觉问答,即为图像创建详细的长文标注,并对图像内元素提出的问题给出详细答案;可理解复杂抽象的概念(如诗歌、文学作品),并将这些描写可视化。
效果如何?
一直以来,AI绘画的一个缺陷在于不会画“手”,而Imagen 2的数据集和模型进步,让其能够生成逼真的手部和脸部图像,且对光线的处理堪称完美。


在理解抽象的文学作品上,Imagen 2同样出色,精确表述出了藏于文字中的意境之美。



Imagen 2还有哪些亮点?
功能上,Imagen 2还支持图像编辑功能,如修复(inpainting)和扩图(outpainting)。


安全性上,Imagen 2集成了SynthID——用于加水印和识别 AI 生成内容的工具包,其生成的图片可添加不可见的数字水印;Imagen 2接受了数据安全训练,内嵌安全过滤器可防止生成潜在有害内容,如暴力、冒犯或**内容。
值得注意的是,Imagen 2目前并没有向所有人开放,仅供许可名单上的Vertex AI客户使用。Vertex AI是谷歌云上集成多种工具的托管式AI平台,可以理解为谷歌为客户提供的AI应用训练场。
这正体现了谷歌在AI业务上的战略——依托谷歌云打造AI生态,更多地面向开发者。在8月份的谷歌云Next大会上,谷歌云的CEO透露,自从今年年初Vertex AI支持生成式AI技术,Vertex AI用户数量同比增长了15倍以上。
相关攻略 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
最新资讯 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
更新时间:2025-07-25
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
更新时间:2025-07-25
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
更新时间:2025-07-25
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
更新时间:2025-07-25
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
更新时间:2025-07-25
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
更新时间:2025-07-25
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
更新时间:2025-07-25
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
更新时间:2025-07-25
宁德时代领投,「银河通用」完成超10亿元新一轮融资
更新时间:2025-07-25
【译】万字长文解读:生成式AI的21个设计模式、示例及应用策略
更新时间:2025-07-25