文章来源:万象ai发布时间:2025-07-11 20:02:51
最近,一个名为DragGAN的AI 图片编辑工具爆火,它实现了点击鼠标、拖动关键点就能达到Photoshop的效果。对比之下,使用Photoshop等工具时候,需要具备相对专业的技能才能灵活,精确地控制单个对象的位置,形状,表达或排列。
简单的说,DragGAN使用户能够在图像上确定一个点,就能改变图片结构和整个像素。它与其他流行的生成AI图像工具(如Dall-E和Midjourney)有很大的区别,后者虽然能够通过文本提示生成特定的图片,但无法精确输出所需的姿势或布局。
据了解,DragGAN新模型由MIT、谷歌、马普所等机构联手打造,该项目相关论文已入选SIGGRAPH2023,研究人员展示了一种控制GAN进行图像处理的新方法。
简单拖拽就能实现图片编辑
只要处理的图片与GAN训练数据集的类别匹配,DragGAN就可以处理逼真的图像。这些类别包括动物、汽车、人、细胞和景观。
论文示例展示了在一个简单的界面中,用户可以将他们在图像中定义的点拖动到所需的位置,就是实现图片编辑。例如,让猫咪闭上眼睛,让狮子转头并张开它的嘴,或将汽车转换为另一种模型。
DragGAN 还提供了遮罩功能,允许用户突出显示他们希望更改的图像的特定部分,而其余部分保持不变。
该团队表示:”通过DragGAN,任何人都可以通过精确控制像素的位置来变形图像,从而操纵不同类别的姿势、形状、表情和布局。”
DragGAN 研究论文还强调了该工具的最大优势,界面的简单性和直观性。在几秒钟内,用户可以掌握功能,而无需弄清楚底层技术。
未来,如果将DragGAN 与AI图像生成工具搭配使用,用户将能够实现更接近他们心目中的图像的输出。
相关攻略 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
最新资讯 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
更新时间:2025-07-25
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
更新时间:2025-07-25
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
更新时间:2025-07-25
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
更新时间:2025-07-25
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
更新时间:2025-07-25
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
更新时间:2025-07-25
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
更新时间:2025-07-25
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
更新时间:2025-07-25
宁德时代领投,「银河通用」完成超10亿元新一轮融资
更新时间:2025-07-25
【译】万字长文解读:生成式AI的21个设计模式、示例及应用策略
更新时间:2025-07-25