文章来源:万象ai发布时间:2025-07-24 16:43:11
MyShell 自从进入 ShellAgent 的框架阶段,由于深度融合了 ComfyUI 生态,图像视频流的 Agent 迎来了井喷式的爆发。上个月据说上新了 150+个,竞争确实有点激烈了。但其实图像视频流的能力并不代表 ShellAgent 所能做的全部可能性,仍然有大量值得探索的场景等待创作者去尝试。
从年初到现在的这半年时间里,开发产品团队其实一直在默默地做着提升创作者体验和拓宽创作边界的工作。最明显的改进就是 ShellAgent 已经完成了云端版本和本地版本的统一,现在使用云端版本就能添加以前本地版本才能使用的图像流功能,同时团队还默默添加了不少实用易用的 Widget,让整个创作体验更加流畅。
这样的改进让我看到了新的可能性:将图像的绘制和处理能力作为 Agent 的某一个状态下的特定功能,既能发挥 ShellAgent 积累下来的丰富图像流玩法优势,又能借助 ShellAgent 状态机的灵活框架让 Agent 整体功能更加饱满和实用。这种组合有可能让我们创作出来的 Agent 从快消品转变为真正的刚需品。
回顾去年我做 ThumbMaker 等 AI 工具时的思路,当时采用的是"图像核心 + 大模型辅助"的模式。现在我觉得是时候在 ShellAgent 上尝试更加 Agentic 的思路了,也就是"大模型核心 + 图像辅助"的模式。
这种转变的核心在于:将某些细分场景中较高频的多步流程,依托大模型的智能在 Agent 中完成复刻和串联,并在需要视觉呈现的环节中使用图像流来提升结果的展示效果。这样既能充分发挥大模型的推理能力,又能在关键节点通过视觉元素增强用户体验。
基于这个思路,我开发了 Flowain,一个专门针对 Web3 领域的高效推文 AI 写手。这个项目的目标是尝试复刻一个热衷研究项目、高频发推的 Web3 领域同学的手动操作步骤,并借助 AI 将这个标准操作流程(SOP)的效率提升 10 倍以上。
从我对 Web3 推文创作流程的观察和理解来看,一个典型的创作过程大概是这样的:
快速了解一个 Web3 项目通常会从 Twitter 搜索开始。这是因为 Twitter 是 Web3 社区最活跃的信息交流平台,项目的最新动态、社区讨论、用户反馈等关键信息都会在第一时间出现在 Twitter 上。
根据经验对搜索到的推文进行置信度评估,这一步非常关键。需要判断信息来源的可靠性、内容的准确性以及讨论的热度。然后综合这些高置信度的推文内容,构思可以深入写作的主题方向。
选定主题后,创作者可能还会自己补充一些其他渠道收集到的素材,比如官方文档、白皮书摘要、技术分析报告等,然后开始按照自己的写作偏好和风格来撰写推文。
写完初稿后通常还需要一两轮的修改编辑,调整语言表达、优化逻辑结构,最后配上一张能够体现推文核心内容的插画或图表,就可以发布了。
在 ShellAgent 中,我按照上述流程搭建了相应的状态机:
这也体现了 ShellAgent 状态机框架强大却容易被忽视的特点:你在 PPT、画板或稿纸上设计的流程图,可以非常清晰直观地迁移到 Agent 中实现,真正做到所见即所得。这种可视化的流程设计大大降低了复杂逻辑的实现门槛。
虽然搭建基础流程相对较快,但优化细节却需要不断迭代。在这个过程中,非常感谢脚哥详细的测评反馈,他提出了很多我之前没有注意到的细节优化建议。
比如,为了尽可能提升搜索质量,我们将 Twitter Search 拆分成了三个独立的任务(希望 ShellAgent 未来能支持并行任务来减少整体耗时),同时允许 Search_event 这个子任务的搜索关键词支持用户自定义,这样用户可以根据自己的需求灵活调整搜索策略。
让我们来看看 Flowain 的具体表现:
相关攻略 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
最新资讯 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
更新时间:2025-07-25
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
更新时间:2025-07-25
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
更新时间:2025-07-25
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
更新时间:2025-07-25
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
更新时间:2025-07-25
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
更新时间:2025-07-25
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
更新时间:2025-07-25
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
更新时间:2025-07-25
宁德时代领投,「银河通用」完成超10亿元新一轮融资
更新时间:2025-07-25
【译】万字长文解读:生成式AI的21个设计模式、示例及应用策略
更新时间:2025-07-25