首页 > AI教程资讯

做出1000万份高考志愿的夸克,决定公开他们的深度研究Agent秘方。

文章来源:万象ai发布时间:2025-07-17 16:48:56

高考志愿填报结束啦!敲锣打鼓ing

我长舒一口气。当然不是因为我要上大学,而是这段时间兼职了一把“志愿顾问”。

过去十天里,我帮亲戚、朋友、朋友的朋友、朋友的朋友的朋友......

生成了快四五十份报告,给夸克这几周生成的1000万份高考志愿报告贡献了

0.0005%

没想到我跟夸克的缘分未了啊,昨天还参加了夸克内部的技术分享,拿到了一些一手信息,马上写成文章给大家分享分享。

夸克能在那么短的时间,在高考这个场景成为国内规模最大的深度研究(Deep Research)应用,这也是深度研究 Agent 第一次在大规模场景中,完成了真正的落地闭环。

先用简单一段话,定义一下深度研究 Agent

「深度研究Agent」(Deep Research Agents)

由大语言模型(LLMs)驱动的 AI 代理,具备动态推理、自适应规划、多轮外部数据获取与工具调用能力,并能自动生成完整分析报告,用于完成复杂的信息研究任务。

具体来说,深度研究 Agent 以大语言模型为“脑”,通过网页浏览器或结构化 API 实时获取外部知识,并使用定制化工具箱或标准接口(如 MCP:模型上下文协议)调用分析工具。这种架构让智能体可以自主执行复杂的、端到端的研究流程,将推理过程与多模态资源(例如文字、图像、结构化数据等)无缝融合在一起。

举个栗子,我印象最深的一份高考报告是一个朋友的妹妹,

河北考生,物化生组合,560分,对药学感兴趣,家长预算有限,希望选个学费不高、就业不错的院校。

因为夸克的报告可以生成多次,所以我前后试了很多关键词:公办本科、药学专业、就业导向、经济型城市等等,

最后生成的志愿报告里,给出了合理的冲稳保结构,还特别标注了该校的学费标准、就业率,从院校选择逻辑,到专业排布建议,再到家长普遍关心的调剂风险、转专业政策、就业导向,都给出了合理甚至贴心的解释。

甚至附带了一句“该校所在城市有XX制药集团,与本专业联系紧密”。

我当时真的服了。

它是真的在思考:

什么是对这个考生真正重要的信息。

能做到这一步,夸克志愿报告 Agent 是基于高考志愿大模型,用了两个工具和一个工作流架构,我来一个个拆解!

当你给夸克提要求后,在规划阶段它就会先根据分数信息初始志愿表,明确考生的大概分数段水平,然后通过定向提问补充信息,像是个人偏好的城市之类的,

再根据输入规划策略,分成学校、专业、地域、未来就业、家庭背景、个人情况等维度,类似的方法也被隔壁 OpenAI 采用。

再具体一点说,就是在执行过程中,Agent通过多轮“工具调用+反思调整”的机制,来动态优化志愿方案。

比如,如果我们给出的信息中倾向“留在省内(广州、深圳优先)、 不考虑偏远地区”的意向时,模型会自动生成搜索指令:

优先推荐广州、深圳的高校,其次考虑广东省内其他城市院校,排除偏远地区选项;若优质选项受限,Agent还能主动反思扩展搜索范围,如增加广东周边发达城市,或在高层次高校(如985)上适度放开地域限制,为考生争取冲一冲的机会。

而且,夸克这个高考 Agent 具备处理复杂、甚至是自相矛盾的诉求的能力。比如说“数学成绩差,但想报考计算机”这种学科之间的矛盾,系统就会触发深度研究 Agent 流程,提示我这一选择可能存在的能力匹配问题。

这就很人性化了,就是它不是一味的只是去迁就的给出提问所匹配的答案,而是真的会认真思考问题,然后给出相当合理化的建议,

就像我们真的会去找的咨询师一样,ta不是完全顺着你的要求来的,而是知道什么是更好的,什么是不适合你的。

思考过程讲完了,那执行过程用到的两个工具:搜索工具和志愿填报工具。

单是搜索工具就收录了快9000个站点,20多亿网页,我们熟悉的阳光高考、就业信息网、学信网等等都包含进去了,

而且在中间流程还加了多重事实性校验,毕竟高考年年变,没有比这个更考验模型信息获取和整合能力更好的场景了。

刚好我最近看到了一份《DEEP RESEARCH AGENTS: A SYSTEMATIC EXAMINATION AND ROADMAP》的论文,

跟夸克这次做了一些对比,找到了更多更加真实的数据。首先就是深度研究智能体们都在用什么工具获取信息?

目前还是使用API检索为主(左),浏览器为辅(右)。

截止目前为止已经有36个深度研究Agent(实际上肯定不止)

这里面的主力模型就是 gpt 和 qwen 系列,主要就是集中在今年的5月份发布的,所以说夸克能在那么短时间做到千万报告输出真的很牛