通义深搜(Tongyi DeepResearch)是阿里巴巴通义实验室推出的一个开源的智能体大语言模型(Agentic LLM),专为解决复杂、开放式的研究型问题而设计。
-
背景与问题: 在现实世界中,许多复杂问题无法通过单次搜索或简单问答得到解决,它们需要多步骤的推理、跨网页的信息整合和深度分析,即“长周期、深度信息探寻”任务。这正是人类研究员擅长但传统AI难以自动化的领域,也是通义深搜旨在攻克的痛点。
-
项目定位与核心价值: 通义深搜的定位是一个AI研究助理或自动化信息探寻智能体。其核心价值在于,能够模拟人类专家的研究过程,自主地理解复杂问题、规划探寻步骤、浏览网页、使用工具(如计算器、文件解析器)、整合并提炼信息,最终生成全面、深入的答案。它将繁琐的信息搜集与分析工作自动化,极大地提升了研究和决策效率。
-
工作原理与设计思想: 该项目的成功并非仅依赖于模型规模,更在于其创新的智能体训练范式。其设计思想是让模型学会“如何行动”以获取信息。这通过一套先进的端到端流程实现:
- 自动化合成数据流水线: 项目构建了一套全自动的数据生成系统,能够大规模地创造智能体与环境(如网页)交互的训练数据,为模型的预训练、微调和强化学习提供了坚实基础。
- 基于智能体数据的持续预训练: 模型在海量的智能体交互数据上进行持续学习,这使其不仅能保持知识的“新鲜度”,还能不断强化其规划和推理能力。
- 端到端强化学习: 采用定制的强化学习框架(Group Relative Policy Optimization),让模型在模拟环境中通过试错来优化其决策策略,使其在复杂的搜索任务中表现更稳定、更高效。
- 高效模型架构: 模型总参数量为305亿,但每个token仅激活33亿参数,这可能是一种高效的稀疏混合专家(MoE)架构,能在保证强大性能的同时,提升推理效率。
-
关键特性与优势:
- 卓越的深度研究能力: 在多个权威的智能体搜索基准测试(如Humanity's Last Exam, BrowserComp等)上取得了业界领先的性能。
- 先进的训练体系: 整合了数据合成、持续预训练和强化学习,形成了一套可扩展、全自动的智能体训练方案。
- 灵活的推理模式: 支持两种推理范式:标准的ReAct模式,用于评估模型核心能力;以及基于IterResearch的“重”模式,通过测试时扩展策略来释放模型的性能上限。
- 完全开源: 模型权重对社区开放,方便开发者在此基础上进行研究和构建应用。
-
实际应用场景:
- 学术研究: 自动进行文献综述、收集实验数据、总结前沿动态。
- 行业与市场分析: 深度调研竞争对手、追踪技术趋势、生成行业分析报告。
- 复杂问题解答: 为需要整合多个信息源才能回答的复杂问题提供详尽答案。
- 自动化报告生成: 根据一个主题,自动搜集资料并撰写研究报告、投资分析报告等。