Tongyi DeepResearch：30B参数AI深度搜索新标杆-育师

Tongyi DeepResearch：30B参数AI深度搜索新标杆

【免费下载链接】Tongyi-DeepResearch-30B-A3B项目地址: https://ai.gitcode.com/hf_mirrors/Alibaba-NLP/Tongyi-DeepResearch-30B-A3B

导语：阿里巴巴通义实验室推出300亿参数的Tongyi DeepResearch大模型，以仅30亿激活参数实现深度信息检索突破，刷新多项智能搜索基准测试纪录。

行业现状：智能搜索进入"深度推理"新阶段

随着大语言模型技术的快速迭代，AI搜索正从简单信息匹配向复杂问题解决演进。当前市场对能够处理多步骤推理、长周期信息收集的智能系统需求激增，尤其在学术研究、市场分析和技术调研等专业领域。据行业报告显示，具备自主决策能力的Agentic AI系统市场规模预计2025年将突破百亿美元，成为企业智能化转型的核心基础设施。

模型亮点：四大创新重塑AI搜索能力

Tongyi DeepResearch作为专为"长周期深度信息检索"任务设计的智能体模型，核心优势体现在四个维度：

全自动化合成数据生成管道构建了从数据采集到标注的端到端流程，为模型训练提供了高质量、大规模的智能体交互数据，解决了传统Agent训练数据稀缺的行业痛点。这一管道支持持续迭代优化，确保模型能力不断进化。

智能体数据持续预训练策略使模型能够在保持知识新鲜度的同时，强化推理能力。通过摄入多样化的智能体交互数据，模型建立了独特的"搜索-推理-决策"认知框架，显著提升了处理复杂问题的能力。

端到端强化学习框架采用创新的Group Relative Policy Optimization算法，结合token级策略梯度和留一法优势估计，有效解决了非平稳环境下的训练稳定性问题。这种严格的on-policy强化学习方法，使模型决策质量和执行效率得到双重提升。

双推理范式兼容设计满足了不同场景需求：ReAct范式确保模型核心能力的可靠评估，而基于IterResearch的"Heavy"模式则通过测试时扩展策略，释放模型最大性能潜力，实现了研究深度与效率的平衡。

行业影响：重新定义AI辅助研究范式

该模型在Humanity's Last Exam、BrowserComp、WebWalkerQA等多个权威智能体搜索基准测试中均取得当前最佳性能，标志着我国在智能搜索领域达到新高度。其300亿总参数与30亿激活参数的创新设计，在保证性能的同时显著降低了计算资源消耗，为大模型的高效部署提供了新思路。

对于科研机构和企业研发团队而言，Tongyi DeepResearch有望成为学术探索和技术创新的"AI研究助手"，通过自动化文献调研、多源信息整合和深度问题分析，大幅提升研究效率。在商业应用中，该模型可赋能市场情报分析、竞争格局研判和技术趋势预测等场景，帮助企业快速把握市场机遇。

结论：迈向自主智能体新纪元

Tongyi DeepResearch的推出，不仅展示了我国在大模型领域的技术实力，更推动AI从被动响应向主动探索跨越。随着模型的开源和进一步优化，预计将催生一批基于智能体的创新应用，加速各行业的智能化转型。未来，具备深度搜索和推理能力的AI系统，有望成为连接人类知识与创新的重要桥梁，开启人机协作的新篇章。

【免费下载链接】Tongyi-DeepResearch-30B-A3B项目地址: https://ai.gitcode.com/hf_mirrors/Alibaba-NLP/Tongyi-DeepResearch-30B-A3B

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

腾讯混元0.5B：4位量化轻量化AI推理新工具

腾讯混元0.5B：4位量化轻量化AI推理新工具【免费下载链接】Hunyuan-0.5B-Instruct-AWQ-Int4 腾讯开源混元0.5B指令微调模型，专为高效部署设计，支持4位整数量化，显著降低计算资源需求。模型具备双思维推理模式，可灵活适…

李华

NextStep-1：14B大模型解锁高保真AI图像编辑

NextStep-1：14B大模型解锁高保真AI图像编辑【免费下载链接】NextStep-1-Large-Edit 项目地址: https://ai.gitcode.com/StepFun/NextStep-1-Large-Edit 导语：StepFun AI推出140亿参数的NextStep-1大模型，通过创新的自回归连续令牌技…

李华

腾讯Hunyuan-7B开源：256K超长上下文+智能推理新突破

腾讯Hunyuan-7B开源：256K超长上下文智能推理新突破【免费下载链接】Hunyuan-7B-Instruct-AWQ-Int4 腾讯开源Hunyuan-7B-Instruct-AWQ-Int4大语言模型，支持快慢思维推理，原生256K超长上下文，优化Agent任务性能。采用GQA和量化技术…