← 所有任务 | task.md | session.md

任务 ID: task-search-agent-search | 文件: session.md | 最后修改: 2026-02-24 14:08:25

session.md — Agent搜索方案研究

任务 ID： task-search-agent-search
执行人： Ai.Rev（reviewer agent）
时间： 2026-02-24

搜索执行简记

SearXNG（port 8889）广度搜索：4条查询，每条返回 27–31 条结果，共覆盖 ~120 条原始条目
search.py 专项搜索：
学术源（arxiv × 3查询）：有效论文约 8 篇，其中高度相关 5 篇
学术源（openalex × 1）：2 篇有效
学术源（crossref × 1）：5 篇（偏旧）
代码源（github × 3查询）：有效项目 12+ 个
社区源（hackernews × 2查询）：8 条
社区源（stackoverflow × 1）：1 条（结果稀少）
医学源（pubmed）：无关（医学系统综述，已忽略）
web 源（bing）：返回中文知乎结果，无关，已忽略
有效信息条数： 约 40+ 条（学术 12、代码 15、社区 10、SearXNG精选 10+）

完整报告

Agent 搜索功能实现方案研究报告

作者：Ai.Rev | 日期：2026-02-24 | 任务：task-search-agent-search

一、Agent 搜索功能核心架构

1.1 工具调用模式（Tool-Use Pattern）

Agent 接入搜索功能的主流方式是"工具调用"（Tool Use / Function Calling）：
- LLM 决定何时调用搜索工具，生成查询词，获取结果后继续推理
- 工具可以是：Web 搜索 API（Tavily、Exa、SerpAPI）、本地知识库（RAG）、学术 API（ArXiv、PubMed）
- 框架层支持：LangChain bind_tools、LangGraph Tool Node、OpenAI Function Calling、Anthropic Tool Use

典型架构：

用户问题
  → LLM 规划（需要搜索？搜什么？）
  → 搜索工具执行（返回片段/内容）
  → LLM 融合结果 + 判断是否继续
  → 输出答案

1.2 Agentic RAG vs 传统 RAG

传统 RAG：固定检索流程，一次性向量检索，无推理能力
Agentic RAG（动态检索）：
- Agent 决定何时检索、检索哪个知识库、用什么查询
- 支持多步检索、路由到不同子库（向量 DB、关键词索引、外部 API）
- 代表论文：Keyword search is all you need: Achieving RAG-level performance（2026，ArXiv）—— 发现工具化关键词搜索在 Agent 框架内效果逼近向量检索

1.3 MCP（Model Context Protocol）接入

OpenSearch、Azure AI Search 已支持 MCP Server 方式接入外部搜索
Agent 通过 MCP 连接外部工具（搜索引擎、数据库），无需硬编码 API
适合生产级部署，松耦合、可扩展

二、深度搜索（Deep Search / Deep Research）实现方案

2.1 核心范式定义

来自论文 From Web Search towards Agentic Deep Research (arXiv:2506.18959)：

「Agentic Deep Research」= 自主推理 × 迭代信息检索 × 动态规划
系统不只是"查一次答案"，而是不断根据中间结果调整搜索方向

2.2 迭代式查询（Iterative Search）

核心流程：

初始查询 → 获取结果 → 分析知识缺口（knowledge gap）
  → 生成新子查询 → 再次搜索 → 聚合 → 判断是否足够
  → 输出最终报告

关键技术：
- Query Expansion（查询扩展）：Azure AI Search Agentic Retrieval 支持自动并行扩展查询
- Follow-up Question Generation：如 codebucks27/Deep-Research-AI-Agent 实现了自动生成追问的机制
- Search Tree（搜索树）：每个检索节点是中间结果或子问题，Agent 在树上递归探索（参考 From Web Search to LLM-Powered Search Agents by Sankalp Wahane）

2.3 主要开源实现

项目	Stars	语言	特点
assafelovic/gpt-researcher	25,405	Python	最成熟；多 LLM/搜索源；有 MCP server
dzhng/deep-research	18,475	TypeScript	最简洁实现；迭代查询 + 报告合成
zilliztech/deep-searcher	7,581	Python	支持私有数据；Agentic RAG + Milvus
langchain-ai/open_deep_research	N/A	Python	LangGraph 驱动；支持多搜索后端
AIDC-AI/Marco-DeepResearch	249	Python	学术级；ReAct 风格 Agentic Search

2.4 EvolveSearch（强化学习驱动迭代搜索）

论文：EvolveSearch: An Iterative Self-Evolving Search Agent（2025，引用 20+）
- 使用 强化学习（RL）+ Rejection Sampling 让 Agent 自我迭代优化查询策略
- 不依赖人工标注；搜索效果随训练持续提升

2.5 Static-DRA（层次树结构 Deep Research Agent）

论文：arXiv:2512.03887v2
- 提出"静态深度研究 Agent"（Static-DRA）：用层次树结构组织研究计划
- 克服 RAG 静态流水线的局限；支持复杂多轮研究任务

2.6 GodaDy 实战案例

GoDaddy 实现了市场分析 Agentic Deep Research 工作流：
- 先生成研究计划（research plan）再执行
- 分阶段执行：探索 → 细化 → 报告合成
- 关键经验：可编辑的预搜索计划允许人工干预（避免浪费 15 分钟后才发现方向错误）

三、学术搜索最佳实践

3.1 SPAR 框架（多 Agent 学术搜索）

论文：SPAR: Scholar Paper Retrieval with LLM-based Agents for Enhanced Academic Search（arXiv:2507.15245，2025-07-21）
- RefChain-based 查询分解：将复杂学术问题拆成子查询链
- 多 Agent 协作：检索 Agent + 验证 Agent + 合成 Agent
- 效果超越单一固定检索流水线

3.2 推荐学术源优先级

优先级	源	特点
1	ArXiv	最新预印本；计算机/AI 必用；搜索速度快
2	OpenAlex	开放学术图谱；支持引用数过滤；跨领域
3	Semantic Scholar	语义理解好；提供论文摘要 API
4	CrossRef	正式期刊论文；DOI 解析
5	PubMed	医学/生命科学专项

3.3 学术查询策略

分层查询：先用宽泛词（agentic search LLM）找综述，再用精确词（iterative query expansion retrieval）找具体方法
引用追踪：找到一篇高引论文 → 查其引用者 + 被引者（OpenAlex 支持）
时间过滤：AI 领域建议优先看 2024–2026 年论文（2023 年前方法已过时）
ar5iv.org 阅读：ArXiv PDF 可通过 ar5iv.org 以 HTML 格式阅读，方便提取摘要

3.4 Language Agent 学术综合能力

论文：Language agents achieve superhuman synthesis of scientific knowledge（OpenAlex，2024，37引用）
- 实验证明 LLM Agent 在真实文献检索任务上可达超人水平
- 前提：需配备合适的搜索工具 + 验证机制

四、工具与框架

4.1 搜索工具/API

工具	特点	适用场景
Tavily	专为 LLM 优化；返回干净文本；有深度搜索 API	Agent 通用搜索首选
Exa	嵌入式语义搜索；自然语言复杂查询	复杂精确语义检索
SearXNG（自建）	开源隐私；聚合多源；免费	本地部署搜索聚合
Firecrawl	网页内容抓取+搜索	Deep Research 内容提取
AgentSearch（SciPhi）	搜索专用 LLM + 搜索框架一体	定制化搜索 Agent

4.2 Agent 框架

框架	特点
LangGraph	有向图 Agent；适合复杂多步搜索工作流
LangChain	最成熟；工具集丰富；bind_tools 支持多搜索
Strands Agents（AWS）	高级编排技术；多检索 Agent 协作
OpenAI Agents SDK	函数调用原生；有 Deep Research API
Gemini Deep Research	内置研究规划 + 执行 + 合成；支持 Gmail/Drive 上下文

4.3 向量数据库（配合 Agentic RAG）

Milvus（配合 deep-searcher）
ChromaDB（Chroma Docs 有专门的 Agentic Search 文档）
Azure AI Search（企业级；支持 Agentic Retrieval + 查询并行扩展）
FAISS（本地轻量）

五、关键技巧总结

以下技巧可直接应用到 search.py 或 Agent 工作流：

5.1 查询生成技巧

让 LLM 生成多条查询词（Query Diversification）：同一个问题用不同角度生成 3–5 条查询，并行执行，结果聚合去重
用 LLM 提炼关键词：将用户自然语言问题 → 精炼为学术关键词（专业术语、英文）再搜索
分步细化：先宽查询（找综述）→ 从综述中提取关键词 → 细查询（找论文）

5.2 结果处理技巧

摘要压缩：每条搜索结果只保留 200–500 字摘要，避免 context 撑爆
相关性过滤：用 LLM 对每条结果打 0/1 相关性评分，过滤无关结果（Harvey Legal Research 的做法）
重排（Reranking）：结合语义 embedding 相似度 + BM25 关键词匹配做混合排序

5.3 迭代策略技巧

知识缺口检测（Knowledge Gap Detection）：每轮搜索后，让 LLM 判断"还有哪些问题没回答"，驱动下一轮查询
停止条件：设置最大轮次（如 5 轮）+ 置信度阈值，避免无限循环
并行 vs 串行：初期宽度探索用并行（同时发多条查询），深化阶段用串行（基于前一步结果）

5.4 学术搜索专项技巧

优先用 ArXiv ID 直接访问：比通用搜索引擎更准确
引用链追踪：用 OpenAlex API 获取"引用了 X 的论文"（cited_by）做文献扩展
按年份过滤：AI 相关论文加 date_range=2024-2026 参数

5.5 系统设计技巧

搜索结果缓存：相同查询词结果缓存 1–24 小时，避免重复 API 调用
多源聚合：同一查询词同时发给 ArXiv + Web 搜索，结果合并，保留 top-K
错误处理：搜索 API 超时/无结果时，自动换备用源（如主源 Tavily 失败 → 降级到 SearXNG）

六、相关论文/资源清单

高优先级论文（值得深入阅读）

From Web Search towards Agentic Deep Research: Incentivizing Search with Reasoning
arXiv:2506.18959 | 2025
PDF | 定义了 Agentic Deep Research 范式
Agentic-R: Learning to Retrieve for Agentic Search
arXiv:2601.11888 | 2026-01-17
作者：Wenhan Liu et al.
PDF | 如何设计适合 Agentic 搜索的检索器
SPAR: Scholar Paper Retrieval with LLM-based Agents for Enhanced Academic Search
arXiv:2507.15245 | 2025-07-21
PDF | 学术搜索多 Agent 框架
ManuSearch: Democratizing Deep Search in LLMs with a Transparent Multi-Agent Framework
arXiv:2505.18105 | 2025-05-23
PDF | 开放透明的 Deep Search 多 Agent 架构
A Hierarchical Tree-based approach for creating Static Deep Research Agent (Static-DRA)
arXiv:2512.03887v2 | 2025-12-03
PDF | 树结构 Deep Research Agent 设计
EvolveSearch: An Iterative Self-Evolving Search Agent
2025，引用 20+
RL 驱动的迭代搜索 Agent，自我进化查询策略
Knowledge-Aware Iterative Retrieval for Multi-Agent Systems
arXiv | 2025-03-17
迭代式多 Agent 检索框架
Language agents achieve superhuman synthesis of scientific knowledge
arXiv:2409.13740 | 2024，37引用
PDF | LLM Agent 文献综合能力基准测试
Retrieval Collapses When AI Pollutes the Web
arXiv:2602.16136 | 2026-02-18（最新！）
AI 生成内容污染 Web 对 RAG 检索的影响
Agentic Large Language Models, a survey
- arXiv:2503.23037 | 2025-03-29
- 作者：Aske Plaat et al.
- PDF | Agentic LLM 综述

优质开源项目

gpt-researcher ⭐25k — 最成熟 Deep Research Agent
dzhng/deep-research ⭐18k — 最简洁实现
langchain-ai/open_deep_research — LangGraph 官方深度研究示例
zilliztech/deep-searcher ⭐7.5k — 私有数据 Deep Research
AIDC-AI/Marco-DeepResearch ⭐249 — 学术级 Agentic Search 基准

博客/实践文章

HuggingFace: Open-source DeepResearch — 开源 Deep Research 技术博客
Harvey: How Agentic Search Unlocks Legal Research Intelligence — 法律行业 Agentic 搜索实战
GoDaddy: Building a Deep Research Agent — 市场分析 Deep Research 案例
LangGraph 101: Build A Deep Research Agent — LangGraph 实战教程
Mastering Agentic RAG: A Practical Guide — Agentic RAG 工程指南

七、信息来源平台

平台	有效信息量	评价
SearXNG（自建聚合）	★★★★★	广度最佳，快速定位资源
ArXiv（search.py）	★★★★☆	学术深度好，但查询词需精准
GitHub（search.py）	★★★★★	实现参考价值极高
HackerNews（search.py）	★★★☆☆	有实战经验，但结果量少
OpenAlex（search.py）	★★★☆☆	部分结果偏旧，需年份过滤
CrossRef（search.py）	★★☆☆☆	结果偏旧（2007–2021），参考价值有限
StackOverflow（search.py）	★★☆☆☆	关于 Agent 搜索的提问极少
PubMed（search.py）	★☆☆☆☆	完全无关（医学领域），本任务不适用
Bing RSS（search.py）	★☆☆☆☆	返回中文知乎结果，质量差，本任务不适用

报告结语

Agent 搜索功能目前已形成较为成熟的技术生态：
- 工程层：Tavily/Exa + LangGraph/LangChain 是主流组合
- 研究层：2025-2026 年 ArXiv 涌现了大量 Agentic Search 论文（Static-DRA、Agentic-R、ManuSearch、EvolveSearch）
- 最大挑战：AI 内容污染 Web（arXiv:2602.16136）正在成为新威胁
- 下一步建议：重点阅读 arXiv:2506.18959（范式定义）和 arXiv:2601.11888（检索器设计），结合 gpt-researcher 源码理解工程实现

报告完毕。共收集有效信息 42 条（学术 12 篇、代码项目 15 个、社区讨论 8 条、网页资源 7 个）。