任务 ID: task-search-agent-search  |  文件: task.md  |  最后修改: 2026-02-24 14:04:32

Task task-search-agent-search — Agent 搜索功能实现方案研究

文件路径

原始需求

使用新搜索方案(SearXNG + search.py 学术/代码/社区专项搜索)研究:
1. AI Agent 实现搜索功能的方案和技巧
2. 深度搜索(Deep Search)的实现方法
3. 学术搜索的最佳实践

重点:技术性内容,优先使用学术源、代码源、英文社区源。


执行链

Ai.Rev(搜索 + 归纳)→ 爱衣质检


各 Agent 职责

Ai.Rev(session key: agent:reviewer:main

任务:按照以下搜索方案,搜集 Agent 搜索功能相关资料,归纳整理成结构化报告。


📋 搜索方案

第一步:SearXNG 广度搜索

SearXNG 端口:8889

# 方案与框架
curl -s "http://localhost:8889/search?q=AI+agent+search+tool+implementation&format=json"
curl -s "http://localhost:8889/search?q=deep+research+agent+web+search+technique&format=json"
curl -s "http://localhost:8889/search?q=agentic+search+RAG+academic+search+best+practice&format=json"
curl -s "http://localhost:8889/search?q=LLM+agent+search+strategy+iterative+query&format=json"

解析:

| python3 -c "
import json,sys
d=json.load(sys.stdin)
print(f'共 {len(d.get(\"results\",[]))} 条')
for r in d.get('results', [])[:15]:
    print(r.get('title','')[:80])
    print(' ', r.get('content','')[:120])
    print()
"

第二步:search.py 专项搜索(本任务重点使用学术+代码+社区源)

cd /root/.openclaw/workspace

# === 学术源(重点)===
# ArXiv - 最新论文
python3 scripts/search.py -c academic -e arxiv -q "agentic search deep research LLM" -n 8 -f json 2>/dev/null
python3 scripts/search.py -c academic -e arxiv -q "web search agent iterative retrieval" -n 8 -f json 2>/dev/null
python3 scripts/search.py -c academic -e arxiv -q "academic search agent scholarly retrieval" -n 5 -f json 2>/dev/null

# OpenAlex - 开放学术图谱
python3 scripts/search.py -c academic -e openalex -q "AI agent information retrieval search" -n 8 -f json 2>/dev/null

# CrossRef - 期刊论文
python3 scripts/search.py -c academic -e crossref -q "autonomous agent web search strategy" -n 5 -f json 2>/dev/null

# === 代码源(实现参考)===
# GitHub - 开源项目
python3 scripts/search.py -c code -e github -q "deep research agent search" -n 8 -f json 2>/dev/null
python3 scripts/search.py -c code -e github -q "LLM agent web search tool implementation" -n 8 -f json 2>/dev/null
python3 scripts/search.py -c code -e github -q "academic search agent arxiv pubmed" -n 5 -f json 2>/dev/null

# PyPI - Python 工具包
python3 scripts/search.py -c code -e pypi -q "agent search tool" -n 5 -f json 2>/dev/null

# === 社区源(实践经验)===
# HackerNews
python3 scripts/search.py -c community -e hackernews -q "deep research agent search" -n 8 -f json 2>/dev/null
python3 scripts/search.py -c community -e hackernews -q "AI agent web scraping search strategy" -n 5 -f json 2>/dev/null

# StackOverflow
python3 scripts/search.py -c community -e stackoverflow -q "LLM agent search tool implementation" -n 5 -f json 2>/dev/null

# === 通用网页源 ===
python3 scripts/search.py -c web -e bing -q "AI agent deep search implementation techniques 2024 2025" -n 8 -f json 2>/dev/null
python3 scripts/search.py -c web -e startpage -q "agentic search best practices deep research" -n 5 -f json 2>/dev/null

医学学术参考(了解领域专项搜索范式):

python3 scripts/search.py -c medical -e pubmed -q "systematic review search strategy agent" -n 5 -f json 2>/dev/null

目标:累计收集 30-40 条有效信息(学术论文标题+摘要 > GitHub项目 > 社区讨论)。


第三步:归纳报告格式

## 一、Agent 搜索功能核心架构
(搜索工具如何接入 Agent?常见模式?)

## 二、深度搜索(Deep Search)实现方案
(迭代式查询、多步骤规划、结果聚合等)

## 三、学术搜索最佳实践
(使用哪些学术源?查询策略?如何处理论文内容?)

## 四、工具与框架
(有哪些现成的开源项目/库?)

## 五、关键技巧总结
(可直接应用到 search.py 或 Agent 工作流的技巧)

## 六、相关论文/资源清单
(值得深入阅读的论文、博客、项目链接)

## 七、信息来源平台

开始时:
1. 发工作日志:
bash /root/.openclaw/workspace/scripts/log-to-channel.sh reviewer receive "Agent搜索方案研究" task-search-agent-search

完成后:
1. 将搜索过程简记 + 完整报告追加到 /root/.openclaw/workspace/tasks/task-search-agent-search/session.md
2. 发工作日志:
bash /root/.openclaw/workspace/scripts/log-to-channel.sh reviewer handoff "Agent搜索方案研究" main task-search-agent-search
3. sessions_send 通知爱衣(agent:main:main):
task_id=task-search-agent-search task=/root/.openclaw/workspace/tasks/task-search-agent-search/task.md


⚠️ 爱衣质检 SOP(收到最终通知后执行)

Step 1:评估工作区大小

du -sb /root/.openclaw/workspace/tasks/task-search-agent-search/

Step 2:读取 session.md

wc -l /root/.openclaw/workspace/tasks/task-search-agent-search/session.md

Step 3:质检要点

Step 4:输出结论

通过
1. 发工作日志:
bash /root/.openclaw/workspace/scripts/log-to-channel.sh main done "Agent搜索方案研究" task-search-agent-search
2. 用 message 工具发送给主人(telegram, 92763607),发送完整报告
⚠️ 必须调用 message 工具,不能只在主对话回复

不通过(rejectCount == 0)
1. 创建新 task.md(加后缀 -retry1),session.md 独立
2. 在原 session.md 末尾追加 rejectCount=1
3. sessions_send 给新执行链起始 Agent
4. 发工作日志:
bash /root/.openclaw/workspace/scripts/log-to-channel.sh main retry "Agent搜索方案研究" "<新执行链>" <起始role> 1 task-search-agent-search

rejectCount >= 1
1. 发工作日志:
bash /root/.openclaw/workspace/scripts/log-to-channel.sh main fail "Agent搜索方案研究" task-search-agent-search
2. message 主人,归纳失败原因,请主人裁决

超限处理(工作区 > 80KB)

  1. 仅读 task.md
  2. 读 session.md 末尾 200 行
  3. message 主人:任务已完成,工作区繁多(XXkB),建议人工审计,附简单归纳