/root/.openclaw/workspace/tasks/task-t038p4-ab69fb/task.md/root/.openclaw/workspace/tasks/task-t038p4-ab69fb/session.md运行已编写好的测试用例 /srv/projects/agent-reach/tests/test_searxng.py(282行,覆盖单元/集成/回归/CLI 共 ~30 个测试),输出完整测试报告。
测试文件已由爱衣编写完成,reviewer 只需执行和报告。
reviewer → 爱衣质检(单环节,无需 coder)
agent:reviewer:main)任务:执行测试并输出结构化报告。
pip install pytest --break-system-packages 2>/dev/null
cd /srv/projects/agent-reach
pytest tests/test_searxng.py -v --tb=short 2>&1
测试分为 4 组,分别统计通过/失败:
- Unit(TestSearXNGChannelUnit):8 个,不需要 SearXNG
- Integration(TestSearXNGIntegration):11 个,需要 SearXNG 运行
- Regression(TestRegression):3 个
- CLI(TestCLI):9 个
对每个失败的测试:
1. 记录完整错误信息
2. 分析根因(代码 bug / 环境问题 / 测试用例问题)
3. 给出修复建议
格式:
## T038-P4 测试报告
### 总览
- 总数:XX
- 通过:XX
- 失败:XX
- 跳过:XX
### 分组结果
| 组 | 通过 | 失败 | 跳过 |
|----|------|------|------|
| Unit | X/8 | | |
| Integration | X/11 | | |
| Regression | X/3 | | |
| CLI | X/9 | | |
### 失败详情(如有)
...
### 结论
PASS / FAIL(附说明)
开始时:
/root/.openclaw/workspace/scripts/log-to-channel.sh reviewer receive "T038-P4 测试执行" task-t038p4-ab69fb
完成后:
/root/.openclaw/workspace/scripts/log-to-channel.sh reviewer handoff "T038-P4 测试执行" main task-t038p4-ab69fb
sessions_send 通知爱衣(agent:main:main,timeoutSeconds=0):
task_id=task-t038p4-ab69fb
task=/root/.openclaw/workspace/tasks/task-t038p4-ab69fb/task.md
读 session.md 中的测试报告,重点看:
- 全部 31 个测试是否都跑了?
- 失败的是代码问题还是测试用例问题?
- 通过率是否达标(目标 100%,允许环境相关的 skip)?
通过 → log done + message 主人(附测试摘要)
不通过 → 分析失败原因,决定修代码还是修测试