任务 ID: task-embedding-research-52870  |  文件: task.md  |  最后修改: 2026-02-27 08:41:36

task-embedding-research-52870

任务概述

调研热门向量 Embedding 模型,分析优劣势、性能、硬件需求,并评估两台目标服务器能否部署运行。

目标服务器硬件信息

LE-B(冷备份服务器,加拿大)

RS1000(主力迁移候选,美国)

调研维度

  1. 热门向量 Embedding 模型盘点
  2. 涵盖:all-MiniLM-L6-v2、BGE 系列(bge-small/base/large)、text-embedding-ada-002(API)、E5 系列、GTE 系列、Nomic Embed 等
  3. 每个模型:参数量、维度、模型大小、适用语言(中文支持?)

  4. 性能与质量对比

  5. MTEB 基准分数(中文 / 多语言 / 英文)
  6. 检索质量 vs 速度权衡
  7. 中文支持情况(重要:我们有大量中文内容)

  8. 硬件需求与部署可行性

  9. 内存占用(加载后 RAM 使用量)
  10. CPU 推理速度(emb/s,基于上述两台服务器估算)
  11. 是否需要 GPU?纯 CPU 能否接受?
  12. 针对 LE-B(62GB RAM,4核8线程 Xeon E3-1270 v6)的可行性评估
  13. 针对 RS1000(7.8GB RAM,4核 EPYC 9634)的可行性评估

  14. 部署方式

  15. sentence-transformers / Ollama / llamacpp / fastembed 等方案对比
  16. 哪种方案最适合 OpenClaw memory_search 集成?

  17. 推荐方案

  18. 为爱衣 + 银狼 Agent 推荐最适合的 1-2 个模型
  19. 综合考虑:中文支持、纯CPU可用、内��合理、质量够用

输出格式

质检 SOP(爱衣执行)

  1. 报告是否覆盖所有调研维度(5个)
  2. 是否有针对 LE-B 和 RS1000 的具体可行性评估
  3. 是否有中文支持分析
  4. 是否给出明确推荐结论
  5. 报告可读性和结构

执行链

researcher → 爱衣质检

完成通知格式

task_id=task-embedding-research-52870
task=/root/.openclaw/workspace/tasks/task-embedding-research-52870/task.md

发送给:agent:main:main