任务 ID: task-embedding-research-52870 | 文件: task.md | 最后修改: 2026-02-27 08:41:36

task-embedding-research-52870

任务概述

调研热门向量 Embedding 模型，分析优劣势、性能、硬件需求，并评估两台目标服务器能否部署运行。

热门向量 Embedding 模型盘点
涵盖：all-MiniLM-L6-v2、BGE 系列（bge-small/base/large）、text-embedding-ada-002（API）、E5 系列、GTE 系列、Nomic Embed 等
每个模型：参数量、维度、模型大小、适用语言（中文支持？）
性能与质量对比
MTEB 基准分数（中文 / 多语言 / 英文）
检索质量 vs 速度权衡
中文支持情况（重要：我们有大量中文内容）
硬件需求与部署可行性
内存占用（加载后 RAM 使用量）
CPU 推理速度（emb/s，基于上述两台服务器估算）
是否需要 GPU？纯 CPU 能否接受？
针对 LE-B（62GB RAM，4核8线程 Xeon E3-1270 v6）的可行性评估
针对 RS1000（7.8GB RAM，4核 EPYC 9634）的可行性评估
部署方式
sentence-transformers / Ollama / llamacpp / fastembed 等方案对比
哪种方案最适合 OpenClaw memory_search 集成？
推荐方案
为爱衣 + 银狼 Agent 推荐最适合的 1-2 个模型
综合考虑：中文支持、纯CPU可用、内��合理、质量够用

researcher → 爱衣质检

task_id=task-embedding-research-52870
task=/root/.openclaw/workspace/tasks/task-embedding-research-52870/task.md

发送给：agent:main:main