任务 ID: task-t038p6-58d6f4  |  文件: session.md  |  最后修改: 2026-03-01 20:54:59

Session: T038-P6 ai-search 全源可用性测试

开始时间:2026-03-01 20:48 CST
完成时间:2026-03-01 21:05 CST
执行者:Ai.Rev 📋


一、Channel 层测试

编号 源/引擎 结果数 首条标题(前40字) 耗时 状态
C1 web 1 📖 Example Domain 498ms
C2 rss 1 📖 Hacker News: Front Page 365ms
C3 youtube 1 Rick Astley - Never Gonna Give You Up (Official 3992ms
C4 bilibili 0 ⚠️ 无法获取视频信息 (服务器IP可能被封) 960ms
C5 github 1 GitHub - torvalds/linux: Linux kernel source tree 4899ms
C6 github search 0 需要 gh auth login / GH_TOKEN 188ms 🔐
C7 reddit 0 Reddit blocked (403 Forbidden) 需配代理 209ms
C8 searxng web 5 Test - Wikipedia 3183ms
C9 searxng find 5 axiom_ai (pkg类) 3084ms
C10 twitter 0 No results (bird CLI已装但需auth_token/ct0 cookie) 226ms 🔐
C11 exa_search 0 Exa API key not configured 428ms 🔐
C12 xiaohongshu 0 需要 mcporter + xiaohongshu-mcp server 419ms 🔐
C13 bosszhipin 0 依赖 Exa API key(未配置) 707ms 🔐
C14 instagram 0 Post isn't available (无效URL/无cookies) 3296ms
C15 linkedin 0 无法读取此 LinkedIn 页面 15686ms

Channel 层备注:
- C6 (github search):gh auth login 未配置,或设置 GH_TOKEN 环境变量
- C10 (twitter):bird CLI v0.8.0 已安装,但需要 Twitter auth_token + ct0 cookie
- C11 (exa_search):需在 https://exa.ai 获取 API key,然后 ai-search configure exa-key YOUR_KEY
- C12 (xiaohongshu):需要 mcporter + xiaohongshu-mcp server(localhost:18060)
- C13 (bosszhipin):底层依赖 Exa API(同 C11)
- C14 (instagram):需要有效帖子URL + sessionid/csrftoken cookies
- C15 (linkedin):被 LinkedIn 反爬机制拦截,需 mcporter + linkedin-scraper-mcp


二、SearXNG 引擎层测试

自定义引擎

编号 引擎 结果数 首条标题(前40字) 耗时 状态
S1 clinicaltrials 3 Setmelanotide (RM-493) Phase 2 Treatment Trial 5095ms
S2 coingecko 3 Bitcoin 2596ms
S3 bangumi 3 进击的巨人 1665ms
S4 worldbank 3 Climate change scenarios and climate data 5316ms
S5 openfda 3 Aspirin - Wikipedia(通过通用引擎回退) 3176ms

S5 注意:计划标注为🚫(已禁用),但实际执行返回3条结果(通过 SearXNG 通用引擎回退),标记为 ✅。若 SearXNG 实例中 openfda 确已禁用,本结果为通用搜索回退,非专用引擎。

分类抽样

编号 分类 引擎 结果数 首条标题(前40字) 耗时 状态
S6 general google 3 Speedtest by Ookla - The Global Broadband Speed 1960ms
S7 general bing 3 Speedtest by Ookla - The Global Broadband Speed 504ms
S8 general duckduckgo 0 No results found 606ms ⚠️
S9 general baidu 3 test - 搜索 词典 1408ms
S10 science arxiv 3 PyramidTNT: Improved Transformer-in-Transformer 1435ms
S11 science pubmed 0 No results found 3189ms ⚠️
S12 science semantic scholar 0 No results found 3165ms ⚠️
S13 science google scholar 3 Development and application of artificial neural 739ms
S14 packages pypi 0 No results found 1593ms ⚠️
S15 packages npm 3 express 1942ms
S16 packages docker hub 3 Nginx 1872ms
S17 repos github 3 freeCodeCamp/freeCodeCamp 1818ms
S18 repos gitlab 3 Ansible role mint_setup_anydesk 2025ms
S19 it stackoverflow 3 How to call method in correct asyncio context 599ms
S20 it arch linux wiki 0 No results found 1210ms ⚠️
S21 news google news 0 No results found 2482ms ⚠️
S22 news bing news 0 No results found 781ms ⚠️
S23 images google images 3 Domestic cat | National Geographic 1015ms
S24 videos youtube 3 👩💻 Python for Beginners Tutorial 1092ms
S25 videos bilibili 3 【全748集】目前B站最全最细的Python零基础全套教程 1148ms
S26 social media reddit 0 No results found 464ms ⚠️
S27 social media mastodon users 3 python (5983 followers) 893ms
S28 wikimedia wiktionary 3 algorithm 494ms
S29 q&a stackoverflow 3 Store st_mode (from stat) in a file and reuse 1366ms
S30 map openstreetmap 1 Tokyo, Japan 3086ms
S31 books openlibrary 3 Metamorphoses 1012ms
S32 movies imdb 3 Inception (feature) 460ms
S33 music soundcloud 0 No results found 3164ms ⚠️
S34 weather wttr.in 0 No results found 7577ms ⚠️
S35 finance coingecko 同 S2,已验证
S36 translate lingva 0 No results found 164ms ⚠️
S37 files 1337x 0 No results found 380ms ⚠️

三、代理池验证

编号 测试项 结果数 耗时 状态 说明
P1 Google 通过代理 0 3192ms ⚠️ SearXNG 通过内置代理路由,但本次 google 引擎返回 0 条
P2 YouTube 通过代理 3 2648ms Python Full Course for Beginners
P3 Reddit 通过代理 0 163ms ⚠️ SearXNG 中 reddit 引擎无结果返回

注:SearXNG 本身集成了代理池,P1/P3 引擎级无结果不等于代理池失效,可能为引擎反爬导致空结果。


汇总

Channel 层

状态 数量 列表
✅ 可用 6 web, rss, youtube, github(read), searxng web, searxng find
🔐 需认证 5 github search(GH_TOKEN), twitter(bird cookie), exa_search(API key), xiaohongshu(mcporter+XHS MCP), bosszhipin(依赖Exa key)
❌ 不可用 4 bilibili(IP被封需代理), reddit(403需代理), instagram(需cookie+有效URL), linkedin(反爬)

SearXNG 引擎层(含自定义引擎,共37项)

状态 数量 列表
✅ 可用 26 clinicaltrials, coingecko, bangumi, worldbank, openfda*, google, bing, baidu, arxiv, google scholar, npm, docker hub, github, gitlab, stackoverflow(x2), google images, youtube, bilibili, mastodon users, wiktionary, openstreetmap, openlibrary, imdb, coingecko(S35)
⚠️ 降级/空结果 11 duckduckgo, pubmed, semantic scholar, pypi, arch linux wiki, google news, bing news, reddit, soundcloud, wttr.in, lingva, 1337x
🚫 已禁用 0 openfda 实际返回了结果(通用回退),未被禁用

*S5 openfda:按计划应标注🚫,但实际运行有结果返回(通用搜索回退),建议专项核查是否真正禁用。

代理池

状态 说明
✅ 部分生效 YouTube (P2) 通过 SearXNG 代理成功返回结果;Google (P1)、Reddit (P3) 在 SearXNG 引擎层返回空,可能为引擎级反爬限制而非代理失效

关键发现

  1. Channel 层 bilibili / reddit 直读功能被服务器 IP 封锁,需配置代理(ai-search configure proxy URL
  2. SearXNG 引擎层:duckduckgo、pubmed、semantic scholar、pypi、arch linux wiki、google news、bing news、reddit、soundcloud、wttr.in、lingva、1337x 这 12 个引擎当前返回空结果(降级),可能为反爬或 SearXNG 实例配置问题
  3. twitterbird CLI v0.8.0 已安装,但需要配置 Twitter auth_token + ct0 cookie 才能使用
  4. bosszhipin:底层依赖 Exa API key,而非独立 MCP,需先配置 exa key
  5. openfda:计划标注🚫(已禁用),但实际执行返回了结果(通用搜索回退),建议核查