分类

AI Agent从部署到生产

Hindsight 记忆系统 recall 接口 60 秒不返回?——5 层根因诊断 + bge-m3 切换 + 9419 条数据重建 + 本地 100ms 召回完整实战

Hindsight 记忆系统 recall 接口 60 秒不返回?——5 层根因诊断 + bge-m3 切换 + 9419 条数据重建 + 本地 100ms 召回完整实战

> TL;DR:Hindsight(开源 AI Agent 记忆系统,pgvector 向量库)最新版的 recall HTTP 接口在调用时 60 秒后超时返回,且服务端 PG 数据库 in-...

AI Agent Skill 膨胀治理实战:242 个 Skill 吃掉 4.5M Token——SkillReducer 压缩 60% + 三条铁律锁死 Token 浪费

AI Agent Skill 膨胀治理实战:242 个 Skill 吃掉 4.5M Token——SkillReducer 压缩 60% + 三条铁律锁死 Token 浪费

问题:Skill 越多,Agent 越笨?

你的 AI Agent 是不是装了越来越多的 Skill(技能包),但体验却越来越差?每次对话的 Token 消耗悄悄涨上去了,Agent 的回复速度...

440 0
AI Agent 记忆系统怎么选?Hindsight vs AgentMemory 深度对比——「不漏」还是「能懂」

AI Agent 记忆系统怎么选?Hindsight vs AgentMemory 深度对比——「不漏」还是「能懂」

问题:Agent 越来越聪明,但越来越健忘

你装了 242 个 Skill、配了 Hindsight 向量记忆、自以为给 Agent 造了个完美的外脑。然后你发现——Agent 还是忘事。 不是...

RAG 重排序模型实测:MiniLM → BGE-Reranker-v2-m3 替换全流程——中文召回从废到神(Jetson GPU 部署)

RAG 重排序模型实测:MiniLM → BGE-Reranker-v2-m3 替换全流程——中文召回从废到神(Jetson GPU 部署)

问题:RAG 中文搜不出来,不是向量库的锅

你的 RAG 系统是不是这样:英文查询精准无比,中文查询像是瞎猜?不是 embedding 模型的问题——你用的 bge-large-zh-v1.5 ...

301 0
发现更多