标签

其他

AI Agent Skill 膨胀治理实战:242 个 Skill 吃掉 4.5M Token——SkillReducer 压缩 60% + 三条铁律锁死 Token 浪费

AI Agent Skill 膨胀治理实战:242 个 Skill 吃掉 4.5M Token——SkillReducer 压缩 60% + 三条铁律锁死 Token 浪费

问题:Skill 越多,Agent 越笨?

你的 AI Agent 是不是装了越来越多的 Skill(技能包),但体验却越来越差?每次对话的 Token 消耗悄悄涨上去了,Agent 的回复速度...

440 0
RAG 重排序模型实测:MiniLM → BGE-Reranker-v2-m3 替换全流程——中文召回从废到神(Jetson GPU 部署)

RAG 重排序模型实测:MiniLM → BGE-Reranker-v2-m3 替换全流程——中文召回从废到神(Jetson GPU 部署)

问题:RAG 中文搜不出来,不是向量库的锅

你的 RAG 系统是不是这样:英文查询精准无比,中文查询像是瞎猜?不是 embedding 模型的问题——你用的 bge-large-zh-v1.5 ...

301 0
发现更多