含光

分类

人工智能Agent

人工智能Agent 2026-06-27

Ollama 部署五大崩溃：llama runner terminated exit 2、10 分钟后停止服务、GPU 不释放显存、GGUF 断言失败、server not responding——逐一修复指南

Ollama 是大多数人第一个接触的本地大模型工具。但它的问题也是最多的——不是因为它质量差，而是因为它被用在太多奇奇怪怪的硬件组合上了。

一、Ollama vs vLLM vs SGLa...

16 0

人工智能Agent 2026-06-27

Dify + vLLM 对接崩溃实录：CredentialsValidateFailedError 404、插件 SDK 崩溃、vLLM 引擎级报错——逐一修复指南

Dify 是中国最火的自部署 AI 应用平台，vLLM 是生产级推理引擎。但把它们连起来——插件 404、SDK 版本冲突、模型直接炸引擎——这些坑比想象中多得多。

一、为什么 Dify ...

12 0

人工智能Agent 2026-06-27

Codex CLI 源码拆解：OpenAI 的 Rust Agent 运行时——为什么重写能解决 Node.js 的"生死问题"

三角对照：Claude Code 子进程模型 → Codex 多宿主架构 → Hermes 单循环

TL;DR

Codex CLI 是 OpenAI 的编程 Agent CLI。它经历了一次...

24 0

人工智能Agent 2026-06-25

SGLang + DeepSeek-V3 部署五大崩溃：DP Attention CUDA OOM 炸穿 8×H100、flashinfer 编译失败、NCCL SIGSEGV 多节点暴毙——逐一修复指南

如果说 vLLM 是推理引擎里的"老牌劲旅"，那 SGLang 就是 DeepSeek、xAI、NVIDIA 官方都在用的"新生代杀手"。但它的坑不比 vLLM 少——甚至更隐蔽。

一、为...

4 0

人工智能Agent 2026-06-25

RuntimeError: CUDA out of memory warming up sampler with 64 dummy requests——vLLM V1 引擎 OOM 排障指南

如果你最近把 vLLM 从 0.6.x 升到了 0.7+，然后模型突然跑不起来了——这篇文章就是写给你的。

一、事故现场：同样的模型，同样的参数，V1 就是 OOM

一位开发者在 GitH...

7 0

人工智能Agent 2026-06-25

Claude Code CLI 源码拆解：Node.js 子进程模型与 ACP 协议设计

三角对照：OpenClaw Gateway → Hermes 单循环 → Claude Code 子进程

TL;DR

Claude Code 是 Anthropic 官方推出的 CLI Ag...

9 0

人工智能Agent 2026-06-23

[08] Hermes Agent 基础设施拆解：Profile 隔离、Cron 调度、MCP 协议与 Plugin 系统

> TL;DR：让 Agent 7×24 小时跑在生产环境的四根柱子。Profile（多身份隔离，每个 profile 有独立的 config/skills/memory）、Cron（自主定时唤...

Cron Hermes Agent MCP

11 0

人工智能Agent 2026-06-22

[07] Hermes Agent 技能进化系统拆解：Skill 的元数据结构、自注册加载与退化机制

> TL;DR：Skill 不是静态的文档——它是 Agent 的"程序性记忆"系统。SKILL.md 采用 YAML frontmatter + Markdown 的元数据结构，各文件通过 A...

Hermes Agent SKILL.md 技能系统

12 0

人工智能Agent 2026-06-21

[06] Hermes Agent 模型调度源码拆解：40+ Provider 注册表、5 种 API 模式与动态运行时解析

> TL;DR：从 `/model claude-sonnet-4` 敲下回车到请求发出去，中间经过 `runtime_provider.py`（1694 行）和 `auth.py`（7706 行）的精密调...

Hermes Agent Provider 模型调度

16 0

人工智能Agent

一、Ollama vs vLLM vs SGLa...

一、为什么 Dify ...

TL;DR

一、为...

一、事故现场：同样的模型，同样的参数，V1 就是 OOM

TL;DR

> TL;DR：让 Agent 7×24 小时跑在生产环境的四根柱子。Profile（多身份隔离，每个 profile 有独立的 config/skills/memory）、Cron（自主定时唤...

> TL;DR：Skill 不是静态的文档——它是 Agent 的"程序性记忆"系统。SKILL.md 采用 YAML frontmatter + Markdown 的元数据结构，各文件通过 A...

> TL;DR：从 /model claude-sonnet-4 敲下回车到请求发出去，中间经过 runtime_provider.py（1694 行）和 auth.py（7706 行）的精密调...

> TL;DR：从 `/model claude-sonnet-4` 敲下回车到请求发出去，中间经过 `runtime_provider.py`（1694 行）和 `auth.py`（7706 行）的精密调...