请不要在回答技术问题时复制粘贴 AI 生成的内容

This topic created in 64 days ago, the information mentioned may be changed or developed.

大家都在装 OpenClaw ，我选择自己实现一个

与其 clone 一个跑不起来的庞然大物，不如从零造一个真正理解的 Agent 。

背景：为什么不直接用 OpenClaw ？

最近 OpenClaw （开源 Agent 框架）在圈子里火了。不少人 clone 下来，配好环境变量，跑起来然后呢？

说实话，大部分人（包括我）的体验是这样的：

clone → 安装依赖 → 配置一堆环境变量 → 跑起来了
然后……不知道改哪里，不知道每个模块在干什么
想加个工具？不知道从何下手
出了 bug ？日志看不懂，架构理不清

装了一个 Agent ，但并没有理解 Agent 。

所以我换了个思路：不装 OpenClaw ，而是自己从零实现一个轻量版。

我给它取名 LiteClaw一个用 TypeScript 从零构建的 Agent ，目标是一步步复刻 OpenClaw 的核心能力，每一步都可运行、可理解。

LiteClaw 是什么

LiteClaw 不是 OpenClaw 的 fork ，也不是它的简化版。它是一个面向学习的 Agent 构建教程：

完全用 TypeScript 编写
通过飞书机器人作为交互入口（不需要搭前端）
接入本地 OpenAI-compatible 模型（ Qwen 、DeepSeek 等）
按 Phase 分阶段递进，每个阶段都是完整可运行的

最终目标是：走完所有 Phase 之后，你手上会有一个自己理解每一行代码的 Agent 。

架构总览

先看一张 Phase 3 完成后的整体架构图：

LiteClaw Phase 3 Architecture

整个系统由几个核心层组成：

飞书接入层：长连接模式，本地开发不需要公网域名
消息处理编排：命令路由 + Agent Loop 分发
Agent Loop：模型自主选择工具 → 执行 → 结果回传 → 多轮循环
Tool Registry：可扩展的工具注册体系
Conversation Store：Memory / Redis 可切换
Infrastructure：日志、错误分类、超时重试、限流

分阶段实现路线

这是 LiteClaw 最核心的设计理念：不一口气做完，而是分 Phase 递进。每个 Phase 解决一个核心问题，每个 Phase 都是可运行的。

Phase 1：最小可运行链路

目标：验证"消息能进来、模型能调用、结果能回去"。

这一步只做最核心的事：

飞书长连接接收消息
调用本地模型生成回复
通过飞书 API 发送回复
按 chat_id 维护多轮上下文

Phase 1 Architecture

关键技术决策：

飞书长连接而非 Webhook：本地开发不需要 ngrok 或公网域名
Vercel AI SDK + @ai-sdk/openai-compatible：统一的模型调用接口，适配任何 OpenAI-compatible 模型
进程内 Map 做会话存储：最快启动，后续再换 Redis

完成 Phase 1 之后，你已经有了一个能聊天的飞书机器人。

Phase 2：Agent 基础设施

目标：从"能跑的 demo"升级成"可持续迭代的服务底座"。

一个真正的 Agent 不只是"能回复消息"。你还需要：

持久化：重启不丢对话 → Redis Store
可观测：出问题能定位 → 结构化 JSON 日志
稳定性：外部调用有保护 → 超时 + 重试 + 限流
可扩展：存储后端可替换 → 统一 Store 接口

Phase 2 Architecture

这一步的核心设计是 Store 抽象：

interface ConversationStore { getConversation(chatId: string): Promise<ConversationMessage[]>; appendExchange(chatId: string, userText: string, assistantText: string): Promise<void>; resetConversation(chatId: string): Promise<void>; // ... }

业务代码只依赖接口，底层是 Map 还是 Redis 完全透明。这个设计在 OpenClaw 中也是一样的依赖抽象，不依赖实现。

Phase 3：工具调用 + Agent Loop ← 当前完成

目标：让 Agent 从"会聊天"升级到"会做事"。

这是 Agent 最关键的一步跃迁。Phase 3 之后，LiteClaw 不再只是一个聊天机器人，而是一个能自主决策并执行动作的 Agent 。

核心能力：

模型自主选择工具：LLM 通过 function calling 决定是否调用工具
多轮 Agent Loop：工具执行 → 结果回传 → 模型再决策 → 循环
3 个内置工具：current_time、local_status、http_fetch

Agent Loop Flow

Agent Loop 是怎么工作的？

用户: "现在北京几点了？" ↓ LLM 判断: 需要调用 current_time 工具 ↓ Runtime 执行: current_time({ timezone: "Asia/Shanghai" }) ↓ 工具返回: "2026/03/17 18:30:00" ↓ LLM 基于结果回复: "现在是北京时间 18:30 。"

我使用了 Vercel AI SDK 的 generateText + stopWhen(stepCountIs(N)) 来实现多轮循环，不需要手写 while loop 。同时保留了 LiteClaw 自己的 Tool Registry ，通过 toAISDKTools() 桥接层转换格式。

新增工具只需 3 步：

// 1. 创建工具文件 src/services/tools/my-tool.ts import { z } from "zod"; import type { LiteClawTool } from "../tools.js"; export const myTool: LiteClawTool = { name: "my_tool", description: "工具描述（给模型看的）", parameters: z.object({ query: z.string().describe("参数描述") }), async run(context) { // 你的逻辑 return { text: "结果" }; } }; // 2. 在 tools.ts 中注册 // 3. 完成。模型会自动发现并使用新工具

技术栈选择

技术	选择	为什么
Language	TypeScript	类型安全，前后端统一
Runtime	Node.js 20+	成熟稳定
HTTP	Hono	极轻量，适合做 Agent runtime
AI SDK	Vercel AI SDK (`ai` v6)	内置 tool calling + agent loop
模型	OpenAI-compatible	适配 Qwen 、DeepSeek 等本地模型
Schema	Zod	工具参数验证，AI SDK 原生支持
接入	飞书长连接	零公网依赖，本地即可联调
存储	Memory / Redis	可切换，渐进式引入

快速上手

# 1. clone git clone https://github.com/WarrenJones/liteClaw.git cd liteClaw # 2. 安装依赖 pnpm install # 3. 配置 cp .env.example .env.local # 填入飞书 App ID/Secret + 本地模型地址 # 4. 启动 pnpm dev # 5. 飞书中给机器人发消息测试 # "现在几点了？" → 模型自动调用 current_time 工具 # "/status" → 查看运行时状态 # "/tools" → 查看已注册工具列表

后续路线

Phase 3 完成后，LiteClaw 已经具备了 Agent 的核心骨架。后续还有三个大方向：

Phase 4：记忆与状态管理

当前的"记忆"只是最近 N 轮对话。真正的 Agent 需要：

短期记忆：当前会话上下文（已有）
长期记忆：跨会话的用户偏好、重要信息
摘要机制：对话太长时自动压缩
记忆裁剪：过期信息的回收策略

Phase 5：任务执行与编排

从"单轮对话"升级到"多步任务"：

任务拆解：把复杂请求拆成子步骤
状态机：跟踪任务执行进度
进度反馈：让用户知道当前在做什么
任务恢复：中断后可以继续

Phase 6：向 OpenClaw 能力对齐

最终目标补齐完整 Agent 能力：

完整的 Agent 编排系统
更丰富的工具生态
权限与审计机制
卡片消息、文件处理、流式回复
生产级部署与可观测性

为什么我建议你也试试

装 OpenClaw 当然没问题。但如果你想真正理解 Agent 是怎么工作的，我建议你也试试从零搭一个。

你会发现：

Agent 的核心并不复杂：本质就是 LLM + Tool Calling + Loop
基础设施比想象中重要：日志、超时、重试、限流这些"无聊的事"决定了你的 Agent 能不能稳定运行
分阶段构建是最好的学习路径：每个 Phase 都有明确目标，做完就有成就感
你对代码有完全的掌控力：想改就改，想加就加，不用在别人的代码里翻来翻去

LiteClaw 的所有代码都在 GitHub 上，每个 Phase 都有独立的技术文档。欢迎 star 、fork 、提 issue 。

GitHub: github.com/WarrenJones/liteClaw

总结

	装 OpenClaw	自己实现 LiteClaw
上手速度	快（如果环境配得对）	慢一些，但每一步都清楚
理解深度	停留在使用层	深入到实现层
可定制性	受框架约束	完全自由
学习价值	学会了"怎么用"	学会了"怎么造"