灵犀Claw实战:从零搭建一个会自我进化的AI Agent(一)总体架构
灵犀Claw实战:从零搭建一个会自我进化的AI Agent(一)总体架构
本系列记录用WPS灵犀Claw平台从零搭建一个具备完整记忆闭环和自我改进能力的AI Agent的全过程。每个专题一篇,由浅入深。
写在前面
为什么要在灵犀Claw上搭AI Agent?因为灵犀Claw是目前国内少有的开放了Skill扩展机制、定时任务、云文档API、MCP协议的桌面AI Agent平台。它不是一个简单的聊天机器人,而是一个可以编程的数字员工。
这个项目用了两周业余时间,核心目标只有一个:让AI Agent越用越聪明,而不是每次都从零开始。
最终成果:3个自研Skill、3层记忆架构、4个自动化定时任务,实现了跨会话记忆不丢失、执行质量持续提升。
系统全景
图1:系统全景架构图
上层蓝色是自研Skill(本系列重点),下层绿色是第三方服务封装(本系列会分享使用经验但不展开源码)。
自研Skill清单(3个)
Skill | 功能 | 代码量 |
Real-time Memory | 实时对话记忆刚性写入(chat文件自动维护) | 内嵌于Agent配置 |
Dreaming | 三阶段自动记忆沉淀(解析-提炼-时间验证) | ~60KB |
Memory Consolidation | 每周记忆深度整理(偏好固化+清理归档) | ~30KB |
三个Skill全部开源,MIT协议。
第三方服务集成(4个)
这些不是我们自研的,但在项目中大量使用,后续会单独分享使用经验和调优心得:
Cherry Diary - 智能日记Skill(训练数据+天气+穿搭+TTS自动生成)
Self-Improving - 自我改进闭环(纠错记录-偏好固化-定期反思-衰减归档)
MiMo TTS - 小米MiMo V2.5语音克隆服务,zero-shot克隆+标签控制系统
Noiz TTS - Noiz AI音色克隆备用引擎
它们不是本系列的重点,但却是整个系统不可或缺的能力支撑。后续会写专门的使用教程分享踩坑经验。
技术栈
层级 | 技术选型 |
AI Agent平台 | WPS灵犀Claw桌面端(Skill机制扩展) |
TTS(主力) | 小米MiMo V2.5(zero-shot克隆+标签控制) |
TTS(备用) | Noiz AI(音色克隆) |
图像生成 | 灵犀Seedream(img2img + Prompt工程) |
文档操作 | WPS云文档V7 API(Python requests) |
笔记系统 | WPS Ainote MCP(Streamable HTTP) |
数据存储 | 本地Markdown + SQLite + WPS云笔记 |
编程语言 | Python |
外部API | 训记APP训练数据、wttr.in天气 |
设计哲学
在深入每个模块之前,先聊清楚指导整个项目设计的几条原则:
1. 记忆优于计算
能记住的就不重复计算。用户说过一次的偏好,下次不用再说。犯过的错,不会犯第二次。这比任何算法优化都重要。
2. 刚性优于自觉
所有必须执行的操作,不能依赖AI"想起来就做"。通过配置文件强制加载、检查清单逐项打勾、定时任务自动触发,把"习惯"变成"铁律"。
3. 先沉淀再回复
AI的每次回复之前,先完成记忆写入。宁可多等一两秒,也不能丢一条记忆。因为记忆丢了就是丢了,回复晚一两秒用户感知不到。
4. 减法优于加法
约束越少越稳定。Prompt少写一条、规则少加一条,模型就多一分注意力给真正重要的内容。
5. 分层存储
16KB的user记忆上限是硬约束,不可能把所有东西都塞进去。必须按"热度"分层:最热的放user(强制加载),温的放MEMORY.md(主动读取),冷的归档(需要时再取)。
系列目录
篇章 | 标题 | 核心内容 |
一 | 总体架构(本文) | 系统全景、Skill清单、设计哲学 |
二 | 实时记忆 | chat文件刚性写入机制、6条铁律 |
三 | Dreaming | 三阶段记忆沉淀、时间验证、碎片管理 |
四 | Memory Consolidation | 每周深度整理、去重合并、Token控制 |
五 | Cherry Diary | 智能日记全流程、数据融合 |
六 | Self-Improving | 纠错-偏好-反思-衰减完整闭环 |
七 | 生图Prompt | Seedream铁律、版本迭代经验 |
八 | 云文档API | V7上传踩坑、文件管理 |
九 | 定时任务 | 4个自动化任务、时间规划 |
十 | 第三方服务 | MiMo TTS / Noiz TTS / Ainote MCP 使用经验 |
十一 | 经验总结 | 踩坑清单、平台限制、未来展望 |
下一篇:实时记忆 - 如何确保AI Agent的每一段对话都不会被遗忘。

