Documentation Index
Fetch the complete documentation index at: https://tech.illasoft.com/llms.txt
Use this file to discover all available pages before exploring further.
与 kira-be 集成
Agent 系统的改动最小化:技术栈
| 组件 | 技术 | 说明 |
|---|---|---|
| 服务框架 | Bun + Hono | 与 kira-be 统一 |
| 向量存储 | LanceDB Cloud | Serverless,已在 kira-be 使用 |
| 关系存储 | Supabase XL(memory schema) | 已有实例,边际成本为零 |
| 缓存 | Dragonfly(已有) | Profile 热缓存 |
| 任务编排 | Inngest(self-hosted,已有) | Extract / Consolidate 任务分发 |
| Embedding | Voyage multimodal-3.5 | 已在 feed pipeline 使用 |
| 提取 LLM | mistral-small-latest(Mistral) | 便宜,结构化输出好,已有 SDK |
| 固化 LLM | mistral-small-latest(Mistral) | 画像生成/更新 |
| 部署 | Fly.io sjc | 与其他服务同区 |
分阶段落地
Phase 1: 基础(2 周)
- kira-memory 服务骨架(Bun + Hono)
- Supabase memory schema + profiles 表
- LanceDB Cloud memories table
- Memory API: add / search / update / delete
- kira-be 集成 memory_add 和 memory_search tools
Phase 2: 自动提取(2 周)
- Inngest function:
memory/extract.requested - 行为特征提取器(零 LLM)
- LLM 语义提取器(mistral-small-latest)
- 去重逻辑(embedding 相似度 > 0.9 合并)
- kira-be 每轮对话后发 extract 任务
Phase 3: Inject + Compact Memory(2 周)
- /inject API(核心接口)
- Consolidator 定时任务(情景 → 画像)
- Dragonfly profile 缓存
- kira-be agent 改用 inject 注入记忆上下文
- 群实体支持
Phase 4: 遗忘 + 度量(2 周)
- Decayer 定时任务
- access_count 追踪
- PostHog 埋点:记忆命中率、检索延迟
- A/B 测试:有记忆 vs 无记忆的用户满意度
- 记忆数量/质量 dashboard
Phase 5: CMS 记忆管理后台(1.5 周)
- kira-memory Admin API(
/admin/*路由 + Admin Token 鉴权) -
memory.admin_audit_log审计日志表 - kira-cms Memory Admin 自定义视图(用户搜索 + Profile 展示/编辑)
- 记忆列表(分页、类型筛选、排序)+ 详情弹窗
- 新增 / 编辑 / 删除 / 批量删除记忆
- 清空记忆(高危操作二次确认 + Lark 通知)
详见 CMS 记忆管理 设计文档。
成本估算(50k MAU)
| 组件 | 月费 | 计算 |
|---|---|---|
| Supabase 增量 | ~$0 | 已付 XL |
| LanceDB Cloud | ~$20-50 | 100 万向量,75k queries/天 |
| Extraction LLM | ~$10-20 | mistral-small-latest,75k 次/天,~500 tokens/次 |
| Consolidation LLM | ~$5 | 50k 用户 × 每天一次,~200 tokens/次 |
| Embedding (Voyage) | ~$10 | ~200k 次/月 |
| Fly.io (kira-memory) | ~$10-15 | shared-cpu-2x, 512MB |
| 总计 | ~$55-100/月 |
Inngest 配置
serve({ client: inngest, functions }) 暴露 HTTP /api/inngest 供 Inngest server 调用。