跳到主要内容

QueryEngine、权限、压缩、遥测里,哪些是真正的产品级分水岭

我判断“像不像产品”,不看 demo 炫不炫

判断一个 coding agent 是不是进入产品级,我不会先看它能不能改文件、能不能跑命令、能不能调模型。

这些东西会做 demo 的系统也能有。

我更看四个点:

  • 有没有像样的 QueryEngine
  • 权限是不是系统边界,而不是临时弹窗
  • 压缩是不是长期运行的生存条件
  • 遥测和远程配置是不是被当成治理基础设施

1. QueryEngine:从“会循环”到“会管理整个工作过程”

我觉得 QueryEngine 是第一个真正的分水岭。

因为只要系统里出现了这层,就说明作者不再满足于“把 loop 跑起来”,而是在认真处理:

  • turn 生命周期
  • transcript 持久化
  • 成本累计
  • 快照与恢复

这会直接改变产品体验。

没有 QueryEngine 的系统,也许能完成一次任务;有了它,系统才更像能持续工作的工具。

2. 权限:从能力展示变成风险控制

很多系统会把权限理解成“危险操作前弹个确认框”。

CCB 值钱的地方,是它把权限看成完整边界机制:

工具要经过输入校验、权限规则汇聚、会话 / 项目 / 用户 / 托管配置多来源约束,再决定能不能真正执行。

这才是产品级差异。

因为一旦系统有完整 shell、文件修改、网络访问能力,权限不是附加功能,而是决定它能不能被真实团队信任的基础。

3. 压缩:从优化项变成长期运行条件

上下文压缩最容易被低估。

很多人会把 compact 看成“上下文快满了再处理一下”的优化细节,但 CCB 里把它放进主数据流,说明它其实是长期运行条件。

只要任务变长、工具结果变多、消息轮次变深,没有压缩策略的系统就会同时在三件事上恶化:

  • 变贵
  • 变慢
  • 变糊

所以我会把压缩看成第二个很强的产品级分水岭。

会不会压缩,不只是性能问题,而是系统能不能稳定做长任务的问题。

4. 遥测和远程配置:从单机工具变成可治理产品

Telemetry、GrowthBook、Remote Managed Settings、Settings Sync 这一组内容最能说明“产品化”到底长什么样。

这类能力不是为了炫基础设施,而是为了回答真实产品问题:

  • 功能开关怎么远程控制
  • 采样和事件怎么统一记录
  • 企业配置怎么安全下发
  • 本地设置和远端设置怎么同步

一旦系统进入团队使用、组织部署、版本演进,这些问题都躲不掉。

所以遥测和远程配置不是“附属运营模块”,而是系统治理层。

如果只能挑两个分水岭

如果让我只挑两个最能把 demo 和产品区分开的点,我会挑:

  1. QueryEngine
  2. 权限 + 压缩

前者决定它是不是一个真正管理工作过程的系统,后者决定它能不能长期、安全地工作。

遥测和远程配置我会放第三位,不是因为不重要,而是因为它们更偏“团队级、组织级产品成熟度”。

最后一个判断

很多人会觉得产品级差异来自“支持更多模型”“有更炫的 UI”“会更多工具”。

我不这么看。

真正的分水岭更朴素:

  • 能不能管理整个任务过程
  • 能不能把危险能力关在边界里
  • 能不能在长任务里继续活下去
  • 能不能被持续观测和远程治理

CCB 最值钱的,就是逼你把注意力从“功能列表”移到这些更硬的系统能力上。