Skip to content

结束实验与决策

本页面面向准备关闭 In Progress 实验的负责人,涵盖:何时该结束实验、Ship 与 Archive 两种决策的区别与操作方式、决策如何被审计记录。

何时该结束实验

控制台不会替你停止实验,需基于 Results 上的信号自行决定:

信号含义
主指标已显著Suggestion 不再要求「继续收集」,指标行出现明确方向差异。胜出变体是 Ship 候选
跑够样本但结果是平的累计曝光达到预设样本量,相对差在 0 附近徘徊且置信区间覆盖 0。诚实答案是 Archive
触发护栏或风险信号SRM 不通过、参数变更告警横幅亮起、副指标朝错误方向移动。停止实验
假设已不重要产品形态或受众变化,结果无法支撑真实决策,归档即可

平台不要求等到固定的日历周期。在你做出动作之前,状态条始终是 In Progress

Make Decision

  • Ship —— 发布一个胜出变体
  • Archive —— 归档实验,不发布任何变体

两个 Tab 共享同一个**决策原因(Reason for Decision)**文本域,填写的文本会记录到实验 History。

Ship:让胜出变体上线

当某个变体明显胜出,你希望它的参数值成为新默认值时选 Ship。

操作步骤

  1. 在实验头部点 Make Decision
  2. 对话框默认打开 Ship Tab,标题 A better group has been found
  3. 展开下拉框,选中要发布的变体(选中前 Ship 按钮 disabled)
  4. 可选:填写一句决策原因
  5. Ship

Ship 之后

改变的对象行为
层参数默认值更新为胜出变体的参数值。之后该层所有受众都读到新值
实验状态In Progress → Shipped
流量分配降为 0%,层可用流量恢复
白名单失效
Setup变只读,胜出变体旁显示 Shipped 标签
Make Decision 按钮消失
Results仍可浏览历史数据
History新增 Ship experiment 条目(操作人、时间戳、原因)

什么时候选 Ship

同时满足以下条件:

  • 状态 In Progress,样本量已经够下结论
  • Suggestion 指向明确的领先变体,或主指标 Comparison 已统计显著
  • Results 顶部没有 Risk warning(SRM 通过、无参数变更告警)
  • 你选的变体确实是你想作为新默认值的那一个

Archive:不上线直接归档

当没有胜者,或实验已经不是该问的问题时,选 Archive。

操作步骤

  1. 在 Make Decision 对话框切到 Archive Tab
  2. 可选填写决策原因
  3. 阅读红色警告:归档后参数回到默认值,实验不可再启动
  4. Archive

Archive 之后

改变的对象行为
层参数默认值不变,受众回退到原默认值
实验状态In Progress → Archived
流量分配降为 0%,层可用流量恢复
白名单失效
Setup变只读
Make Decision 按钮消失
Results仍可浏览历史数据
History新增 Archive experiment 条目
是否可恢复否,归档后不可再启动

什么时候选 Archive

  • 样本量已够,主指标无显著差异(Comparison 在 0 附近,置信区间穿越 0)
  • Suggestion 提示 No winning variant foundNo better group in primary metrics
  • 触发了护栏或风险信号(SRM 失败、参数变更告警、关键副指标方向变坏)
  • 假设本身已过时(产品形态或受众在实验之下变了)

你也可以在 Experiments 列表对 Not Started 草稿用 ⋮ → Archive 直接归档(不打开对话框,不捕获原因)。

Ship 前必查清单

在点 Make Decision 之前,对照 Results 过一遍:

决策前校验清单

检查项看哪里
样本量已达到或超过预设累计曝光卡片
主指标方向与假设一致并显著指标表
Results 顶部没有 Risk warning页面顶部
样本比例校验通过(SRM)SRM 状态
实验回溯 ✓ Normal回溯标签
想 Ship 的变体的参数值是想上线的Setup → 变体与参数
能用一句话写出决策原因对话框文本域

任何一行打不上勾,就不要 Ship——最多 Archive,更多时候是让实验继续跑。

决策记录(History)

两种决策都会落在实验的 History 日志上(头部 ⋮ → History)。

动作含义
Create experiment实验被创建
Experiment startedStart 被点击,进入 In Progress
Ship experimentMake Decision → Ship 确认
Archive experimentMake Decision → Archive 确认

每条记录显示操作人头像、用户名和 UTC 时间戳。决策原因文本随记录存储,作为团队审计依据。