计算成本估算
由于统计引擎把 SQL 下推到你的仓库,跑实验产生的成本会出现在 你 的仓库账单上,而不是 ABetterChoice 的单独计费项。本页面汇总成本驱动因素及把成本压住的方式。
ABetterChoice 以 你自己的 Business Account 在你的 BigQuery 项目内运行分析作业 —— 连接会授权平台的代理账号(proxy account)impersonate 你的 Business Account,并在项目级别运行 BigQuery 作业。指标刷新是按计划、按时区进行的(你在仓库连接里设置的 Time Zone 被用于"数据处理和定时指标重算 / scheduled metric reloading")。
成本驱动因素
- 每实验的指标数量 —— 每个指标都会对事实表贡献一次独立的聚合 pass。
- 刷新频率与时间窗 —— 结果按计划周期重算(scheduled metric reloading),更长的分析窗口意味着每次刷新扫描更多分区。
- 所选维度的基数 —— 用高基数维度(原始用户 ID、自由文本字符串)切分会放大结果表和扫描字节数。
- 底层表的分区 —— 注册了
Partition Field的事实表 / 分流表能让引擎裁剪分区、每次刷新少扫字节(见定义数据表)。 - HTE(异质性处理效应)分析 —— HTE 查询运行在 Dataproc Serverless 批处理 上,是独立于常规 BigQuery 分析的计算面。不跑 HTE 时常规分析照常工作,相应成本也完全不产生。

控制成本的杠杆
- 选择
Partition Field与分区粒度和实验窗口对齐的事实表,让每次刷新只裁剪到需要的分区。 - 维度只保留实验负责人真正会用的那些,避免高基数切分。
- 归档没人消费的指标和维度,让它们不再被重算。
- 仅当团队跑 HTE 分析时才授予 Dataproc 权限,否则该计算面保持不启用。