Skip to content

计算成本估算

由于统计引擎把 SQL 下推到你的仓库,跑实验产生的成本会出现在 的仓库账单上,而不是 ABetterChoice 的单独计费项。本页面汇总成本驱动因素及把成本压住的方式。

ABetterChoice 以 你自己的 Business Account 在你的 BigQuery 项目内运行分析作业 —— 连接会授权平台的代理账号(proxy account)impersonate 你的 Business Account,并在项目级别运行 BigQuery 作业。指标刷新是按计划、按时区进行的(你在仓库连接里设置的 Time Zone 被用于"数据处理和定时指标重算 / scheduled metric reloading")。

成本驱动因素

  • 每实验的指标数量 —— 每个指标都会对事实表贡献一次独立的聚合 pass。
  • 刷新频率与时间窗 —— 结果按计划周期重算(scheduled metric reloading),更长的分析窗口意味着每次刷新扫描更多分区。
  • 所选维度的基数 —— 用高基数维度(原始用户 ID、自由文本字符串)切分会放大结果表和扫描字节数。
  • 底层表的分区 —— 注册了 Partition Field 的事实表 / 分流表能让引擎裁剪分区、每次刷新少扫字节(见定义数据表)。
  • HTE(异质性处理效应)分析 —— HTE 查询运行在 Dataproc Serverless 批处理 上,是独立于常规 BigQuery 分析的计算面。不跑 HTE 时常规分析照常工作,相应成本也完全不产生。

仓库连接设置时区用于定时指标重算,并为 HTE 分析配置 Dataproc Serverless

控制成本的杠杆

  • 选择 Partition Field 与分区粒度和实验窗口对齐的事实表,让每次刷新只裁剪到需要的分区。
  • 维度只保留实验负责人真正会用的那些,避免高基数切分。
  • 归档没人消费的指标和维度,让它们不再被重算。
  • 仅当团队跑 HTE 分析时才授予 Dataproc 权限,否则该计算面保持不启用。