Skip to content

HTE 快速开始

使用前检查

当前账号及运行环境是否具备权限

在创建 HTE 分析任务前,请确认已在平台的 Data Management / Warehouse Native / BigQuery 中完成相关配置。HTE 任务运行时,平台会将对应的 PySpark 脚本 提交到你所配置的 GCP 项目下的 Dataproc 执行,因此需要提前确认以下权限与资源可用:

  • Dataproc 执行环境可用:请确保 GCP 项目中的 Dataproc 任务可正常提交,并且配置的 Subnetwork URI 正确且可用。
  • 数据源读取权限充足:脚本执行过程中需要读取 HTE 分析所依赖的指标数据表、特征关联数据表等源表,请确保运行账号对这些数据源具有读取权限。
  • BigQuery 写入权限充足:脚本执行过程中会将 HTE 的中间结果写入到你在平台配置的 BigQuery Dataset 中,请确保运行账号对该 Dataset 具有写入权限。
  • 平台侧配置已完成:请确认已在平台的 Data Management / Warehouse Native / BigQuery 页面完成并保存 GCP 项目、BigQuery Dataset、Dataproc 运行环境及 Subnetwork URI 等相关配置,确保 HTE 任务运行时可以正常读取并使用这些配置。

如果以上权限或资源配置不完整,可能导致 HTE 任务创建失败、运行失败,或分析结果无法正常生成。 HTE 前置配置

实验是否已运行并积累足够样本

请确保所选时间范围内,对照组和每个实验组都已积累足够样本;建议每组不少于 300 条样本、每个“实验组 vs 对照组”的总样本不少于 1,000 条,否则 HTE 可能无法切分出稳定的子人群,或出现结果波动大、置信区间宽、显著性不足等问题。

是否已配置目标指标

请确保你的实验已关联至少一个指标。如果你当前未创建指标,请前往 Data Management / Metrics Catalog 创建后关联你的实验。 HTE 目标指标配置

是否有可用用户特征

请确保你已创建至少一个用户特征。如果你当前未创建特征,请前往 Data Management / Feature List 创建。 HTE 前置:特征列表

创建一次 HTE 分析

完成使用前检查后,可以按以下步骤创建 HTE 分析任务:

  1. 进入实验详情页 打开需要分析的实验,进入对应的实验详情页面。
  2. 进入 HTE 分析入口 在实验详情的结果页中找到 HTE (Heterogeneous Treatment Effect) Analysis 入口,进入 HTE 分析配置页面。
  3. 选择 Query Date 选择本次 HTE 分析的数据时间范围。系统将基于该时间范围内的实验曝光、指标和特征数据进行分析。
  4. 选择 Metrics 选择需要分析的实验指标,例如支付转化率、人均支付金额等。建议优先选择与实验目标最相关的主指标。
  5. 选择 Features 选择用于识别异质性效果的用户特征,例如用户生命周期分层、消费分层、年龄分层、平台偏好等。
  6. 点击 Query 创建分析任务 确认 Query Date、Metrics 和 Features 配置无误后,点击 Query 提交任务。系统将创建并运行 HTE 分析任务,任务完成后可在结果页查看不同子人群的实验效果差异。

HTE 查询配置

查看任务执行进度及结果

  • 点击 Query 提交 HTE 分析任务后,系统会生成一条对应的任务记录。你可以点击 History 查看当前实验下的所有 HTE 分析记录,包括任务创建时间、分析配置、执行状态等信息。
  • 当任务执行完成后,可以在任务记录中点击 View Result 进入结果页,查看对应的 HTE 分析结果,包括总体实验效果、子人群效果差异以及相关统计信息。

HTE 结果总览

HTE 子人群结果(1)HTE 子人群结果(2)

HTE 子人群结果(3)