HTE 快速开始
使用前检查
当前账号及运行环境是否具备权限
在创建 HTE 分析任务前,请确认已在平台的 Data Management / Warehouse Native / BigQuery 中完成相关配置。HTE 任务运行时,平台会将对应的 PySpark 脚本 提交到你所配置的 GCP 项目下的 Dataproc 执行,因此需要提前确认以下权限与资源可用:
- Dataproc 执行环境可用:请确保 GCP 项目中的 Dataproc 任务可正常提交,并且配置的 Subnetwork URI 正确且可用。
- 数据源读取权限充足:脚本执行过程中需要读取 HTE 分析所依赖的指标数据表、特征关联数据表等源表,请确保运行账号对这些数据源具有读取权限。
- BigQuery 写入权限充足:脚本执行过程中会将 HTE 的中间结果写入到你在平台配置的 BigQuery Dataset 中,请确保运行账号对该 Dataset 具有写入权限。
- 平台侧配置已完成:请确认已在平台的 Data Management / Warehouse Native / BigQuery 页面完成并保存 GCP 项目、BigQuery Dataset、Dataproc 运行环境及 Subnetwork URI 等相关配置,确保 HTE 任务运行时可以正常读取并使用这些配置。
如果以上权限或资源配置不完整,可能导致 HTE 任务创建失败、运行失败,或分析结果无法正常生成。 
实验是否已运行并积累足够样本
请确保所选时间范围内,对照组和每个实验组都已积累足够样本;建议每组不少于 300 条样本、每个“实验组 vs 对照组”的总样本不少于 1,000 条,否则 HTE 可能无法切分出稳定的子人群,或出现结果波动大、置信区间宽、显著性不足等问题。
是否已配置目标指标
请确保你的实验已关联至少一个指标。如果你当前未创建指标,请前往 Data Management / Metrics Catalog 创建后关联你的实验。 
是否有可用用户特征
请确保你已创建至少一个用户特征。如果你当前未创建特征,请前往 Data Management / Feature List 创建。 
创建一次 HTE 分析
完成使用前检查后,可以按以下步骤创建 HTE 分析任务:
- 进入实验详情页 打开需要分析的实验,进入对应的实验详情页面。
- 进入 HTE 分析入口 在实验详情的结果页中找到 HTE (Heterogeneous Treatment Effect) Analysis 入口,进入 HTE 分析配置页面。
- 选择 Query Date 选择本次 HTE 分析的数据时间范围。系统将基于该时间范围内的实验曝光、指标和特征数据进行分析。
- 选择 Metrics 选择需要分析的实验指标,例如支付转化率、人均支付金额等。建议优先选择与实验目标最相关的主指标。
- 选择 Features 选择用于识别异质性效果的用户特征,例如用户生命周期分层、消费分层、年龄分层、平台偏好等。
- 点击 Query 创建分析任务 确认 Query Date、Metrics 和 Features 配置无误后,点击 Query 提交任务。系统将创建并运行 HTE 分析任务,任务完成后可在结果页查看不同子人群的实验效果差异。

查看任务执行进度及结果
- 点击 Query 提交 HTE 分析任务后,系统会生成一条对应的任务记录。你可以点击 History 查看当前实验下的所有 HTE 分析记录,包括任务创建时间、分析配置、执行状态等信息。
- 当任务执行完成后,可以在任务记录中点击 View Result 进入结果页,查看对应的 HTE 分析结果,包括总体实验效果、子人群效果差异以及相关统计信息。



