Skip to content

特征列表

Feature(特征) 是对已注册来源表中某一列的命名视图,并可附加一条分箱(grouping)规则。特征是平台为 HTE(Heterogeneous Treatment Effect,异质性处理效应)分析 预处理输入的基本单元 —— 它描述的是模型可以在哪些用户属性上去切分处理效应。特征位于 Data Management → Feature List

在控制台的位置

Data Management → Feature List。页面左侧有 Feature Category(特征分类)栏,顶部有搜索框(Feature Name / Source Table)和 Create 按钮。

特征列表,5 个游戏特征归属于 Game Core Features 分类

Feature Category 分类栏

左侧栏把特征按分类分组,并显示每个分类的数量:

  • All Features —— 项目内全部特征。
  • Uncategorized —— 未分配分类的特征。
  • 自定义分类(如 Game Core Features)—— 用栏标题旁的 + 按钮创建。

分类在每个特征的 Feature Category 字段上设置(见创建特征)。

列表字段

含义
Feature Name特征名称,下方为底层来源字段(如 feat_countrycountry)。
Feature Source Table字段所属的来源表,如 abc_demo.abc_user_property_date_partition
Feature Grouping应用在该字段上的分箱规则(若有)。
Creator / Created At创建者与创建时间。
Modified By / Modified At修改时间者与修改时间。
Status生命周期状态 —— 可用特征为 Active
ActionsEditDuplicateArchive

Demo 项目注册了 5 个特征,全部读取自 abc_user_property_date_partition 用户属性表:feat_countrycountry)、feat_device_platformdevice_platform)、feat_player_value_tiertotal_pay_amount_usd)、feat_max_level_passedmax_level_passed)、feat_ad_engagementtotal_ad_revenue_usd)。

创建特征

Create 打开 Create Feature 对话框,分两部分。

Create Feature 对话框:Data Source、Field、Feature Name、Feature Category 与 Feature Grouping

Basic Info(基本信息)

  • Data Source —— 要读取的已注册来源表。
  • Field —— 该表中的列。
  • Feature Name(必填)—— 展示名称。
  • Feature Category(必填)—— 默认 Uncategorized,可选择一个已有分类归档。

Feature Grouping(特征分箱)

分箱规则决定原始取值在交给模型前如何分桶。正如对话框提示:"If manual grouping is configured, the model will preprocess features automatically."(配置手动分箱后,模型会自动预处理特征。)三选一:

  • Interval Grouping —— 将数值字段按区间分桶。
  • Discrete Grouping —— 每个不同取值各为一桶(默认)。
  • + Manual Grouping —— 手动定义分桶。

Confirm 确认,或 Cancel 放弃。

特征在哪里被使用

  • 被打包进特征组合(Feature Combination),组合才是实验 HTE 分析消费的单元。
  • 在实验 Results 页的 HTE(Heterogeneous Treatment Effect)Analysis 中,作为模型可切分处理效应的候选子群体。

特征 vs 受众 vs 维度

特征用于建模,而非定向切分 —— 边界详见特征 vs 受众 vs 维度