[Hillard et al. 2010,section 4.1]描述了另一个预测的反馈模型
。在这个方法中,响应率不是
在权重中,但通过使用反馈特征体现在特征值中。 这个
方法依赖于广告的历史平均响应率的观察
,是未来响应率的良好指标。

反馈特征是通过以不同的粒度级别汇总各种维度的历史数据得出的
(例如广告,发布商或用户)。 相应的
响应率(CTR或CVR)及其支持(即展示次数或点击)是建模中使用的特征值。该阈值通常被认为是未定义的历史响应率,因为
估计是不可靠的。

广告的响应速度可能会显示的发布商页面或者看到它的用户。捕捉不同的响应率变化
大小,不同尺寸的多个属性可用于生成

复合反馈功能(类似于连接功能),如:publisheradvertiser

和用户发布商 - 创意合成。

反馈特征使用简单的k均值聚类算法进行量化[Mac-

Queen 1967](具有指示未定义值的特殊簇id)

进入逻辑回归算法。因此,最终的型号通常是大小

小。然而,需要额外的内存来存储功能ID以进行反馈

特征值映射。请注意,反馈功能经常刷新

使用最新的历史信息更新统计信息。

反馈功能的一个潜在弱点是它可能给出不正确的信号

因为混杂变量。这就是为什么它被提倡的原因

在本文中,直接将响应建模为所有变量的函数,而不是

执行任何聚合。

然而,从实际的角度来看,基于反馈特征的模型可能是

在更新模型的成本明显高于的情况下,首选

更新反馈功能的成本。

我们使用相对较少的功能进行比较

基于分类特征提出的模型和基于反馈特征的模型。

表III中的结果表明,两种模型是相似的,具有轻微的优势

我们提出的模型。随着功能的数量,差异可能会更大

增加:基于分类变量的模型将更好地模拟效应

混淆变量。

results matching ""

    No results matching ""