探究OPPO智能增量算法的基础结构及其实际运用

发布时间：2023-11-02 10:15:40 所属栏目：动态来源：

导读：一、行业背景

由于智能手机制造属于典型的硬件工业领域，它就深深地影响着每个人的日常生活。

随着智能手机风口过去，手机公司可能面临许多挑战。一般来说，它们可以从以下四个方面来应对这些挑战：

我们将

一、行业背景

由于智能手机制造属于典型的硬件工业领域，它就深深地影响着每个人的日常生活。

随着智能手机风口过去，手机公司可能面临许多挑战。一般来说，它们可以从以下四个方面来应对这些挑战：

我们将朝着开拓更高价值的市场前进作为首个目标，比如国际上的富裕国家或是我们中国本土的高端消费领域等等。

第二个方向是增加手机的附加值，例如提升手机互联网服务的平均用户收入（ARPU）。

第三个方向是增加新的运营主线，例如拓展智能穿戴设备或汽车行业。

第四个方向是提升渠道效率和营销模式，例如增加效果营销，或通过线下和线上渠道的互补来促进用户的粘性。

二、算法架构
近年来，在深度学习的推动下，各行业的智能算法架构基本上都采用TensorFlow或PyTorch作为底座，以此为基础进行构建，降低了技术门槛，同时享受到了技术红利，做出有行业特色的创新和优势。就手机行业而言，它既拥有互联网巨头的数据优势，又面临着制造业智能改造的挑战。

基础数据方面，手机增长算法所需的主要数据包括：

手机状态：一般是操作系统层面的各类字符串或数值类型的状态数据，主要用于建模用户生命周期。
商品属性：指待售商品的一些基本属性，如内存、大小、卖点、权益等。
订单数据：指用户购买手机时的关键数据。
营销投放：指在智能增长过程中关于用户的数据，通常包括RTA、RTB以及广告投放的数据，或其他消息日志。
实时行为：主要描述用户在手机上的部分实时反馈。
素材：为提升干预效果而准备的一些内容。
为了提升数据复用效率和扩展性，要在基础数据的基础上，做一系列标准化、规范化处理，再基于手机的流转关系抽取用户的流转关系图。这里的自然人是描述手机和自然人的映射关系。完成数据建设后，特征画像的建设和业界大多数做法比较相似，包括实时统计类、实时序列类、内容理解、用户长期画像，不过也有一部分是行业特有的，手机流转画像和营销节点画像，主要刻画手机市场的竞争关系和因应手段。

从工程层面，我们看下怎么解决智能改造的技术方案。最最侧的智选模块，完成算法场景的自动接入。手机增长涉及的链路很长，比如从新机卖点洞察、人群营销洞察、新机预热、首销、促销，并且每个链路的场景很多，智选主要满足了场景快速接入的需求，并且解耦运营、工程、算法，支撑算法专注在效果优化上。营销云主要用于素材生成、广告投放管理、分析监控。中间引擎模块是推荐引擎，通过召回、粗排、精排、重排、策略算子的自由组合，满足定制化需求。为了进一步提升引擎的灵活性，我们对多样性、多目标、重排、策略模块做了DSL改造，支撑团队的算法探索。另外由于机器成本的约束，上面的很多步骤在使用时都可以0成本的插拔，以降低延迟、提升吞吐。

三、应用场景
接下来将分享4 个具体的应用场景案例，第一个案例是基于 AIGC 的内容供给；第二个案例是在商城中，基于多场景、多目标、多模态的推荐；第三个案例是基于因果推断的精准人群定位；第四个案例是在手机行业里的广告精准营销。

1、第一个应用场景:基于AIGC的内容供给

首先，我们意识到在非算法领域或传统制造行业中，业务团队可能需要一些科普才能理解内容供给的重要性。因此，我们与业务伙伴合作时采用了讲道理和数据展示的方式，在一些小的场景中通过实验验证了扩大内容供给量的益处。我们观察到，通过增加内容供给量，可以显著提高点击率，获得15%的点击率提升，从而达成了共识。

目前，随着AIGC技术的不断成熟，我们调研了AIGC的相关方案，并发现该技术实际上可以增加模板的创作难度，同时增加信息量。因此，我们与相关的团队合作，引入AIGC技术来增加素材创作的信息量，以提升用户体验。

在生成部分，我们经过了多次尝试，以使AIGC输出的内容符合广告投放的需求。目前发现，通过添加关键词、卖点、营销话术、图文风格、负面反馈以及图像细节的提示，可以有助于生成素材。最右侧的示例展示了结合素材和模板生成的最终结果，其中背景图就是一个例子。

2、第二个应用场景:多场景、多目标的多模态推荐
如上图所示，我们目前的业务场景主要是在商城界面进行推荐。例如，在首页的横幅广告部分、格子位、瀑布流推送以及积分、社区、优惠券发放等场景中进行推荐。

在算法接口方面，我们已经接入了近几百个业务场景，需要关注点击率、转化率、GMV等业务指标。同时，手机行业内存在人力约束，这对算法提出了不同的需求。

我们一开始就采用了跨场景多目标的模型方案来进行推荐，随着场景的增加，我们不断对模型进行迭代优化。后来，我们还增加了一些非产品内容的推荐，例如社区、视频等。此外，对于内容素材的需求，我们也需要在多模态模型中引入一些新的能力。

经过多次迭代，包括增加更多目标、引入多模态、优化超参数等措施，相较于原有模型，我们在转化率（CVR）上取得了累计20%以上的收益。

3、第三个应用场景:基于因果推断的精准人群

手机行业中的“精准人群”概念与电商平台的划分有所不同，这是因为用户购买手机的行为具有不一样的特点。举个例子，假设用户A，他可能会选择继续购买当前品牌的手机，也可能会换到其他品牌。对于已购买当前品牌的用户，他们可能有两种行为，一种是自己使用手机（留存），另一种是赠送给他人。然而，由于线上和线下数据的隐私安全等问题，手机公司只能获取到部分购买和换机的数据。手机行业的增长目标是通过现有数据识别出购机和留存用户，并通过营销活动增加商品的粘性。这就是精准人群的背景场景。

在营销中，只有精准人群是不足够的，因为对于营销四象限图中的B、C、D三个象限的人群进行营销可能效果甚微，不符合预期。我们的核心目标仍然是针对A人群，因此这个问题实际上转化为一种因果推断的问题。

在算法层面上，在满足一定条件的情况下，因果推断可以等价于计算Uplift，这种模型通常有三种建模思路：

Two-Model：分别建模基准组、控制组的模型，两者相减就是结果。缺点是两个模型有误差累积。
Single-Model：参考推荐领域的多目标模型，解决了模型误差。
Direct-Model：直接建模ITE。
在典型的推广搜算法领域，假设训练数据和预测数据独立地分布，能不断产出很好的结果。在因果推断上，由于一个人要么有干预、要么没有干预，没办法在同一环境下同时观察到基准组、控制组的结果。因此需要使用因果模型来解决uplift建模问题。Uplift建模时有两个挑战：

我们是这么来看待这个问题，这个问题本质上属于曝光选择偏差的问题，需要对曝光bias给消除掉才能准确建模。我们参考了EUEN（Explicit Uplift Effect Network 显式提升效应网络）的论文方法，μt(X，最终的uplift) = μc(x, 控制组的转化率) + ω(X，曝光概率) · τe(X，曝光组的uplift)。基于样本是否曝光的修正，降低业务曝光选择偏差导致的模型有偏。

由于因果推断的反事实特性，上线验证成本很高，所有的优化都会优先在离线验证全部细节，离线保证了正确性，再开展线上实验。在当前的增量实验里能看到和最初的监督模型，在增量ROI上提升了11.3%。

4、第四个应用场景:广告精准营销

对于手机厂商来说，数据隐私是至关重要的，所有数据都必须保持在公司内部，不允许泄露。因此，在进行营销活动时，我们首先考虑的是数据安全性，在域外投放或者在其他广告平台基于人群包投放的这类方法是行不通的。我们采用了一些更安全的方法来获取流量，如实时API（RTA）和实时竞价（RTB）的模式。基于RTA和RTB，我们还建立了内部的营销云平台，用于整合不同渠道的流量，以提高迭代效率。

在RTB渠道的竞价过程中，模型主要考虑三个目标：竞价成功率、点击率和转化率。竞价成功率指的是在基础出价下成功获得流量的概率，该目标用于后续的价格调整策略；转化率指的是用户点击后进行转化的概率，该目标也会影响出价策略的调整，并且在很大程度上决定了整体投放的投资回报率（ROI）。

我们的目标是希望模型的预估值和后验统计值能够在相应的水平线上，以准确预估真实情况。通常情况下，原始模型和后验模型之间存在一定的差距，需要进行调整。我们当前的校准策略是采用了特征敏感的树模型的分享策略，参考了一篇22年的公开论文。相对于原有的模型，经过CTR分桶校准后的模型，PCOC值会下降约44%。PCOC反映了预估值和真实值之间的偏差。PCOC值下降意味着模型更加准确，相应的ROI也会有较大提升。

四、总结和展望

首先是新机洞察，这是增长的源泉，通过深入了解其中的逻辑，能够显着提升业务。这部分主要包括行业特点的分析，如竞品的卖点分析、同期市场的社会分析，以及可应用于营销的策略和首销期用户的反馈。

第二个是营销敏感人群，我们关注的是一些算法指标，包括准确率、召回率、AUCC（Average Uplift in Conversion Rate）和AUUC（Average Uplift in User Conversion）。后两个指标与因果推断相关。

五、问答环节

在多目标多估计部分，提到了超参数，对于超参数设定不同公司有不同的做法，就比如有的会采用CNN，或者有的会采用的实验的方法去确定，您这里是怎么去学习得到超参数的？
我们也试验过多种方法，比如说最开始的时候是基于经验参数，但是后来随着场景增多发现行不通，手工设定效率低且不科学，目前主要主要采用PSO 的方法，当然我们也在探索用强化学习的思路，但我们也发现强化学习对于收敛的要求很高，同时对数据量需求很大，在智能增长领域，我们的数据量是一大短板，我们不能像互联网行业的APP那样有丰富的日志数据，这也导致我们目前只能用 PSO 这种模型来去输出离线指标。

模型所用的样本是全样本包含干预组和控制组，然后我们会用模型学习用户被干预的概率，计算uplift。

所以说实际上是有干预实验存在的吗？是否是通过干预实验去收集了数据训练的模型？
是的，在这个实验里面，控制组是永远都存在的，剩下对不同人群进行干预得到数据。这个结果是非常令人震惊的，因为我们知道，人类的寿命一般都是比较长的，所以在这个实验里面，他们的寿命是非常短的。

（编辑：驾考网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!