查看原文
其他

解构多边平台: 一套数据驱动平台增长与异动归因的理论与工具

胡淏 狗熊会 2022-05-08

点击关注了解更多精彩内容!!


背景

最近用户使用时长下跌,为什么?

远期计划提升流量规模,怎么搞?

业务分析师经常不得不通过数据来回答这些通常来自高层的灵魂问题。之所以灵魂问题,因为这类问题通常针对一个顶层指标发问,却需要在指标背后纷乱繁杂的众多可能性中找到一个清晰的解释路径。和我一样,一开始不少分析师在面对这样的问题时会束手无策,产出的分析通常是数据的罗列但缺少洞见,或者结论脱离数据很难落地。但在我接触异动归因分析这一年多以来,也见识过一些非常棒的成功案例以及对口的理论方法。本文笔者将这段时间所积累的经验整理出一套方法,希望文中的理论方法还有案例可以成为分析师日常工作的工具。


解构多边平台

互联网+ 催生了大量的多边平台。这些平台的产品虽然相差甚远,但商业原理却很相近:它们都类似一个市场,有「卖家」和「买家」双方,市场则通过算法策略与机制设计来撮合买卖双方达成「交易」。例如,司机和乘客构成的网约车平台,通过分单来撮合司乘达成交易;配送平台,调度运力配送订单,在体验约束下优化人效;内容消费者与创作者构成的社区平台,通过算法来匹配内容需求与创作意愿来达成一篇内容的创作与阅读。我们统称这些商业模式为多边平台,它的主要职能是撮合买卖双方,也就是「供需」匹配。

平台的终极目标是流量与利润,因此每家公司的顶层指标(顶层指标:评估公司终极目标的指标)通常与 DAU(Daily Active Users,日活跃用户数)、时长、商业收入与利润有关。为了达成目标,我们日常的项目基本逃离不开这两个抓手:

1. 供需拉动:拉新,召回,供需结构优化

2. 供需匹配:算法策略,前端产品,平台治理,基础架构

平台加上活跃在平台上的供需作为一个整体就类似一个生产引擎:平台引入需求与供给这些生产要素,利用技术、产品与算法策略优化生产效率。给定一个用户需求,平台每次通过计算分发一个供给,这个供给是平台的一单位「产出」。一单位「产出」的例子比如网约车平台的一次司机应答,又例如电商、内容平台分发给用户的每一张卡片,本质上都是平台为了达成终极目标而分发给用户的最小内容子单元,一切用户体验与顶层指标的涨跌也都起始于这些最小内容子单元。用户有主动权选择是否消费平台的每单位「产出」,这进一步直接决定了平台的顶层指标。举例,类似知乎、快手这类内容平台,每一刻在线的用户就代表「需求」,而平台的内容池代表「供给」,平台通过卡片(最小内容子单元)形式将内容分发给用户,用户选择阅读卡片内容与否决定了平台是否完成一单位流量的生产。反过来讲,每单位流量的因果链条最底层是:用户是谁;分发的内容是什么;内容与用户是否匹配。

所以,‘最近用户使用时长下跌原因是什么?长期如何提升平台流量?’,时长、流量等这些顶层指标背后的因果链条最底层就是无数平台的一单位产出,顶层指标也就可以「解构」成这些产出与用户需求之间匹配程度的累加:因此为了回答这些灵魂问题,从事后归因角度,分析需要量化:过去平台分发的每单位产出对应的需求(用户)与供给分别是什么,供给质量如何;同样的,从远期规划层面,需要量化:什么类型的单位产出会给平台带来收益,这样的产出需要对应到怎样的需求与供给。

解构平台用到的数据相对简单,需要到一次分发粒度的数据中明确对应的用户与供给 ID 信息,但是需要相对完备的用户画像与供给画像数据做支撑。画像很重要,有意义的解构依赖于画像对需求与供给的有效拆解。

顶层指标的分析通常对应两个场景:

●  战略规划:分析通常要基于历史数据来测算未来相当长一段时间如何通过供需规模拉动来优化顶层指标。

●  事后归因:分析一般是对短期历史数据中体现的顶层指标异动做复盘,通常要从用户结构、分发结构、匹配效率层面快速定位原因与策略优化点。


长期规划多边平台与 Cobb-Douglas 生产函数

互联网虽然催生了许多在线的多边平台,但多边平台是非常古老的概念。一个国家就是一个多边平台,从经济产出水平层面可以将国家成解构成 GDP = f(L,K),其中 GDP 是国内生产总值,L(abor) 代表劳动力个数,K(aplital) 代表总投资。国家也好比一个生产引擎,吃进去投资与劳动力,产出 GDP。早在20世纪20年代,经济学家保罗·道格拉斯研究国家投入和产出相关性的问题发现,在1909-1918十年间,尽管资本/劳动力比率并不稳定,劳动力产出份额相当稳定,约为74%。他问他的朋友,数学家查尔斯科布,是否有任何特定的数学形式可以解释这一点。他们创造了最初的Cobb–Douglas生产函数: , 于他们1928年的论文《生产理论》中提出。Cobb–Douglas生产函数从此对学界与业界产生了深远的影响,在医疗、能源、供应链上面也有着广泛应用。最近 Başeğmez, Hülya 在美国经济增长研究中基于 Cobb-Douglas 生产函数对美国 1951-2008 年的经济数据进行建模,得到 。建模基于 log-log regression 得到参数估计,具体的,他们将 1951-2008 美国经济年鉴中每年的 GDP,L 劳动力,K 总投资数据提取出来,用线性回归对 进行参数估计,得出这个公式。Cobb–Douglas生产函数有着良好的业务性质:


1. 边际一单位生产要素对产出的价值可以量化,拿劳动力与单位投资对 GDP 的边际价值作为例子:由于 1.1>1,因此目前引入劳动力是存在递增规模收益(IRS)的,也就是每边际引入一单位劳动力对 GDP 的影响是递增的;由于 0.4 << 1,因此目前引入更多投资对 GDP 是存在递减规模收益(DRS)的,虽然投资还在正向影响 GDP,但是会愈加不划算。

2. Cobb–Douglas生产函数反映平台「跨边网络效应」的性质:网络效应是指一个产品用户规模的增长会正向影响每一个用户的产品体验,例如:电话、微信、wifi 万能钥匙。多边平台具有跨边网络效应,简单来说,就是「买家」规模增长会激励卖家参与,反之亦然,例如知乎、快手、淘宝、美团等,这些平台的收益与活跃的供给量和需求量的乘积成正比关系。依然用国家 GDP 作为例子说明 Cobb–Douglas生产函数对跨边网络效应的刻画:劳动力边际价值可以发现 K 递增时,劳动力对 GDP 的边际价值也会增加,资本可以为劳动力提供更优质的生产设备与技能培训,劳动力的生产效率也因此提升。平台双边之间通常存在跨边效应:越多的司机供给,乘客的发单意愿与转化率越高,因此每单位乘客产出 GMV 的速率会增加;内容平台提供越丰富的内容供给,消费者的浏览意愿越强,因此每单位消费者产生的阅读流量也越高。

Cobb–Douglas生产函数在业界的应用

留意Cobb–Douglas生产函数的两端,左边是产出,右边是生产要素与生产效率,参考前一部分对平台的结构,我们可以很容易找到适合于各类业务的定量框架,例如:

●网约车平台:GMV(Gross Market Value 总收益)= At

●内容平台:PV(PageView 总浏览量)= At

●外卖平台:

在不同时间片下,我们可以观测到产出、供给、需求的波动,基于 log-log regression对这些波动进行建模可以得到不同业务的参数估计,也就可以用来推断各种生产要素的边际价值与规模效益了。

在这个基础上,我们可以基于用户画像、供给画像对供需进行细拆,得到更具象化、更准确的供需模型。例如,网约车平台、外卖平台可以到城市粒度做分块建模,内容平台也可以具体到细分内容领域上面探究高价值的 DAU 与内容分别来自哪些渠道或者领域。因此,完备的供需画像会是Cobb–Douglas生产函数应用场景和价值的拓展。

Cobb–Douglas生产函数也常用于战略运营规划场景:平台战略规划本质上是在思考投资如何应用才能最大化终极目标提升这个有条件约束的最优化问题上面。我们以内容平台为例,运营层面通常具备能力估算每拉动一单位内容与 DAU 的成本,分别是 Cs,Cd,同时假设平台未来一年决定投资 I 在供需拉动上面,则最优的供需拉动策略可以从以下有条件最优化问题中得出:


短期诊断

短期诊断,就是分析推断业务核心指标近期涨跌的具体原因。业务在「短期诊断」上的诉求比「长期规划」要频繁甚至着急很多,因此对分析师做这件事情的效率有很高的要求。短期诊断本质上就是回答一个或多个「最近大盘指标 x 为什么跌了?」的过程。「大盘」指标是对一个业务下所有覆盖的主体进行宏观层面的刻画,主体可以是刚刚提到的用户、供给、或者是平台分发的每一条内容,而之所以称为大盘的指标实际是对所有主体的强调。具象化一点,我们用「活动后相比之前大盘(i.e. 全体活跃用户)用户留存下跌原因分析」作为例子。

大盘用户留存波动背后是一个复杂的系统:大盘留存波动背后是许多留存上涨、下跌的细分群体累加;同时具体到每一个用户留存虽然与平台分发给用户的每单位产出的质量脱不开干系,但是用户天与天之间在平台之外的生活、学习、工作、情绪这些「外生随机因素波动」也很大程度影响着用户的留存。因此,短期影响留存的因素大部分是独立于平台策略、原因不明的。分析师需要避免被一些细节数据缠住,清楚平台短期可能对用户体验产生的影响是什么,如何定量评估这些影响,这样才能从混沌系统中快速找到平台层面的原因,并针对关键目标用户群体提出业务可执行的策略建议。如果分析师可以围绕留存分析建立一套这样的分析体系并落地在周报解读上,长期对业务产生的影响会是巨大的。进一步展开讨论之前,介绍几个大盘留存的规律:


1. 大盘整体留存率波动的主因是两类波动的累加:a.  某些用户群体留存率的波动,b.某些用户群体的占大盘比例的波动。前者可能是平台策略变动的结果或者在反映策略接下来的发力点;后者通常是大盘用户结构的波动,与平台策略关系不大,也很难通过平台策略干预。

2. 用户群体留存率波动与平台相关的主要因素来自两类:a1. 业务策略或者基础服务变更/异常(e.g. 新产品发版;在线业务异常导致服务降级),a2. 当下平台分发的‘供给’(e.g. 内容、骑手、商品)与用户‘需求’(i.e. 对‘供给’的预期)之间的匹配程度发生变化。同时,数据层面可以有相对固定的分析框架与维度指标体系来识别 a1&2 两类因素,并同时提供策略优化点。

3. 在相对成熟的业务系统中,除非重大业务/基础服务变更或异常,平台很难对任何用户群体留存率产生 2% 以上的影响。同时,通过数据去发现或者论证平台之外的原因对用户的潜在影响是非常困难而且代价很高的。

4. 作为用户远期行为的刻画,留存即受到用户当期消费体验的影响,也很大程度上受到用户在平台之外因素频繁波动的制约。由于平台之外的因素很大程度上是不可知的,异动归因需要引入更直接反映用户当期体验的指标(e.g. 使用时长、转化率)作为留存指标的补充。

5. 只关注短期数据会让分析师进入过分解读的陷阱,拉长时间范围可以帮助更有效看清指标走势以及意义不大的短期波动。

在上述规律的基础上,用于短期诊断的分析框架依赖两个要素:快速拆清楚大盘用户与供给分发结构(i.e. 供需结构)的画像数据,和定量评估供需结构变化对顶层指标影响的计算方法。这个分析框架可以拆解成三个步骤:1. 定位目标用户群体;2. 聚焦目标群体,定位与平台相关的原因;3. 提供策略建议。

定位目标用户群体

将大盘用户做细拆是非常必要的。一方面,细拆帮助我们看清潜在体验出现问题的目标用户群体;另一方面,如果停留在大数层面去做推断可能会得到错误甚至相反的结论:「辛普森悖论」经常会体现在大数指标的波动上面。举个例子,某平台市场推广前后大盘整体留存率下跌 3%,这说明活动损害用户体验了吗?当细拆用户群体之后发现用户体验是全面提升的。如下图,活动大幅拉动了增量的新用户与沉默用户进入平台,用户占比均从 5% 提升到了 10%。在此基础上,活动对各个群体的留存率均产生 2% 的正向影响,因此该活动产生的正向收益是非常明显的。

这个例子中,大盘与细分群体的数据之间的相互矛盾就是典型的辛普森悖论问题:大盘留存率变化=f(用户结构变化,用户体验变化),忽略掉用户结构这个重要内生维度得到的相关性不能指向因果关系。所以,仅停留在大盘层面基于「大数」给出各种用户体验推断的时候,出错的概率就会大大增加。只有当我们聚焦在各个细分用户群体层面来看数据的时候,才能有效避免这类错误的发生。业务通常会在「大数」上产生不必要的困扰:决策层每天可能只会早上花个几秒时间扫一眼几个核心「大数」,根本没有时间精力去从成百上千个细分群体中找到「大数」波动的关键原因。这就需要系统的方法设计与数据产品落地来赋能业务解读数据的速度与质量,接下来主要分享下笔者在这个方法上面的沉淀与体会。

通过这个例子我们可以体会到,用户群体内部(接下来统称:种类内)留存率的变化与用户群体之间占比变化(接下来统称:种类间)都会影响大盘整体留存率。由于短期用户结构变化大概率是平台之外因素扰动导致大盘用户结构变化,业务会更多关注具体某个用户群体留存涨跌的原因,因此算清楚具体到每个细分群体的用户占比(种类间)变化与留存率(种类内)变化分别对整体留存的影响是很关键的:我们把这类计算称作贡献度计算。用同样例子(数据略有调整,见下图)来讲计算逻辑:对于某个用户群体,设该群体活动前后用户占比分别为 活动前后留存率分别为  大盘活动前后整体留存率分别为 Q1, Q2, 则:


1. 群体种类间贡献 = (q1 – Q1) * (w2 - w1)。种类间变化回答的业务问题:该群体占比变化相比不变化对整体留存产生的影响是多少?

a. 举例:沉默召回用户占比活动前后从 5% 涨到 10%,该群体活动前留存率与大盘整体留存率分别是 10%,65%。则沉默召回用户占比变动对大盘整体留存率产生的影响为 。如果该用户群体用户占比没有变化,则活动后大盘留存的理论值为

b. 以此类推活跃用户群体与新用户群体种类间变化贡献为 -0.5%,-1.8%,用户结构变化对大盘整体留存产生的影响是 -5%。

2. 群体种类内贡献 。种类内变化回答的业务问题:该群体留存变化相比留存不变对整体留存产生的影响是多少?

a. 举例:活跃用户留存率从 70% 跌至 68%,活动后用户占比 80%。则该群体留存率变动对整体留存率产生的影响为。如果该群体用户留存没有变化,则活动后大盘留存的理论值为

b. 以此类推沉默召回与新用户群体种类内变化贡献为 0.2%,0.2%,各群体留存变化对大盘整体产生的影响是 -1.2%。

3. 这种计算方式可以保证各个群体的种类间、种类内贡献累加等于大盘整体留存率前后的差值 

贡献度计算是可拓展的,当一个业务的用户画像体系建设很完备时,贡献度可以帮助我们快速找到关键的几个用户群体以及这个群体影响大盘的方式。

那谁才是真正要去重点分析的目标用户群体呢?笔者认为,相比分析某个留存率不变但占比波动的群体,分析留存率在下降的用户群体更有意义:因为后者更可能在反映用户体验的问题,可以通过分析找到一些短期策略优化点;但前者不同,由于留存稳定,占比波动更可能是平台之外因素扰动的结果,因此很难通过平台内部数据找到真正原因与应对策略。因此,为了提升工作效率,分析师有限时间内要去分析留存率显著下降的群体(上面的例子:目标群体就是活跃用户),根据种类内贡献大小排布优先级;对于仅仅占比波动的用户群体,客观向业务呈现数据之后,建议节省时间截止在第一步。

聚焦目标群体,定位平台原因

与平台相关的主要因素来自两类:a1. 业务策略或基础服务变更/异常,a2. 平台的供需匹配程度短时发生了变化。由于业务/基础服务变更/异常都是从某个具体的时间点开始对线上产生影响,目标用户群体是否受到 a1 影响可以通过常规用来扫描时间序列断点的统计方法来快速判定。本文重点讨论对 a2 的诊断分析。

如文章一开始所讲,一个用户的体验可以解构成平台分发的每单位内容与用户需求之间匹配程度的累加,用户体验受损则很可能在反映一定程度的供需失衡。在供需失衡场景,平台通常具备短时优化匹配效率的能力:无论是在高峰期配送平台对价格的动态调整,还是在某个热点引爆后内容平台倾斜分发热门内容,当平台具备识别供需失衡的能力,就可以通过调整分发结构来优化用户体验与平台收益。

供需失衡背后有两个潜在原因:平台分发的内容质量问题(简称分发质量),平台分发的供给结构问题(简称分发结构)。拿内容平台作为例子,分发质量问题意味着平台分发的内容不能满足用户需求,CTR、内容均阅读时长、内容变现率下跌是供给质量问题的体现;分发结构问题指的是分发的内容类型分布不合理造成体验下降,例如整体分发内容中视频、各个领域内容的分布改变就会造成用户体验的波动。我们可以使用在步骤一相似的方法来去定量测算不同类型内容的质量与占比变化对用户体验的影响。还用上面的例子,聚焦在目标群体,具体分析平台一段时间内分发给活跃用户的内容结构与质量数据:

实际上,评估内容结构、质量对体验的影响与评估用户结构 、体验对留存的影响使用的是一个计算方法。唯一变化的是主体与评估指标:主体从一个用户到平台分发给用户的每个供给,指标从留存率变成了评估分发质量的指标,在这里是CTR(点击率)。贡献度输出的种类间变化与种类内变化分别在量化分发结构变化与分发质量变化对用户体验(CTR)产生的影响。同时,内容分发有个内在的逻辑,就是当一类内容被倾斜分发的时候,通常会影响其分发的质量,因此在供给分析里面,通常分发质量与分发占比之间是此消彼长的。这时,评估一类内容倾斜分发整体对全局体验的影响就是该类内容种类间与种类内贡献的加和。例如,上图案例中视频内容在活动中做了倾斜分发,占比从 20% 涨到 30%,同期视频分发质量从 32% 跌至 28%,活动前大盘整体 CTR 30.3%,因此分发占比变化对整体 CTR 的影响是正向 0.2% =(32%-30.3%)*(30%-20%),分发质量的影响是显著负向 -1.2% = 30%*(32%-28%)。总体来看,视频内容倾斜分发负向影响了活跃用户群体的体验,如果没有进行倾斜分发,活动后 CTR 的理论值为 29% - (-1.2%+0.2%)= 30%,构成了目标群体体验下跌的主要原因。

贡献度在诊断各类业务核心指标波动原因上具有普适性。无论是分析内容社区的留存率还是物流配送时效性,亦或从线上算法准确率到投资组合收益率,这些指标的波动本质上都是一类问题:从数学角度去看,这些指标都是先将一个总体按照细分维度拆解成若干细分群体,然后将细分群体指标依据群体占比来加权平均。本文例子中,「定位目标群体」环节是将 DAU 作为总体,用户画像作为维度,留存率作为指标展开分析的;「定位平台原因」环节是将平台分发给活跃用户群体的内容作为总体,内容画像作为维度,CTR 作为指标展开分析的。进一步讨论,一个加权平均数变化的原因要么是「某项的权重(占比)」发生变化,要么是「该项的取值(指标)」发生变化,因此种类间、种类内贡献的计算定量解释了加权平均数变化的原因;

由于贡献度计算视「总体」、「指标」、「维度」为可以灵活调整的「参数」,所以这个方法普适于与各类业务核心指标的异动归因与诊断。在下面提供策略建议环节,我们依然会用到这个方法。


提供策略建议

诊断分析需要具备提出有效策略建议的能力,因为只有业务因为分析发生了改变才是分析价值的真正体现。「定位目标群体」环节无法提供有效策略建议,因为「提升活跃群体留存」虽然算是个建议,但是「如何提升该群体留存」依然是个灵魂问题。造成这些困惑的主要原因是因为分析没有拆解到业务抓手层面。什么才是真正的业务抓手呢,从内容平台业务来看,除了基于 AB 测试上下线业务策略还有修复明确的基础服务故障,短期的抓手无非是改善分发结构或者是在产品之间做导流。例如上面例子就可以作为调整分发结构的依据,可以通过「综合贡献度」发现视频 + 文章的倾斜分发会负向影响活跃群体的用户体验,因此策略上应该短期针对活跃用户群体适当控制视频、文章的倾斜分发力度,在新用户与沉默召回用户群体保持原有分发策略。

产品之间导流也通常是一个有效短期改善体验的策略抓手,平台时常与用户之间存在一定程度的信息不对称从而造成分发效率低下:例如在内容平台,不同用户浏览内容分散在首页、关注页、热榜、圈子等入口,但是一个具体用户的消费习惯会相对固定在一个产品内部,可能也不愿意付出成本来探索其他产品的消费体验。同时,一个用户在不同时间与场景下在一个产品的消费体验是不可预期的,例如热榜通常在有外源热点的时候才更大概率出现优质内容,这些不确定性进一步限制用户主动探索不同产品的动机。我们可以通过贡献度来分析各个产品线的数据来寻找潜在的信息不对称可能,并找到产品之间导流的方案。例如如下数据,通过综合贡献发现显著负向与正向影响活跃用户体验的产品线分别是推荐与热榜,这说明将推荐页用户短期引导至热榜消费可以缓解活跃用户群体的体验问题:

 

总结

平台的终极目标是流量和利润,需要持续迭代优化平台背后的数学模型从而让我们看清这个看似混沌的系统。本文认为平台本质上在通过供需拉动与提升匹配效率两个抓手去优化平台的终极目标:类似一个生产引擎,平台输入供需,产出最小内容子单元。流量、利润等顶层指标也就可以「解构」成这些产出与用户需求之间匹配程度的累加。

平台长期战略规划通常涉及供需规模拉动的成本收益估算,我们可以基于 Cobb-Douglas 生产函数作为技术选型来估算远期一单位供给与需求的边际价值、规模效益和网络效应;也可以用来解决给定资本投入情况下供需拉新资源最优化分配的问题。

平台短期诊断需要围绕顶层指标波动快速定位平台相关原因并提出有效策略建议,这就需要系统的方法设计与数据产品来保障分析速度与质量。具象化一些来讲,分析师要持续完善供需画像体系,并迭代异动归因的方法论与工具。方法论层面,我们建议先定位目标群体然后再分析具体原因并提出策略建议这样由浅入深、从总体到个体的分析方法;工具层面,我们提出贡献度计算方法,该方法输出的种类内、间变化有很好的业务性质,也是解决指标异动归因的通用框架,从定位目标用户群体到分析用户体验波动原因,我们可以通过在贡献度计算中调整总体、指标、维度这些参数来灵活解决各类异动归因分析问题。


【作者简介】

胡淏,毕业于哥伦比亚大学,一枚热爱统计学、经济学的数据科学家。先后在蚂蚁、滴滴、知乎等互联网公司研究和落地数据驱动解决方案。了解风控、网约车与即时配送、内容社区等业务的领先算法与分析解决方案。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存