产品设计体会(1013)日志分析的商业价值

最近和不少人聊到数据分析的话题,所以举个小例子,证明一下数据分析确实是能转化为商业价值的。整体的思路是:在对产品足够熟悉的基础上,先做出方向性的假设,再提取相应的数据并分析,得到一些现象,最好是之前没发现的现象,然后尝试解释,接下来做用户调研修正解释,最终指导产品发展方向。

2008年底的时候,对手头一个产品的用户数据做过一些分析(因为是企业用户,所以下文中“用户”与“公司”其实是一个概念),发现了一条很销魂的曲线,由于更详细的数据不便公布,所以仅就一点为例谈谈。我们的目标是希望产品的用户能更活跃,活跃的一个指标就是更多的登录,所以方向选定,尝试分析登录日志。

直接上图,图中的横轴是把所有付费用户的第一次登录日期对其(表征“开始使用”),查看他们在此之后6个月的活跃情况;纵轴是这几千家公司的总体活跃情况(可以简单的理解成纵轴数值越高,用户登录越多),可以看到,活跃公司的比例变化明显分为4期,特别是14个月之间出现了先下降再上升到现象,于是我们先尝试着解释:

该产品是通过经销商销售的,在卖出去之后,经销商也会登录产品帮助用户做一些辅助工作,所以产品的登录行为有经销商登录和用户登录两部分,虽然在技术上无法区分,但两种行为确实各有特点。

第一阶段:1个月,活跃度考察的是1个月内用户的登录多少,所以30天内活跃度不断上升达到峰值,约60%。这段时间内,经销商登录较多,帮助用户初始化。

第二阶段:13个月,活跃公司比例缓慢下降到约40%,其间包含两部分,经销商行为和用户行为:

Ø 经销商行为只有一个作用:衰减,这个衰减绝对比图中的更陡峭;

Ø 用户行为有两方面:衰减与增加,而增加是大于衰减的,从第三阶段可以看出;

第三阶段:34个月,活跃公司比例逐渐上升到60%,这是因为到3个月之后,几乎再没有经销商行为了,完全是用户登录,并且经过34个月的使用,用户已经通过产品带来实际价值,所以使用的更多;

第四阶段:4个月以后,稳定在60%弱一点,进入动态平衡期。

接下来我们为了验证上述观点,做了一些电话调研,试图区分出经销商登录和用户登录,果然让我们发现,两种人的主流行为是通过不同入口登录的,经销商通常从A入口登录,因为他们要做的辅助操作从这里做方便,而用户通常从B入口登录,因为日常操作更多在这里。

由上述分析,可以分离出经销商和用户两种登录行为造成的曲线,按理说应该分开画出两张图的,可惜时间太久,我看了一会日志分析的代码发现搞不定,暂时作罢,等有机会拿最新的数据再看一次,它们的叠加就是上图,手绘的凑合看看。

好,问题来了,分析着玩儿的么?商业价值呢?有两点。

一方面,我们会考核经销商手下用户的活跃度,目的当然是为了让他们更多的服务用户,指导用户使用以促进活跃,但有的经销商会耍小聪明,通过自己登录来忽悠我们。原来我们很苦恼,现在似乎可以通过登录行为的分析,对这种情况做一个粗糙的判断,如果有些用户登录的增加是A入口为主,再关联这些用户的经销商分析,就能够找出作弊的经销商,以示惩戒。

另一方面,这次分析告诉我们,对我们有实际意义的是用户从B入口的登录,所以产品的优化重点应该放在B入口,另一个数据也证明了上面的推论:有某种登录行为的群体,在出现该行为后几个月的活跃度情况,如下表。基本上只要出现过“B入口登录”,之后用户的活跃度就会很高,是真正的用户登录,事实上,这次数据分析指导了产品改进,后来,我们对B入口登录的引导做了很多事情,比如降低门槛,运营推广,在宣传手册、光盘上重点说明等等,起到了不错的效果。

出现某种登录行为的群体

1月后

2月后

3月后

A入口一周内登录>=2

68.7%

56.8%

58.1%

A入口两周内登录>=8

92.0%

81.8%

78.1%

B入口一周内登录>=2

95.4%

91.2%

87.1%

B入口两周内登录>=8

99.6%

96.4%

94.4%

本文中的数据是用Matlab做的分析,这是个巧合,正好上学的时候一直拿它做数据挖掘。常有这种体会,之前学过的东西,当时不知道有什么用,多年以后说不定什么地方还真的用上了,很爽

我爱民科,嘘嘘的抢坑位模型

前言

每次嘘嘘的时候都很无聊,所以脑子里总在想点东西,几个星期前开始,思考的内容就统一为“我会选哪个坑?有什么原则?同学们选坑位是什么原则?这些原则会导致各个坑位使用率不同么?”,到了最近,实在忍不住了,就建了个模型仿真了一下。

 

模型假设

继续阅读我爱民科,嘘嘘的抢坑位模型