技术解读DMP:个性化推荐的基础

业界 2018-11-02 12:08:23 阅读462

周涛博士曾经与人合著过一本书《个性化:商业的未来》,描述了大数据时代中商业的变化,这些变化我们已经逐步感受到。不管你是不是新注册的用户,你登录电商网站或者打开电商的 APPs 后看到的信息是个性化的;所看到的互联网广告是个性化的;收到的优惠券也是个性化的。


在层出不穷的商业个性化背后是个性化引擎,而其中的关键则是DMP(数据管理平台)。因为个性化推荐的“比较优势”主要体现在,作为个性化推荐依据的“数据”,而不是算法和技术。DMP 正是利用大数据技术从海量杂乱的数据中抽取出有价值信息的重要基础设施!

DMP 的概念由互联网广告界发扬光大。在那个世界里面,DMP 通过 JS 插码和 Cookie 获取了大量的用户访问信息,然后将其加工成为用户关注类和购买类标签,提供给 DSP 或者 ADX 用于 RTB 竞价。

是 DMP 的发展促使广告的程序化投放向 RTB 演进,艾瑞咨询的报告显示 2013 年美国 RTB 展示广告已占数字展示广告的 19%。TURN、bluekai、品友、易传媒是广告行业中 DMP 的佼佼者。不过随着 APP 逐渐占据了流量的主流,原有通过 JS 和 Cookie 获取数据的 DMP 模式需要改变。

从本质上来说,广告的 RTB 是个性化推荐的一种,推荐的依据是历史浏览行为,推荐的东西是广告。个性化推荐的应用范围很广,比如在“今日头条”、“网易新闻”APP 上对新闻的推荐;京东、一号店上对物品的推荐;起点、手机阅读上对图书的推荐;社交网络上对好友的推荐;应用市场上对应用的推荐...... 在这些个性化推荐的背后,都离不开 DMP 或者功能类似的平台。

个性化推荐回答了依据什么样的数据,在什么场景下给访问者推荐什么东西的三元组问题,其中 DMP 承担提供依据的职责。对 DMP 来说,最关键的有两点:1)如何收集和处理作为判断依据的数据;2)如何建立一种ID体系来使得收集的数据和使用方的数据能够对应起来。在互联网广告中上述两个关键点分别是浏览记录和Cookie ID。

在大数据时代,任何拥有数据的企业和实体,都可以依据 DMP 的模式,将数据整理为决策依据提供给有需要的企业和实体,由此实现数据变现。这种方式可以自动化实现、可以有效评估数据的作用,是当前最靠谱的数据货币化方式。

比如百分点,利用从电商网站、社交媒体、第三方收集来的数据,形成用户关注和购买标签,通过 DMP 的形式提供给电商或其他所需的企业进行个性化推荐。这个时候数据的使用方相当于互联网广告产业链中的 DSP。百分点的 ID 体系通过 cookie 或者 IMEI 来实现。

又比如 TalkingData 的Mobile DMP利用了自己在全球 8 亿用户的 APP 中的插件收集的数据,以及与各应用市场等第三方合作的数据来分析用户的行为、兴趣、爱好,形成用户精准画像通过 API 的形式对 APP 开发者提供。APP 开发者完成类似 DSP 的功能,可以自己组织推荐的内容,包括广告、数字内容和物品等。TalkingData 利用自己的 ID 体系(TDID)来实现关联。

拥有数据才能做 DMP,因此几大互联网巨头当然最具备做 DMP 的资格了。腾讯利用 QQ、微信等众多应用中收集的数据分析用户的行为,然后通过广点通实现个性化广告的推荐,似乎还没有听说腾讯准备单独将 DMP 的能力对外提供的举动。

相比起来 Facebook 已经这样做了,如果用户在其他应用或者网站使用 Facebook 的 ID 登录的话,Facebook 就可以将自己的 DMP 提供给对方,供其完成个性化推荐。

阿里巴巴也在尝试将积累的用户标签通过阿里妈妈的广告交易平台 TANX 提供出去,现在还没有说要收费,但也许以后会有商业化的运作,毕竟跟没有这些数据相比,DSP 们更值得 RTB 了。

百度也具备这样的能力,因为搜索关键词和随后的点击是最能直达使用者内心世界的数据,可能因为百度的 ID 体系较弱吧,尚未听说百度有计划将其打造为 DMP 的方式帮助其他 APP 和网站做个性化推荐。

移动互联网改变了一些东西,比如 Cookie 的逐步消失,因此那些从网站或 APP 内部收集数据的企业有能力颠覆以前通过 cookie 收集用户行为的 DMP,因为他们有独一无二的用户行为数据。但是慢着,云——管——端,用户数据流经的各个环节也许都有潜在的 DMP 生意可以做!

大致上讲阿里、腾讯、百分点(电商对接数据部分)可以算是云范畴做 DMP 的,百分点(JS 获取数据部分)和 TalkingData 的 SDK 插件数据算是端范畴做 DMP 的,那么这样分析来,应该还有两类重要的可以做 DMP 生意的企业。

一是终端厂家。比如小米、苹果等,实际我了解到小米正在基于终端上采集的用户信息做自己的 DMP,或许年底就能商用,ID 体系或许就是 IMEI 等终端 ID。二就是运营商,集奥聚合、亚信等公司依托和运营商的良好合作关系通过网络侧进行 DPI 的方式获取用户上网行为数据,并将其打造为 DMP 能力对外输出。

大数据时代已经拥有数据的企业是幸福的,但是还是有一些公司,利用自己的技术和算法征服了垂直电商,在提供 DMP 服务的时候同时获取数据,由此而进入了良性循环,不断增加的数据量和维度引发了网络效应,使得数据的价值按照 N 的平方的曲线增加。

就像一个巨大的飞轮,也许开始推动它的时候比较吃力,但是等它动起来以后,就可以轻松地让它持续运转。DMP 们如何找到自己的飞轮,是其爆发的关键所在。