不懂数理和编程,如何运用免费的大数据工具获得行业洞察?

业界 2018-11-02 12:08:23 阅读674

最近一个朋友想创业,做母婴方面的项目,之前没做过该类项目,有了几个备选项目,分别是产后恢复、婴儿游泳、月子餐和月子会所,这些他都觉得不错,所以就有点选择恐惧症,想知道做哪个case有搞头。因此,让我帮忙分析分析一下哪个方向比较好。

其实,仔细分析朋友提出的这个问题,我瞬间联想到许多:

  1. 哪个方向的发展趋势/市场前景良好?
  2. 这个方向有哪些规律性的东西值得注意?
  3. 这个市场的目标用户的特征、属性怎样?
  4. 与相关方向的关联性怎样?(同属母婴行业,相关性强的话可以进行资源整合和置换)
  5. 这个方向的目标用户关注什么?

这几个问题,归结到2点,就是市场行情和用户画像。如今是互联网时代,凡事都讲求“大数据”,强调“用数据说话“,观察相关数据的变化情况并进行分析和逻辑推理,能大体判断出创业的趋势是否已经到来,或者创业时机是否已过去。

说到这里,其实可以用到一个工具—某度旗下的某度指数(最近它太坑了,引起了公愤,不想给它做免费广告,但又要用它,请谅解我这种矛盾的心情。。。)

言归正传,接下来,我会用朋友提到的四个关键词作为case,对百度指数这个大数据工具的应用进行一个较为详细的讲解。首先,先稍微科普下百度指数方面的相关知识:

一、关于百度指数的基本知识

(一)什么是百度指数?

为什么是百度指数,而不是搜狗指数、360指数或谷歌指数呢?原因在于,前两者的搜索引擎使用的人太少了,谷歌指数,更确切是说是谷歌趋势,由于众所周知的原因用不了,而且翻墙后还是英文。。。百度作为国人使用频率最高的搜索引擎,它的指数还是能很大程度上反映网名的搜索情况和需求。

从百度指数中,我们可以了解到:

  • 某个关键词在百度的搜索规模有多大;
  • 关注这些词的网民是什么样的,分布在哪里,同时还搜了哪些相关的词。

(二)包含哪些部分?

百度指数的主要功能模块有:

  • 基于单个词的趋势研究(包含整体趋势、PC趋势还有移动趋势),间接反映关键词对应细分市场的整体趋势
  • 需求图谱、舆情管家、搜索相关词
  • 人群画像(地域分布、人群属性、性别属性)

(三)能干啥?

概括来讲,百度指数能解决如下3个问题:

  • 问题1:相关关键词搜索在百度搜索中的比例大约是多少,发展趋势是如何的?
  • 问题2:目标人群搜索兴趣分布是怎样的
  • 问题3:一个热门领域的兴起及发展速度,比如跨境电商行业

具体来讲,百度指数在如下方面可以对个人和企业的决策起到一定的帮助。

1、对于个人:

  • 置业时机
  • 报考学校
  • 入职企业的发展趋势
  • 约会

2、对于企业

  • 竞品追踪
  • 受众分析
  • 传播效果

需要声明的一点是,百度指数是相对靠谱的,基于以下原因:

  1. 百度指数基本反映了关键词被搜索的频繁度,但应该是经过加权过滤算法处理的,所以不是直接的搜索次数;
  2. 两个百度指数之间是可以对比的,也就是相对差别是可信的;
  3. 百度指数可以作假,不止一次出现过刷百度指数的情况,如果有这方面的怀疑,可以结合其他数据验证;
  4. 人群属性的分布误差更大,比如家长和小孩共用一台电脑的情况,但仍然是那句话:相对值是可信的。

好了,马上上干货,满满的干货:

二、哪个方向的发展趋势/市场前景良好?

学会用 “数据”、特别是 “数据变化率” 来判断行业/细分市场趋势的创业者,而不是凭借感觉,或人云亦云者,比那些不懂得用数据及数据的变化率提前解码 “趋势” 的竞争者要高出几十倍的创业成功概率!

打开百度指数页面,分别输入“产后恢复”、“婴儿游泳”、“月子餐”、“月子会所”,这几个关键词,并用逗号隔开,键入之后的结果如图1、图2所示。

    

图1  几个搜索关键词的百度搜索指数概况

    

图2  几个搜索关键词的百度搜索指数趋势

从图1可以了解到几个重要的指标,这些关键词在近7天和近30天的搜索指数概况(整体搜索指数和移动搜索指数),整体的环比情况(是本期统计数据与上期比较,例如2014年7月份与2014年6月份相比较)和同比情况(与历史同时期比较,例如2014年7月份与2013年7月份相比),以及移动搜索方面的环比和同比,后者对于移动互联网时代来说,具有很强的参考性。

图2中反映了近五年(2011~至今)的各个关键词的搜索指数的历史变化情况,以曲线的形式呈现,间接反映了这几个关键词所代表的细分领域近5年大体上的市场需求及热度变化趋势。在VUCA时代(宝洁公司首席运营官Robert McDonald借用一个军事术语来描述这一新的商业世界格局,即volatility,易变性;uncertainty,不确定性;complexity,复杂性;ambiguity,模糊性),五年的时间足以在宏观上反映一个行业或细分市场的生命周期。其中,呈现的曲线需要从2个方面进行分析,即整体趋势和局部的波动,整体趋势反映了关键词所代表的细分领域的行业发展趋势,而波动就比较复杂了,既有突发的,也有规律性的因素存在,这个紧接着我会讲到。

结合图1和图2来看,这几个关键词所代表的母婴行业细分领域都呈现上升的势头,表明它们所从属的整个母婴市场的前景良好,宝爸宝妈们对于哺育婴童,调理身心方面的市场需求一直存在且不断扩大。“月子餐”无疑是这几个关键词中整体和移动搜索指数最高的一个,这间接反映出“月子餐”这个母婴细分市场的目标人群搜索次数较多,间接反映出这个方向的市场需求较旺盛,而且它的整体同比上升97%,也就是时隔一年,市场需求增长了近一倍!而且它的移动搜索指数较去年同期增长近一倍,表明它的移动互联网属性较强(在了解或寻找该类产品时,用户更倾向于移动端)。

三、这个方向有哪些规律性的东西值得注意?

分析了这四个关键词所代表细分市场在“年”这个跨度上所反映的整体趋势, 这是宏观上的分析。然而,在移动互联网时代的创业,是基于数据变化研究的知识技术密集性创业,需要我们进行更细致、更微观一些的分析,不仅要从以 “月”、以 “季度” 为单位观察数据变化,更要学会以 “周” 为时段单位观察数据变化并积极探究其中的规律或问题,为创业行动前积累大量精确有益的知识。

导出2011/1/1至2016/6/16期间的百度指数源数据,见图3的原始数据。将该原始数据处理下,在“日期”和指数之间再添加一列,输入函数“=WEEKNUM(A2,1)”( 括弧里第二个数字1,说明一周开始于星期日,如果数字为2,则说明一周开始于星期一),形成“周数”这一列,且将“日期”一列的格式改成只显示“年”,如图4所示:

图3 百度指数导出的搜索指数的原始数据

图4 经加工后的搜索指数数据

因数据量太大,仅以“婴儿游泳”这个关键词举例,再对上表数据进行整理,得到如图5所示的周搜索指数的热力图表格,其中每周的周搜索指数是当周7天搜索指数的算术平均值,表格根据数值的从大到小的变化,对应的颜色也由暖色到冷色,可以很直观的从纵向(每年的周搜索指数变化情况)和横向分析(不同年份各周的同比搜索指数变化情况)近5年周搜索指数的情况。                          

图5 “婴儿游泳”近5年周情况搜索指数热力图

如果该图仍不明显,可以将每一年的数据做成曲线(见图6),可以看出大概的周期性趋势:

     

图6 “婴儿游泳”近5年周情况搜索指数折线图

从上图明显可以看出,每年的第18周到第40周,即4月末到10月初,下半年,是婴儿游泳的旺季,这时候宝爸宝妈想让孩子体验游泳的意愿更强烈(虽然科学上讲,夏季游泳对于宝宝的抵抗力提高不了多少,并不是最适宜的季节,气温温差变化大,在此时多游泳能锻炼宝宝对温度的适应力,从而增加抵抗力,是最优的选择,但是顾客是上帝,他们要来我们只得奉陪到底咯),商家可以在临近这个时期前做好承载的准备。在此之前和在此之后则是淡季,生意会相对冷清一些。

总结并补充一下,造成搜索指数波动的原因可以分为以下几种原因:

1、时间方面的因素

包括季节,周末及节假日。比如百度指数搜索“4399”,就呈明显的按星期的周期波动(周末及节假日高,工作日低),这是用户分布和使用习惯的体现;再举受个季节性因素影响的例子(见图7),“羽绒服”在百度指数上的变化情况,很明显是秋冬季处于上扬态势,夏季处于低谷状态。

       

图7  “羽绒服”2011~2016(6月份)的百度指数变化趋势

此外,还有优酷的例子,优酷的百度指数,基本是每周六拉出一个高峰,因为周六是互联网人群看视频的聚集时间,但是这个规律在春节期间被彻底打破。

2、品宣和广告

地铁/公交广告、户外广告以及流媒体上的广告,对于百度指数的影响非常大,能够在短时间内迅速带动其关注度的大幅提升。 比如,《太极侠》这部电影,虽然是基努.里维斯主演的,号称具有浓厚中国风的“大片”,靠广告效应吸引了公众的大量关注,搜索指数上映前一段时间猛涨,但根据后续的观影反应,以及百度指数的“华山式”骤降,它毫无疑问是一部烂片。.

3、现象级事件

网络时代,爆红的现象越来越频繁,每年至少有个几遭:有凤姐、叶良辰这样的草根英雄,也有各种正规军的IP内容,如琅琊榜、欢乐颂,友谊的小船说翻就翻等。

4、舞弊

创业公司也知道投资人越来越依赖于百度指数来做投资决策,于是有人就开始刷百度指数。

四、这个市场的目标用户的特征、属性怎样?

在百度指数人群画像里,可以看到3个描述目标用户人口统计学特征的指标,地域分布、年龄分布和性别分布。

(一)地域分布

百度指数的地域分布由大到小分为3个层级,即区域、省份和城市,图8是“产后恢复”所反映细分领域的目标用户地域分布情况,由此可以看出,华东总体的搜索该关键词的人数较多,间接反映该区域的用户对“产后恢复”这方面的需求较旺盛,但从省份来看,广东在这方面的需求量最大,其次是江苏和浙江;从城市层面来讲,北京又居于首位,广、沪居次席。

             

图8 “产后修复”目标用户分布(按区域、省份和城市)

图9反映出目标用户的年龄主要集中在20~39岁这个区间,对应的是青年和中年女性群体,且以30-39岁的大龄人群居多,结合上图目标人群的分布情况(主要分布于一线沿海城市),再联想到晚婚晚育人群多出现在高学历高收入的白领精英阶层。但性别分布不太符合常理,绝大部分是男性群体。不过,我们可以这样理解,存在宝爸和宝妈共用一台电脑的情况,或产后阶段宝妈接触电子设备的时间不多,宝爸会按宝妈的需求进行搜索,所以性别属性的分布误差会大一些,但这点不影响我们对目标群体的判断。

      

图9 百度指数 “产后修复”目标用户的年龄分布和性别分布

当然,为了保险起见,可以结合参考价值小一些的360指数作一定补充(见图10、图11).在360指数中,关于人群定位,也就是描述目标用户人群生活习惯、喜好的部分,我们可以看到搜索“产后恢复”的人群里大都是喜爱看影视剧的粉丝、爱好体育健身者,以及购物达人。

        

图10 360指数“产后修复”目标用户的年龄分布和性别分布

     

图11 360指数“产后修复”目标用户的年龄分布和性别分布

通过上面信息间的相互补充和印证,加上我们日常的认知,可以得到目标用户的人群画像,见图12,这些信息对于后期编撰营销软文和投放广告渠道很有帮助。

                   

图12  经综合分析得出的关于产后恢复目标人群的用户画像

五、与相关方向的关联性怎样?

通过这些关键词的日期&搜索指数源数据,可以分析一下它们之间的关联度,看其中某个业务是否可以在后期进行延伸,或是和其他商家进行资源整合/置换。在excel中,运用CORREL函数求出这四个关键词的相关系数,可以得出它们两两之间的相关密切程度,进行相关性分析(见图13)。可以看出,婴儿游泳与其他几项的关联性不强,产后恢复、月子餐和月子会所两两之间的关联性较强,它们之间可以采取客源共享、优惠联盟的合作方式。 

图13 四个关键词的相关矩阵

六、这个方向的目标用户关注什么?

需求图谱提供了中心词搜索的需求分布信息,通过它可以了解到网民对信息的聚焦点和产品服务的痛点。比如“产后恢复”的热门需求词包括“产后同房”、“产后如何保持好身材”、“瑜伽”、“身材”、“减肥”等,这说明目标用户在搜索“产后恢复”前后的相关关注主要体现在这些方面(见图14)。值得注意的是,通过滑动底部的月份控件,我们可以看到不同月份关于“产后恢复”的相关词搜索情况,这里选取的是四月份和六月份的情况。

接着我们进行横向分析和纵向分析:横向分析,越接近中心深蓝色的“产后恢复”说明搜索词出现的次数越多,可见目标用户对于“产后同房”、“产后如何保持好身材”、“瑜伽”、“身材”、“减肥”这些话题很感兴趣,可见搜索这些关键词的人对于产后恢复方面的常识了解甚少,这是经营该方向需要注意的地方。越远背景色越浅,说明需求者对于这些词需求越弱;纵向分析,黄色圈全部都是近期被搜索次数逐渐增长的搜索词,反之,绿色的词搜索的人越来越少,图14中的“瑜伽”在四月份搜索的人较多,但在六月搜索急剧减少;“减肥”这一关键词则相反。

         

 图14 “产后修复”目标用户的需求图谱(4月份和6月份)

         

图15“产后修复”相关词分类—来源检索词和搜索指数

         

图16“产后修复”相关词分类—去向检索词和上升最快搜索指数

图17显示的是“产后恢复”的新闻监测部分,我们需要去伪存真,去除掉明显跟行业无关的信息,如A(广告)、CFGHJ(娱乐新闻),广告、娱乐新闻和歧义信息都需要排除掉,它们对于挖掘“产后恢复”这一细分市场的需求价值不高。

       

图17“产后修复”的舆情监测和媒体报道

         

图18 百度知道上关于“产后修复”的相关问题

图14到图18部分需要结合起来看,相互补充和相互印证,需求图谱中反映的与中心词“产后恢复”有关的相关词,我们只看这些词还无法得到详细、准确的信息,比如“(产后)同房”,通过百度知道的问题部分,我们了解到目标用户想搜索的其实是“产后恢复较慢,到42天恶露才排干净,多久可过XX生活呢?”和“妻子作了剖宫产后恢复顺利的情况下多少天后可以行XX?”

综合上述分析,搜索“产后恢复”这一关键词的人群对产后身材方面的知识(如产后能否XX、如何恢复身材、产后饮食禁忌等)较匮乏,需要经营者能够对其给予有益的指导,在产后恢复方面拥有较强的专业度。同时,这些搜索相关词也可以作为网名优化数字营销活动方案的风向标。

结语

定性分析有时比定量分析重要,分析数据背后的实质比分析数据要重要。

为什么要看百度指数?因为在某一特定时间内,的确能看得出来用户对某一个关键词的关注程度,来看看这个关键词、产品、网站是不是有一定的(传播)效果。

在使用百度指数的同时,也要结合其他数据分享平台,如360指数、阿里指数、百度搜索风云榜和谷歌趋势(Google Trends)来进行补充和印证,综合参考,从而得到更全面、更准确的市场信息。

百度指数的用途不限于我上面讲到的,它还可以用来进行两个同行/竞品的百度指数比较;(如同程和携程),以及同一品牌在活动推广之前和活动推广之后的指数差异。

用好百度指数的关键在于能了解足够多的关于关键词的行业相关背景知识,探究数据起伏波动的原因,以及对数据足够敏感,见微知著,一叶知秋。


·END·