腾讯QQ大数据:BI方法论-数据体系建设之路
作者:媒体转发 时间:2018-07-01 21:17
当一个企业要建立数据体系,它需要什么样的流程?当一个新的产品上线,它需要怎样建设业务的数据体系?这两个问题是否一些方法论去遵循?笔者原以为能在网上搜一篇关于数据体系建设的文章,居然未能如愿,甚为遗憾。OK,老衲就来杜撰一篇!本文将从腾讯的数据体系、SNG数据中心的数据发展历程、业务的数据体系建设三个方面对企业、业务的数据建设进行阐述,各位同仁将就着看,多提意见少拍砖
一、 什么是数据体系
完整的数据体系应该是包含数据系统/数据产品/数据服务等若干个相互联系且基于数据所组成的有机体 —— 本文作者
二、 腾讯的数据架构

也许大家对这金字塔并不陌生,它集成了N多数据同仁的智慧,最终总结出这六层结构。
1. 数据基础平台

笔者所在的数据团队用的数据处理平台是腾讯分布式数据仓库(TDW),它集成了数据存储、计算、机器学习等功能。
2. 数据体系和可视化
有了数据处理平台,那我们统计好的数据需要有系统来呈现给用户,当前笔者用的平台是SNG-数据中心的“腾讯罗盘”。业务的数据体系可以帮助产品经理和分析师更好的理解数据,这块将在后续的文章做重点介绍。
3. 产品与运营分析
当业务发展到一定阶段,单纯的数据监控和统计已经不能支撑其业务发展。这就需要数据分析同学分析产品的用户画像、用户的行为、收入构成等,以便运营同学发现运营中的问题,挖掘潜在的机会点。
4. 精细化运营平台
如果说分析结论是一个指南针,那么精细化运营平台就是一个狙击步枪。它可以准确的帮助运营同学把目标用户提取出来做精细化运营,目前笔者常用的内部工具有:神盾推荐系统、数据提取平台、用户生命周期管理系统。从字面上就能看出来,推荐系统解决了业务千人千面的个性化推荐,数据提取平台给产品经理提供清洗数据、交叉分析的平台,用户生命周期管理系统是产品经理的用户运营平台。
5. 数据产品
市场上有很多的数据产品,比如百度的百度指数、阿里的数据魔方,像SNG有社交指数、宜出行等(感兴趣的可以自行关注公众号)。
6. 战略分析与决策
数据的作用除了帮助提升业务运营效果外,还可以成为领导层做战略规划的依据。比如每到年底,我们会对明年的业务活跃用户数、付费用户数做预测,预测在后续会有详细介绍(见《社交大盘关键指标预测》、《某包月用户数预测》)
三、 SNG数据中心的数据发展历程

笔者所在的数据中心几经变革,从早期的单机收集数据、开发报表到现在的在线实时计算和机器学习,不断的完善数据基础功能、扩展数据的应用场景,进而把数据的价值最大化。
四、 业务的数据体系建设
1. 为什么要有业务的数据体系
先问几个问题:有没有入职一年多了,还不知道部门业务架构?有没有作为骨干员工,还只清楚自己的一亩三分地?有没有做了leader,还不了解业务大盘趋势?

显而易见,业务的数据体系既可以让产品同学了解所在组织的业务架构,也可以让运营同学了解过去一段时间的运营详情,同时为下阶段的运营提前做出规划。
2. 业务数据体系建设的方法论

2.1 “业务体系”
这里更多指的是业务构成。无论是作为一个运营产品经理、数据产品还是BI同学,不了解业务数据体系就像有一本武林秘籍却没有内功心法。想要把数据发挥更大的作用,就需要了解团队里或者部门中其他人在做些什么?有没有可以合作的地方?是否可以把成功的案例拿来套用?
我们先来看看几年前为某包月做的业务体系,详细内容涉及到敏感数据就不展开,有兴趣的同学可以在评论区留言交流

是不是还算清晰?可以很快的了解到包月的业务的模块构成。任何一个增值业务都可以在上图的二级节点里找到自己的位置。
这么构建的两个优点:
a) 即便是多元化和产品更新迭代速度快的产品,也能清晰的了解业务结构
b) 把各个业务从逻辑上划分5大块,如果有一部分出问题,能快速定位
2.1.1 “数据体系”的四要素

这个增值业务的数据体系为什么要这么设计?
a) 业务洞察



