大数据对外服务专题分析标准化案例

本贴最后更新于 2916 天前,其中的信息可能已经事过境迁

#前言
大数据对外服务是支撑中心大数据中心的一项业务,也是大数据变现的一项重要手段。虽然我们掌握了许多数据资源,熟悉多种分析手段,但由于各类行业都有其独特性,每次大数据对外服务需求都应该充分调研,了解行业客户真正的需求,必要的时候还要到实地去考察,与客户面对面沟通,以达到最好的分析效果。
#交付成果
大数据对外服务一般提供给客户一份专题分析报告 PPT,PPT 中仅提供脱敏的统计级数据,或者趋势分析数据。不可包含任何用户清单级的敏感数据。
#分析流程
大数据对外服务流程为 152 流程,是由县市公司政企部客户经理发起,经过直属领导、法务部、信息安全等部门审批,通过后方可进行。客户经理应尽可能详细地写清楚客户需求,并告知客户最终的可交付成果。商务部分也需要提供,例如是否通过其他项目来置换大数据对外服务费用等。
##需求调研
为了满足客户需求,避免分析结果出现问题,第一次接到大数据对外服务流程时,可与项目发起人一同前往客户所在地,当面沟通,进一步明确客户的具体需求。
##可行性分析
与客户沟通完毕并明确了客户需求之后,应对该需求进行可行性分析,考虑客户需求是否为当前系统中可提取的数据。此外,考虑交付成果是否为脱敏的统计级数据。
##数据提取
数据提取过程一般通过客户标签库、客户轨迹表、常用基站表等维度进行提取。
###1.区域确认
根据商铺的位置,在地图上进行坐标拾取,通常情况下,我们先选取商铺所在位置多边形的四个点,分别提取这四个点的 GPS 坐标(注意:只有谷歌地球的坐标才是真实的 GPS 坐标,其他坐标都是经过转换的“火星坐标”)
6666.jpg
通过获取这 4 个坐标的最大值和最小值,得出实际的坐标取值范围如下图绿色方框所示。
777.jpg
从数据库中取得落在该区域内的基站清单。
###2.基站确认
获得这个矩形区域中的基站,如下图所示,可见,所得基站均处于商铺范围内。
base.jpg
###3.用户分布热力图
根据基站所覆盖的用户数绘制出用户分布密度热力图。
rlt.jpg
###4.用户提取
根据基站清单,提取用户信息,并剔除在该区域 7 天及 7 天以上的常驻用户。如下图所示,根据每天的访客情况可见,该区域的日均访客数为 23301.9 人,最大值为 29008 人,最小值为 14818 人。
444.jpg
根据用户清单,进一步挖掘用户的详细信息。
##数据挖掘
对于已获取的用户清单,可直接进行用户标签的关联,对于潜在目标客户的分析,可让客户提供有效的真实会员资料,通过该清单进行建模,以得到潜在目标客户模型。
###1.基本信息
(1)用户年龄分布
如下图所示,该区域的用户年龄集中分布在 20-35 之间,其中年龄为 26 岁的用户数最多,达到 1.8 万,随着年龄的增长呈递减趋势。
5555.jpg
(2)用户性别比例
如下图所示,该区域的用户为男性居多,占比高达 63%。
666666.jpg
(3)用户归属地
如下图所示,在一个月的监控样本中,用户归属来自丰泽的最多,达到 13 万人,高出第二名两倍以上,晋江归属的用户达 5.78 万,鲤城归属的用户达 5.35 万,惠安归属的用户达 4.2 万。
77777.jpg
(4)用户职业特征
如下图所示,该区域近一个月来访的用户分布情况如下,其中商旅人士最多,占比达 62%,学生占比 21%,公务人员占比 7%。
zyzy.jpg
(5)用户星座分布
该区域用户的星座分布如下图所示,其中天秤座用户占比最高,达到 10.54%,其次为天蝎座用户,占比 9.95%,处女座用户占比第三,达到 8.92%。
star.jpg
###2.消费能力
(1)月均 ARPU 值
该区域用户平均 ARPU 值分布情况如下图所示,可见,绝大多数用户的 ARPU 值集中在 100-200 之间。
ARPU.jpg
(2)用户余额分布
该区域用户余额分布情况如下图所示,可见余额小于 50 元的用户数最多。
余额.jpg
(3)月均流量使用
该区域的用户流量使用情况如下图所示,其中,月均流量处于 500MB-1GB 的用户数最多,达到 8.7 万户。
ll.jpg
(4)终端品牌分布
下图所示为该区域用户所使用终端品牌的占比情况,其中苹果终端占比最高达到 42.92%,华为、欧珀、小米并列占比 11%,步步高、三星品牌占比分别为 8% 和 6%。
zdzb.jpg
(5)拥有汽车的用户占比
如下图所示,该区域中,拥有汽车的用户占比为 26%。
iscar.jpg
(6)汽车品牌占比情况
该区域用户的汽车品牌占比情况如下图所示,其中本田汽车占比最高,达到 29.76%,丰田汽车占比仅次于本田,达 27.60%,大众汽车占比 23.73%,标致汽车占比 3.38%,同时也存在宾利、保时捷、宝马、奔驰、雷克萨斯等高端汽车品牌。
carband.jpg
###3.偏好特征
(1)上网内容偏好
该区域用户上网行为偏好如下图所示,其中搜索类偏好最高,达到 2.86 万次,IT 类偏好达 1.92 万次,游戏和购物类偏好分别为 1.39 和 1.33 万次,社交生活类偏好为 1.06 万次。
swxw.jpg
(2)APP 使用偏好
该区域中,社交通信类 APP 使用的频次最高,其次为 IT 类 APP 和系统工具类 APP。
appuse.jpg
###4.通信特征
(1)用户通话次数分布
下图为该区域用户的月通话次数,其中月通话在 100-200 次的用户最多,达到 91925 户,通话 500 次以上的为 75168 户。
thcs1.jpg
(2)用户影响力
根据用户通话特征评估模型对该区域的用户进行分析,得出该区域用户有 45% 的用户具有较高的社会影响力。
yxl.jpg
##分析报告制作
分析报告一般提供 PPT 或 WORD 形式,尽量避免使用专业术语,应使用可供客户阅读的简单描述或举例。
##数据审核
数据审核一般由 B 角、、信息安全部门、法务部、财务部依次进行,仅当审核完成之后才可将最终的分析报告提交给客户。
##分析报告提交
分析报告通过流程进行流转,最终由需求发起人将该报告直接发送给客户。

  • 工作

    快乐工作,认真生活。

    139 引用 • 1469 回帖 • 6 关注
  • 大数据

    大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    93 引用 • 113 回帖 • 1 关注
  • 占比
    1 引用 • 3 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 88250 1

    专业..(挽尊....

  • monday

    头像好像很熟悉,武汉理工?

    1 回复
  • relyn
    作者

    不是的哈

relyn
永远相信美好的事情即将发生 泉州

推荐标签 标签

  • DNSPod

    DNSPod 建立于 2006 年 3 月份,是一款免费智能 DNS 产品。 DNSPod 可以为同时有电信、网通、教育网服务器的网站提供智能的解析,让电信用户访问电信的服务器,网通的用户访问网通的服务器,教育网的用户访问教育网的服务器,达到互联互通的效果。

    6 引用 • 26 回帖 • 520 关注
  • JVM

    JVM(Java Virtual Machine)Java 虚拟机是一个微型操作系统,有自己的硬件构架体系,还有相应的指令系统。能够识别 Java 独特的 .class 文件(字节码),能够将这些文件中的信息读取出来,使得 Java 程序只需要生成 Java 虚拟机上的字节码后就能在不同操作系统平台上进行运行。

    180 引用 • 120 回帖 • 4 关注
  • Postman

    Postman 是一款简单好用的 HTTP API 调试工具。

    4 引用 • 3 回帖
  • 持续集成

    持续集成(Continuous Integration)是一种软件开发实践,即团队开发成员经常集成他们的工作,通过每个成员每天至少集成一次,也就意味着每天可能会发生多次集成。每次集成都通过自动化的构建(包括编译,发布,自动化测试)来验证,从而尽早地发现集成错误。

    14 引用 • 7 回帖
  • RabbitMQ

    RabbitMQ 是一个开源的 AMQP 实现,服务器端用 Erlang 语言编写,支持多种语言客户端,如:Python、Ruby、.NET、Java、C、PHP、ActionScript 等。用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。

    49 引用 • 60 回帖 • 387 关注
  • Hibernate

    Hibernate 是一个开放源代码的对象关系映射框架,它对 JDBC 进行了非常轻量级的对象封装,使得 Java 程序员可以随心所欲的使用对象编程思维来操纵数据库。

    39 引用 • 103 回帖 • 704 关注
  • Vim

    Vim 是类 UNIX 系统文本编辑器 Vi 的加强版本,加入了更多特性来帮助编辑源代码。Vim 的部分增强功能包括文件比较(vimdiff)、语法高亮、全面的帮助系统、本地脚本(Vimscript)和便于选择的可视化模式。

    28 引用 • 66 回帖
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 565 关注
  • GAE

    Google App Engine(GAE)是 Google 管理的数据中心中用于 WEB 应用程序的开发和托管的平台。2008 年 4 月 发布第一个测试版本。目前支持 Python、Java 和 Go 开发部署。全球已有数十万的开发者在其上开发了众多的应用。

    14 引用 • 42 回帖 • 714 关注
  • 笔记

    好记性不如烂笔头。

    308 引用 • 787 回帖
  • API

    应用程序编程接口(Application Programming Interface)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。

    76 引用 • 429 回帖 • 5 关注
  • V2Ray
    1 引用 • 15 回帖 • 3 关注
  • C++

    C++ 是在 C 语言的基础上开发的一种通用编程语言,应用广泛。C++ 支持多种编程范式,面向对象编程、泛型编程和过程化编程。

    106 引用 • 152 回帖 • 2 关注
  • 爬虫

    网络爬虫(Spider、Crawler),是一种按照一定的规则,自动地抓取万维网信息的程序。

    106 引用 • 275 回帖
  • NGINX

    NGINX 是一个高性能的 HTTP 和反向代理服务器,也是一个 IMAP/POP3/SMTP 代理服务器。 NGINX 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的,第一个公开版本 0.1.0 发布于 2004 年 10 月 4 日。

    311 引用 • 546 回帖 • 4 关注
  • 友情链接

    确认过眼神后的灵魂连接,站在链在!

    24 引用 • 373 回帖 • 1 关注
  • 心情

    心是产生任何想法的源泉,心本体会陷入到对自己本体不能理解的状态中,因为心能产生任何想法,不能分出对错,不能分出自己。

    59 引用 • 369 回帖
  • 酷鸟浏览器

    安全 · 稳定 · 快速
    为跨境从业人员提供专业的跨境浏览器

    3 引用 • 59 回帖 • 18 关注
  • Gitea

    Gitea 是一个开源社区驱动的轻量级代码托管解决方案,后端采用 Go 编写,采用 MIT 许可证。

    4 引用 • 16 回帖 • 3 关注
  • Sublime

    Sublime Text 是一款可以用来写代码、写文章的文本编辑器。支持代码高亮、自动完成,还支持通过插件进行扩展。

    10 引用 • 5 回帖 • 2 关注
  • BAE

    百度应用引擎(Baidu App Engine)提供了 PHP、Java、Python 的执行环境,以及云存储、消息服务、云数据库等全面的云服务。它可以让开发者实现自动地部署和管理应用,并且提供动态扩容和负载均衡的运行环境,让开发者不用考虑高成本的运维工作,只需专注于业务逻辑,大大降低了开发者学习和迁移的成本。

    19 引用 • 75 回帖 • 620 关注
  • FreeMarker

    FreeMarker 是一款好用且功能强大的 Java 模版引擎。

    23 引用 • 20 回帖 • 445 关注
  • Spark

    Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架。Spark 拥有 Hadoop MapReduce 所具有的优点;但不同于 MapReduce 的是 Job 中间输出结果可以保存在内存中,从而不再需要读写 HDFS,因此 Spark 能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce 的算法。

    74 引用 • 46 回帖 • 562 关注
  • 电影

    这是一个不能说的秘密。

    120 引用 • 598 回帖
  • 星云链

    星云链是一个开源公链,业内简单的将其称为区块链上的谷歌。其实它不仅仅是区块链搜索引擎,一个公链的所有功能,它基本都有,比如你可以用它来开发部署你的去中心化的 APP,你可以在上面编写智能合约,发送交易等等。3 分钟快速接入星云链 (NAS) 测试网

    3 引用 • 16 回帖 • 1 关注
  • Spring

    Spring 是一个开源框架,是于 2003 年兴起的一个轻量级的 Java 开发框架,由 Rod Johnson 在其著作《Expert One-On-One J2EE Development and Design》中阐述的部分理念和原型衍生而来。它是为了解决企业应用开发的复杂性而创建的。框架的主要优势之一就是其分层架构,分层架构允许使用者选择使用哪一个组件,同时为 JavaEE 应用程序开发提供集成的框架。

    942 引用 • 1459 回帖 • 96 关注
  • 快应用

    快应用 是基于手机硬件平台的新型应用形态;标准是由主流手机厂商组成的快应用联盟联合制定;快应用标准的诞生将在研发接口、能力接入、开发者服务等层面建设标准平台;以平台化的生态模式对个人开发者和企业开发者全品类开放。

    15 引用 • 127 回帖 • 2 关注