大数据对外服务专题分析标准化案例

本贴最后更新于 3036 天前,其中的信息可能已经事过境迁

#前言
大数据对外服务是支撑中心大数据中心的一项业务,也是大数据变现的一项重要手段。虽然我们掌握了许多数据资源,熟悉多种分析手段,但由于各类行业都有其独特性,每次大数据对外服务需求都应该充分调研,了解行业客户真正的需求,必要的时候还要到实地去考察,与客户面对面沟通,以达到最好的分析效果。
#交付成果
大数据对外服务一般提供给客户一份专题分析报告 PPT,PPT 中仅提供脱敏的统计级数据,或者趋势分析数据。不可包含任何用户清单级的敏感数据。
#分析流程
大数据对外服务流程为 152 流程,是由县市公司政企部客户经理发起,经过直属领导、法务部、信息安全等部门审批,通过后方可进行。客户经理应尽可能详细地写清楚客户需求,并告知客户最终的可交付成果。商务部分也需要提供,例如是否通过其他项目来置换大数据对外服务费用等。
##需求调研
为了满足客户需求,避免分析结果出现问题,第一次接到大数据对外服务流程时,可与项目发起人一同前往客户所在地,当面沟通,进一步明确客户的具体需求。
##可行性分析
与客户沟通完毕并明确了客户需求之后,应对该需求进行可行性分析,考虑客户需求是否为当前系统中可提取的数据。此外,考虑交付成果是否为脱敏的统计级数据。
##数据提取
数据提取过程一般通过客户标签库、客户轨迹表、常用基站表等维度进行提取。
###1.区域确认
根据商铺的位置,在地图上进行坐标拾取,通常情况下,我们先选取商铺所在位置多边形的四个点,分别提取这四个点的 GPS 坐标(注意:只有谷歌地球的坐标才是真实的 GPS 坐标,其他坐标都是经过转换的“火星坐标”)
6666.jpg
通过获取这 4 个坐标的最大值和最小值,得出实际的坐标取值范围如下图绿色方框所示。
777.jpg
从数据库中取得落在该区域内的基站清单。
###2.基站确认
获得这个矩形区域中的基站,如下图所示,可见,所得基站均处于商铺范围内。
base.jpg
###3.用户分布热力图
根据基站所覆盖的用户数绘制出用户分布密度热力图。
rlt.jpg
###4.用户提取
根据基站清单,提取用户信息,并剔除在该区域 7 天及 7 天以上的常驻用户。如下图所示,根据每天的访客情况可见,该区域的日均访客数为 23301.9 人,最大值为 29008 人,最小值为 14818 人。
444.jpg
根据用户清单,进一步挖掘用户的详细信息。
##数据挖掘
对于已获取的用户清单,可直接进行用户标签的关联,对于潜在目标客户的分析,可让客户提供有效的真实会员资料,通过该清单进行建模,以得到潜在目标客户模型。
###1.基本信息
(1)用户年龄分布
如下图所示,该区域的用户年龄集中分布在 20-35 之间,其中年龄为 26 岁的用户数最多,达到 1.8 万,随着年龄的增长呈递减趋势。
5555.jpg
(2)用户性别比例
如下图所示,该区域的用户为男性居多,占比高达 63%。
666666.jpg
(3)用户归属地
如下图所示,在一个月的监控样本中,用户归属来自丰泽的最多,达到 13 万人,高出第二名两倍以上,晋江归属的用户达 5.78 万,鲤城归属的用户达 5.35 万,惠安归属的用户达 4.2 万。
77777.jpg
(4)用户职业特征
如下图所示,该区域近一个月来访的用户分布情况如下,其中商旅人士最多,占比达 62%,学生占比 21%,公务人员占比 7%。
zyzy.jpg
(5)用户星座分布
该区域用户的星座分布如下图所示,其中天秤座用户占比最高,达到 10.54%,其次为天蝎座用户,占比 9.95%,处女座用户占比第三,达到 8.92%。
star.jpg
###2.消费能力
(1)月均 ARPU 值
该区域用户平均 ARPU 值分布情况如下图所示,可见,绝大多数用户的 ARPU 值集中在 100-200 之间。
ARPU.jpg
(2)用户余额分布
该区域用户余额分布情况如下图所示,可见余额小于 50 元的用户数最多。
余额.jpg
(3)月均流量使用
该区域的用户流量使用情况如下图所示,其中,月均流量处于 500MB-1GB 的用户数最多,达到 8.7 万户。
ll.jpg
(4)终端品牌分布
下图所示为该区域用户所使用终端品牌的占比情况,其中苹果终端占比最高达到 42.92%,华为、欧珀、小米并列占比 11%,步步高、三星品牌占比分别为 8% 和 6%。
zdzb.jpg
(5)拥有汽车的用户占比
如下图所示,该区域中,拥有汽车的用户占比为 26%。
iscar.jpg
(6)汽车品牌占比情况
该区域用户的汽车品牌占比情况如下图所示,其中本田汽车占比最高,达到 29.76%,丰田汽车占比仅次于本田,达 27.60%,大众汽车占比 23.73%,标致汽车占比 3.38%,同时也存在宾利、保时捷、宝马、奔驰、雷克萨斯等高端汽车品牌。
carband.jpg
###3.偏好特征
(1)上网内容偏好
该区域用户上网行为偏好如下图所示,其中搜索类偏好最高,达到 2.86 万次,IT 类偏好达 1.92 万次,游戏和购物类偏好分别为 1.39 和 1.33 万次,社交生活类偏好为 1.06 万次。
swxw.jpg
(2)APP 使用偏好
该区域中,社交通信类 APP 使用的频次最高,其次为 IT 类 APP 和系统工具类 APP。
appuse.jpg
###4.通信特征
(1)用户通话次数分布
下图为该区域用户的月通话次数,其中月通话在 100-200 次的用户最多,达到 91925 户,通话 500 次以上的为 75168 户。
thcs1.jpg
(2)用户影响力
根据用户通话特征评估模型对该区域的用户进行分析,得出该区域用户有 45% 的用户具有较高的社会影响力。
yxl.jpg
##分析报告制作
分析报告一般提供 PPT 或 WORD 形式,尽量避免使用专业术语,应使用可供客户阅读的简单描述或举例。
##数据审核
数据审核一般由 B 角、、信息安全部门、法务部、财务部依次进行,仅当审核完成之后才可将最终的分析报告提交给客户。
##分析报告提交
分析报告通过流程进行流转,最终由需求发起人将该报告直接发送给客户。

  • 工作

    快乐工作,认真生活。

    140 引用 • 1470 回帖 • 6 关注
  • 大数据

    大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    93 引用 • 113 回帖
  • 占比
    1 引用 • 3 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 88250 1

    专业..(挽尊....

  • monday

    头像好像很熟悉,武汉理工?

    1 回复
  • relyn
    作者

    不是的哈

relyn
永远相信美好的事情即将发生 泉州

推荐标签 标签

  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 667 关注
  • sts
    2 引用 • 2 回帖 • 197 关注
  • Solo

    Solo 是一款小而美的开源博客系统,专为程序员设计。Solo 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    1435 引用 • 10056 回帖 • 489 关注
  • Bug

    Bug 本意是指臭虫、缺陷、损坏、犯贫、窃听器、小虫等。现在人们把在程序中一些缺陷或问题统称为 bug(漏洞)。

    76 引用 • 1737 回帖 • 1 关注
  • OpenShift

    红帽提供的 PaaS 云,支持多种编程语言,为开发人员提供了更为灵活的框架、存储选择。

    14 引用 • 20 回帖 • 632 关注
  • GitBook

    GitBook 使您的团队可以轻松编写和维护高质量的文档。 分享知识,提高团队的工作效率,让用户满意。

    3 引用 • 8 回帖
  • C++

    C++ 是在 C 语言的基础上开发的一种通用编程语言,应用广泛。C++ 支持多种编程范式,面向对象编程、泛型编程和过程化编程。

    107 引用 • 153 回帖
  • Notion

    Notion - The all-in-one workspace for your notes, tasks, wikis, and databases.

    7 引用 • 40 回帖
  • 友情链接

    确认过眼神后的灵魂连接,站在链在!

    24 引用 • 373 回帖 • 1 关注
  • CongSec

    本标签主要用于分享网络空间安全专业的学习笔记

    1 引用 • 1 回帖 • 15 关注
  • WebComponents

    Web Components 是 W3C 定义的标准,它给了前端开发者扩展浏览器标签的能力,可以方便地定制可复用组件,更好的进行模块化开发,解放了前端开发者的生产力。

    1 引用 • 4 关注
  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 483 关注
  • AngularJS

    AngularJS 诞生于 2009 年,由 Misko Hevery 等人创建,后为 Google 所收购。是一款优秀的前端 JS 框架,已经被用于 Google 的多款产品当中。AngularJS 有着诸多特性,最为核心的是:MVC、模块化、自动化双向数据绑定、语义化标签、依赖注入等。2.0 版本后已经改名为 Angular。

    12 引用 • 50 回帖 • 483 关注
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    35 引用 • 200 回帖 • 27 关注
  • SSL

    SSL(Secure Sockets Layer 安全套接层),及其继任者传输层安全(Transport Layer Security,TLS)是为网络通信提供安全及数据完整性的一种安全协议。TLS 与 SSL 在传输层对网络连接进行加密。

    70 引用 • 193 回帖 • 416 关注
  • 星云链

    星云链是一个开源公链,业内简单的将其称为区块链上的谷歌。其实它不仅仅是区块链搜索引擎,一个公链的所有功能,它基本都有,比如你可以用它来开发部署你的去中心化的 APP,你可以在上面编写智能合约,发送交易等等。3 分钟快速接入星云链 (NAS) 测试网

    3 引用 • 16 回帖 • 6 关注
  • Hadoop

    Hadoop 是由 Apache 基金会所开发的一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

    86 引用 • 122 回帖 • 626 关注
  • WordPress

    WordPress 是一个使用 PHP 语言开发的博客平台,用户可以在支持 PHP 和 MySQL 数据库的服务器上架设自己的博客。也可以把 WordPress 当作一个内容管理系统(CMS)来使用。WordPress 是一个免费的开源项目,在 GNU 通用公共许可证(GPLv2)下授权发布。

    66 引用 • 114 回帖 • 223 关注
  • Wide

    Wide 是一款基于 Web 的 Go 语言 IDE。通过浏览器就可以进行 Go 开发,并有代码自动完成、查看表达式、编译反馈、Lint、实时结果输出等功能。

    欢迎访问我们运维的实例: https://wide.b3log.org

    30 引用 • 218 回帖 • 635 关注
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    23020 引用 • 92599 回帖
  • 学习

    “梦想从学习开始,事业从实践起步” —— 习近平

    171 引用 • 512 回帖
  • 数据库

    据说 99% 的性能瓶颈都在数据库。

    343 引用 • 723 回帖
  • 服务

    提供一个服务绝不仅仅是简单的把硬件和软件累加在一起,它包括了服务的可靠性、服务的标准化、以及对服务的监控、维护、技术支持等。

    41 引用 • 24 回帖
  • 宕机

    宕机,多指一些网站、游戏、网络应用等服务器一种区别于正常运行的状态,也叫“Down 机”、“当机”或“死机”。宕机状态不仅仅是指服务器“挂掉了”、“死机了”状态,也包括服务器假死、停用、关闭等一些原因而导致出现的不能够正常运行的状态。

    13 引用 • 82 回帖 • 60 关注
  • 小说

    小说是以刻画人物形象为中心,通过完整的故事情节和环境描写来反映社会生活的文学体裁。

    28 引用 • 108 回帖
  • OkHttp

    OkHttp 是一款 HTTP & HTTP/2 客户端库,专为 Android 和 Java 应用打造。

    16 引用 • 6 回帖 • 75 关注
  • ActiveMQ

    ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。

    19 引用 • 13 回帖 • 668 关注