【警报贴】基于社区成员的在线状态提示对用户的上网时间段画像

本贴最后更新于 2135 天前,其中的信息可能已经渤澥桑田

记得日本动漫改编电影《死亡笔记》中有个桥段,侦探“L”基于死者的遇害时间画像推测出作案者是学生从而缩小了调查半径。最近注意到黑客派网站上有一个显示用户在线状态的标识,研究了下,发现可以用来对活跃用户的上网时间段画像,贴出来分享下。

默认未取消“公开在线状态”的用户个人主页,头像下面的第一个标识显示的是用户的登录状态,如果你有在个人设置页面取消“公开在线状态”的话则不会显示这个标识,通过统计数据发现社区仅有 0.6% 的用户未公开自己的在线状态,即是说其他 5W+ 的用户登录状态是对外公开的。

先来看下这个登录状态标识会显示哪些状态。

  • 在线:用户登录账号在线时显示
  • 刚刚:用户退出登录 1 分钟内显示
  • 1 分钟前~ 59 分钟前:用户退出登录后对应的时间内显示
  • 1 小时前~ 23 小时前:用户退出登录后对应的时间内显示
  • 1 天前~ 6 天前:用户退出登录后对应的时间内显示
  • 1 周前~ 4 周前:用户退出登录后对应的时间内显示
  • 1 个月前~ 11 个月前:用户退出登录后对应的时间内显示
  • 1 年前~ N 年前:用户退出登录后对应的时间内显示

根据上面的信息可以这样来收集指定用户的登录状态数据,设置定时任务每个小时访问一次指定用户的个人主页,获取登录状态信息,记录登录状态提示信息和访问时间,一天会记录 24 次,这样持续记录 50 天之后就有了 1200 条记录,然后清洗数据应该就可以比较准确的画出用户一周内每天上网的时间段了。

当然了,以上记录方式只对【社区活跃成员】并且【未手动取消】“公开在线状态”的用户有效。看到这里,如果你对社区用户数据做过统计分析的话就会发现活跃的用户实在是太少了,不过还是要提醒各位小伙伴一句,如果你没有取消“公开在线状态”的话是完全有可能被别人记录下来的。

又发现用户个人主页的【在线时长】统计信息也可以用来收集指定用户的登录行为,同样的方式,只需要每小时记录下用户的在线时长数据和访问时间,持续收集数据清洗后就可以画像了。这个【在线时长】记录,用户是没有办法选择关闭的,只能选择登录或者不登录。

如果你发现你的个人主页访问量不正常地稳定持续增长,那么极有可能是别人在收集你的数据了。

最后,如果你也对社区的帖子跟用户统计数据感兴趣,请看:
https://hacpai.com/article/1566621201255

3 操作
soulfight 在 2019-09-22 16:08:44 更新了该帖
soulfight 在 2019-09-22 14:26:59 更新了该帖
soulfight 在 2019-09-08 13:09:34 更新了该帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
soulfight
Don't judge, don't believe; keep running, keep alive.

推荐标签 标签

  • 国际化

    i18n(其来源是英文单词 internationalization 的首末字符 i 和 n,18 为中间的字符数)是“国际化”的简称。对程序来说,国际化是指在不修改代码的情况下,能根据不同语言及地区显示相应的界面。

    8 引用 • 26 回帖 • 1 关注
  • Vue.js

    Vue.js(读音 /vju ː/,类似于 view)是一个构建数据驱动的 Web 界面库。Vue.js 的目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。

    268 引用 • 666 回帖
  • CentOS

    CentOS(Community Enterprise Operating System)是 Linux 发行版之一,它是来自于 Red Hat Enterprise Linux 依照开放源代码规定释出的源代码所编译而成。由于出自同样的源代码,因此有些要求高度稳定的服务器以 CentOS 替代商业版的 Red Hat Enterprise Linux 使用。两者的不同在于 CentOS 并不包含封闭源代码软件。

    240 引用 • 224 回帖
  • 七牛云

    七牛云是国内领先的企业级公有云服务商,致力于打造以数据为核心的场景化 PaaS 服务。围绕富媒体场景,七牛先后推出了对象存储,融合 CDN 加速,数据通用处理,内容反垃圾服务,以及直播云服务等。

    29 引用 • 230 回帖 • 130 关注
  • Jenkins

    Jenkins 是一套开源的持续集成工具。它提供了非常丰富的插件,让构建、部署、自动化集成项目变得简单易用。

    54 引用 • 37 回帖 • 2 关注
  • sts
    2 引用 • 2 回帖 • 247 关注
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    36 引用 • 200 回帖 • 41 关注
  • 又拍云

    又拍云是国内领先的 CDN 服务提供商,国家工信部认证通过的“可信云”,乌云众测平台认证的“安全云”,为移动时代的创业者提供新一代的 CDN 加速服务。

    20 引用 • 37 回帖 • 572 关注
  • 单点登录

    单点登录(Single Sign On)是目前比较流行的企业业务整合的解决方案之一。SSO 的定义是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统。

    9 引用 • 25 回帖 • 5 关注
  • JRebel

    JRebel 是一款 Java 虚拟机插件,它使得 Java 程序员能在不进行重部署的情况下,即时看到代码的改变对一个应用程序带来的影响。

    26 引用 • 78 回帖 • 683 关注
  • GAE

    Google App Engine(GAE)是 Google 管理的数据中心中用于 WEB 应用程序的开发和托管的平台。2008 年 4 月 发布第一个测试版本。目前支持 Python、Java 和 Go 开发部署。全球已有数十万的开发者在其上开发了众多的应用。

    14 引用 • 42 回帖 • 825 关注
  • SendCloud

    SendCloud 由搜狐武汉研发中心孵化的项目,是致力于为开发者提供高质量的触发邮件服务的云端邮件发送平台,为开发者提供便利的 API 接口来调用服务,让邮件准确迅速到达用户收件箱并获得强大的追踪数据。

    2 引用 • 8 回帖 • 507 关注
  • etcd

    etcd 是一个分布式、高可用的 key-value 数据存储,专门用于在分布式系统中保存关键数据。

    6 引用 • 26 回帖 • 545 关注
  • 区块链

    区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。所谓共识机制是区块链系统中实现不同节点之间建立信任、获取权益的数学算法 。

    92 引用 • 752 回帖 • 1 关注
  • OnlyOffice
    4 引用 • 19 关注
  • Electron

    Electron 基于 Chromium 和 Node.js,让你可以使用 HTML、CSS 和 JavaScript 构建应用。它是一个由 GitHub 及众多贡献者组成的活跃社区共同维护的开源项目,兼容 Mac、Windows 和 Linux,它构建的应用可在这三个操作系统上面运行。

    15 引用 • 136 回帖 • 1 关注
  • Android

    Android 是一种以 Linux 为基础的开放源码操作系统,主要使用于便携设备。2005 年由 Google 收购注资,并拉拢多家制造商组成开放手机联盟开发改良,逐渐扩展到到平板电脑及其他领域上。

    337 引用 • 324 回帖 • 2 关注
  • 快应用

    快应用 是基于手机硬件平台的新型应用形态;标准是由主流手机厂商组成的快应用联盟联合制定;快应用标准的诞生将在研发接口、能力接入、开发者服务等层面建设标准平台;以平台化的生态模式对个人开发者和企业开发者全品类开放。

    15 引用 • 127 回帖 • 1 关注
  • abitmean

    有点意思就行了

    37 关注
  • Follow
    4 引用 • 12 回帖 • 7 关注
  • PHP

    PHP(Hypertext Preprocessor)是一种开源脚本语言。语法吸收了 C 语言、 Java 和 Perl 的特点,主要适用于 Web 开发领域,据说是世界上最好的编程语言。

    167 引用 • 408 回帖 • 484 关注
  • 链书

    链书(Chainbook)是 B3log 开源社区提供的区块链纸质书交易平台,通过 B3T 实现共享激励与价值链。可将你的闲置书籍上架到链书,我们共同构建这个全新的交易平台,让闲置书籍继续发挥它的价值。

    链书社

    链书目前已经下线,也许以后还有计划重制上线。

    14 引用 • 257 回帖 • 2 关注
  • 微软

    微软是一家美国跨国科技公司,也是世界 PC 软件开发的先导,由比尔·盖茨与保罗·艾伦创办于 1975 年,公司总部设立在华盛顿州的雷德蒙德(Redmond,邻近西雅图)。以研发、制造、授权和提供广泛的电脑软件服务业务为主。

    8 引用 • 44 回帖
  • 服务器

    服务器,也称伺服器,是提供计算服务的设备。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。

    125 引用 • 585 回帖 • 1 关注
  • Notion

    Notion - The all-in-one workspace for your notes, tasks, wikis, and databases.

    10 引用 • 77 回帖 • 1 关注
  • Linux

    Linux 是一套免费使用和自由传播的类 Unix 操作系统,是一个基于 POSIX 和 Unix 的多用户、多任务、支持多线程和多 CPU 的操作系统。它能运行主要的 Unix 工具软件、应用程序和网络协议,并支持 32 位和 64 位硬件。Linux 继承了 Unix 以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。

    957 引用 • 944 回帖
  • Latke

    Latke 是一款以 JSON 为主的 Java Web 框架。

    71 引用 • 535 回帖 • 830 关注