数据可视化发布第一个项目《中国就业形势实时数据可视化》

本贴最后更新于 1655 天前,其中的信息可能已经斗转星移

大家好,久违了,今年春节过后终于更新了(此处应有捂脸表情)。

有认识我的朋友可能知道我过去一两年内采集了很多数据,包括不限于招聘、人口信息、气象信息、彩票开奖信息、企业工商信息等等方向,我一直在思考能用这些数据做点什么有意义的事情。

最近我决定把这些数据通过可视化的方式展现出来,今天发布的就是第一个项目《中国就业形势实时数据可视化》,点击名称可以进入页面,建议使用 PC 端浏览器。

1.png

下面具体介绍一下各个图形的含义

2.png

上面的职位数量和企业数量代表目前后台采集的数据数量,本数据实时更新。

3.png

地图部分显示了 38 个主要城市,圆圈大小使用平均工资计算,计算公式为

平均工资-3000)/系数

这样圆圈的大小区别会更加明显。
鼠标悬浮到城市上,可以显示出该城市的平均工资、中位数工资和工作机会数量(也就是采集的样本数量),工作机会越多代表该城市的招聘需求绝对值越大。

4.png

工作机会行业 TOP10 排行
可以看到高新产业比如电子技术/半导体/集成电路、计算机软件、制药/生物工程、互联网/电子商务占据了半壁江山。说明我国的产业升级还是很成功的,高新产业提供了大量就业岗位。
另外就是房地产、教育和服务业还是主要支柱,依旧提供了数量众多的岗位。

5.png

工作机会城市 TOP10 排行
可以看到传统一线城市北上广深依旧位列前四名不可动摇,众多企业聚集在这四个城市。但是我们也要看到武汉、杭州和成都这三座新一线城市正在奋起直追,这三座城市中,除杭州房价已经很高外,武汉和成都的房价还在每平米 1 万-2 万之间,考虑到传统一线城市突破天际的房价,我认为武汉和成都不失为一个打工者目前通过奋斗还能立足的好选择。并且武汉和成都的房价我认为在未来有很大空间,值得考虑。

6.png

学历要求
我们可以看到需要大学学历的岗位在统计分布中占据统治地位(大学本科占 23.6%,大学专科占 52.41),由于这些年大学的疯狂扩招,大学学历从比较优势变成及格线。目前只有 985 和 211 院校才有一定优势了。
工作经验要求
工作经验分布的比较均衡,从应届毕业生至油腻的中年人,都有相应的岗位提供,说明我们的就业市场是比较充分的,就业环境是比较健康的。

7.png
工资城市 TOP10 排行
平均工资这里出现了与传统认知不符合的情况,首先是你找不到广州这座城市,作为传统一线城市广州的平均工资已经跌落到 10 名开外了。其次你发现了一些偏远城市的平均工资水平其实很高,比如说拉萨的平均工资能够达到 8340 之多。其实也很好理解,拉萨的样本数只有 155 个,代表只有 155 条招聘信息,并且这些招聘信息大多是政府和企事业单位发布的,这就说明当地的工作机会还是不够多,经济活动并不活跃。高工资主要还是靠高原补贴等因素影响,并不建议选择。

8.png
工资行业 TOP10 排行
这里基本被 3 个高新行业垄断,房地产、金融、互联网(软件)。考虑到房地产已经是夕阳产业,所以没什么好犹豫的,直接选择去金融行业干研发(软件工程师)就对了。

企业性质分布
民营公司占 74.75%,绝对多数。从这里就能看出,提供巨量就业岗位的还是广大中小微企业。这就不难理解今年疫情中,国家给中小微企业的各种政策倾斜和税收减免,毕竟要保就业。

后记:前端代码开源,后续会放到 GitHub 上,项目地址为 https://github.com/lxp135/graphs 可以点一波 star 了。后台代码就不开源了,大家需要数据的话,可以直接从前端代码中调用的接口地址获取,我并没有做权限控制,由于服务器能力有限,请适度查询。如果有需要的话,后续我可以提供接口文档。
本项目数据来源于互联网各大招聘网站。

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    556 引用 • 675 回帖
  • 支付宝

    支付宝是全球领先的独立第三方支付平台,致力于为广大用户提供安全快速的电子支付/网上支付/安全支付/手机支付体验,及转账收款/水电煤缴费/信用卡还款/AA 收款等生活服务应用。

    29 引用 • 347 回帖 • 1 关注
  • 链滴

    链滴是一个记录生活的地方。

    记录生活,连接点滴

    171 引用 • 3847 回帖
  • GitLab

    GitLab 是利用 Ruby 一个开源的版本管理系统,实现一个自托管的 Git 项目仓库,可通过 Web 界面操作公开或私有项目。

    46 引用 • 72 回帖
  • SMTP

    SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式。SMTP 协议属于 TCP/IP 协议簇,它帮助每台计算机在发送或中转信件时找到下一个目的地。

    4 引用 • 18 回帖 • 637 关注
  • Kubernetes

    Kubernetes 是 Google 开源的一个容器编排引擎,它支持自动化部署、大规模可伸缩、应用容器化管理。

    116 引用 • 54 回帖 • 1 关注
  • Kotlin

    Kotlin 是一种在 Java 虚拟机上运行的静态类型编程语言,由 JetBrains 设计开发并开源。Kotlin 可以编译成 Java 字节码,也可以编译成 JavaScript,方便在没有 JVM 的设备上运行。在 Google I/O 2017 中,Google 宣布 Kotlin 成为 Android 官方开发语言。

    19 引用 • 33 回帖 • 78 关注
  • 链书

    链书(Chainbook)是 B3log 开源社区提供的区块链纸质书交易平台,通过 B3T 实现共享激励与价值链。可将你的闲置书籍上架到链书,我们共同构建这个全新的交易平台,让闲置书籍继续发挥它的价值。

    链书社

    链书目前已经下线,也许以后还有计划重制上线。

    14 引用 • 257 回帖
  • Ant-Design

    Ant Design 是服务于企业级产品的设计体系,基于确定和自然的设计价值观上的模块化解决方案,让设计者和开发者专注于更好的用户体验。

    17 引用 • 23 回帖
  • Android

    Android 是一种以 Linux 为基础的开放源码操作系统,主要使用于便携设备。2005 年由 Google 收购注资,并拉拢多家制造商组成开放手机联盟开发改良,逐渐扩展到到平板电脑及其他领域上。

    335 引用 • 324 回帖
  • IBM

    IBM(国际商业机器公司)或万国商业机器公司,简称 IBM(International Business Machines Corporation),总公司在纽约州阿蒙克市。1911 年托马斯·沃森创立于美国,是全球最大的信息技术和业务解决方案公司,拥有全球雇员 30 多万人,业务遍及 160 多个国家和地区。

    17 引用 • 53 回帖 • 146 关注
  • Spark

    Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架。Spark 拥有 Hadoop MapReduce 所具有的优点;但不同于 MapReduce 的是 Job 中间输出结果可以保存在内存中,从而不再需要读写 HDFS,因此 Spark 能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce 的算法。

    74 引用 • 46 回帖 • 569 关注
  • 区块链

    区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。所谓共识机制是区块链系统中实现不同节点之间建立信任、获取权益的数学算法 。

    92 引用 • 752 回帖
  • 笔记

    好记性不如烂笔头。

    310 引用 • 794 回帖
  • CentOS

    CentOS(Community Enterprise Operating System)是 Linux 发行版之一,它是来自于 Red Hat Enterprise Linux 依照开放源代码规定释出的源代码所编译而成。由于出自同样的源代码,因此有些要求高度稳定的服务器以 CentOS 替代商业版的 Red Hat Enterprise Linux 使用。两者的不同在于 CentOS 并不包含封闭源代码软件。

    239 引用 • 224 回帖
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 590 关注
  • GitHub

    GitHub 于 2008 年上线,目前,除了 Git 代码仓库托管及基本的 Web 管理界面以外,还提供了订阅、讨论组、文本渲染、在线文件编辑器、协作图谱(报表)、代码片段分享(Gist)等功能。正因为这些功能所提供的便利,又经过长期的积累,GitHub 的用户活跃度很高,在开源世界里享有深远的声望,并形成了社交化编程文化(Social Coding)。

    210 引用 • 2040 回帖
  • 快应用

    快应用 是基于手机硬件平台的新型应用形态;标准是由主流手机厂商组成的快应用联盟联合制定;快应用标准的诞生将在研发接口、能力接入、开发者服务等层面建设标准平台;以平台化的生态模式对个人开发者和企业开发者全品类开放。

    15 引用 • 127 回帖 • 1 关注
  • 又拍云

    又拍云是国内领先的 CDN 服务提供商,国家工信部认证通过的“可信云”,乌云众测平台认证的“安全云”,为移动时代的创业者提供新一代的 CDN 加速服务。

    20 引用 • 37 回帖 • 573 关注
  • PHP

    PHP(Hypertext Preprocessor)是一种开源脚本语言。语法吸收了 C 语言、 Java 和 Perl 的特点,主要适用于 Web 开发领域,据说是世界上最好的编程语言。

    179 引用 • 408 回帖 • 488 关注
  • 酷鸟浏览器

    安全 · 稳定 · 快速
    为跨境从业人员提供专业的跨境浏览器

    3 引用 • 59 回帖 • 47 关注
  • Rust

    Rust 是一门赋予每个人构建可靠且高效软件能力的语言。Rust 由 Mozilla 开发,最早发布于 2014 年 9 月。

    58 引用 • 22 回帖 • 9 关注
  • Follow
    4 引用 • 12 回帖 • 9 关注
  • Mobi.css

    Mobi.css is a lightweight, flexible CSS framework that focus on mobile.

    1 引用 • 6 回帖 • 756 关注
  • Solo

    Solo 是一款小而美的开源博客系统,专为程序员设计。Solo 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    1441 引用 • 10068 回帖 • 494 关注
  • 七牛云

    七牛云是国内领先的企业级公有云服务商,致力于打造以数据为核心的场景化 PaaS 服务。围绕富媒体场景,七牛先后推出了对象存储,融合 CDN 加速,数据通用处理,内容反垃圾服务,以及直播云服务等。

    28 引用 • 226 回帖 • 134 关注
  • Electron

    Electron 基于 Chromium 和 Node.js,让你可以使用 HTML、CSS 和 JavaScript 构建应用。它是一个由 GitHub 及众多贡献者组成的活跃社区共同维护的开源项目,兼容 Mac、Windows 和 Linux,它构建的应用可在这三个操作系统上面运行。

    15 引用 • 136 回帖 • 3 关注