数据可视化发布第一个项目《中国就业形势实时数据可视化》

本贴最后更新于 1558 天前,其中的信息可能已经斗转星移

大家好,久违了,今年春节过后终于更新了(此处应有捂脸表情)。

有认识我的朋友可能知道我过去一两年内采集了很多数据,包括不限于招聘、人口信息、气象信息、彩票开奖信息、企业工商信息等等方向,我一直在思考能用这些数据做点什么有意义的事情。

最近我决定把这些数据通过可视化的方式展现出来,今天发布的就是第一个项目《中国就业形势实时数据可视化》,点击名称可以进入页面,建议使用 PC 端浏览器。

1.png

下面具体介绍一下各个图形的含义

2.png

上面的职位数量和企业数量代表目前后台采集的数据数量,本数据实时更新。

3.png

地图部分显示了 38 个主要城市,圆圈大小使用平均工资计算,计算公式为

平均工资-3000)/系数

这样圆圈的大小区别会更加明显。
鼠标悬浮到城市上,可以显示出该城市的平均工资、中位数工资和工作机会数量(也就是采集的样本数量),工作机会越多代表该城市的招聘需求绝对值越大。

4.png

工作机会行业 TOP10 排行
可以看到高新产业比如电子技术/半导体/集成电路、计算机软件、制药/生物工程、互联网/电子商务占据了半壁江山。说明我国的产业升级还是很成功的,高新产业提供了大量就业岗位。
另外就是房地产、教育和服务业还是主要支柱,依旧提供了数量众多的岗位。

5.png

工作机会城市 TOP10 排行
可以看到传统一线城市北上广深依旧位列前四名不可动摇,众多企业聚集在这四个城市。但是我们也要看到武汉、杭州和成都这三座新一线城市正在奋起直追,这三座城市中,除杭州房价已经很高外,武汉和成都的房价还在每平米 1 万-2 万之间,考虑到传统一线城市突破天际的房价,我认为武汉和成都不失为一个打工者目前通过奋斗还能立足的好选择。并且武汉和成都的房价我认为在未来有很大空间,值得考虑。

6.png

学历要求
我们可以看到需要大学学历的岗位在统计分布中占据统治地位(大学本科占 23.6%,大学专科占 52.41),由于这些年大学的疯狂扩招,大学学历从比较优势变成及格线。目前只有 985 和 211 院校才有一定优势了。
工作经验要求
工作经验分布的比较均衡,从应届毕业生至油腻的中年人,都有相应的岗位提供,说明我们的就业市场是比较充分的,就业环境是比较健康的。

7.png
工资城市 TOP10 排行
平均工资这里出现了与传统认知不符合的情况,首先是你找不到广州这座城市,作为传统一线城市广州的平均工资已经跌落到 10 名开外了。其次你发现了一些偏远城市的平均工资水平其实很高,比如说拉萨的平均工资能够达到 8340 之多。其实也很好理解,拉萨的样本数只有 155 个,代表只有 155 条招聘信息,并且这些招聘信息大多是政府和企事业单位发布的,这就说明当地的工作机会还是不够多,经济活动并不活跃。高工资主要还是靠高原补贴等因素影响,并不建议选择。

8.png
工资行业 TOP10 排行
这里基本被 3 个高新行业垄断,房地产、金融、互联网(软件)。考虑到房地产已经是夕阳产业,所以没什么好犹豫的,直接选择去金融行业干研发(软件工程师)就对了。

企业性质分布
民营公司占 74.75%,绝对多数。从这里就能看出,提供巨量就业岗位的还是广大中小微企业。这就不难理解今年疫情中,国家给中小微企业的各种政策倾斜和税收减免,毕竟要保就业。

后记:前端代码开源,后续会放到 GitHub 上,项目地址为 https://github.com/lxp135/graphs 可以点一波 star 了。后台代码就不开源了,大家需要数据的话,可以直接从前端代码中调用的接口地址获取,我并没有做权限控制,由于服务器能力有限,请适度查询。如果有需要的话,后续我可以提供接口文档。
本项目数据来源于互联网各大招聘网站。

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • Git

    Git 是 Linux Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。

    209 引用 • 358 回帖
  • WebClipper

    Web Clipper 是一款浏览器剪藏扩展,它可以帮助你把网页内容剪藏到本地。

    3 引用 • 9 回帖 • 2 关注
  • 区块链

    区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。所谓共识机制是区块链系统中实现不同节点之间建立信任、获取权益的数学算法 。

    91 引用 • 751 回帖 • 2 关注
  • Sandbox

    如果帖子标签含有 Sandbox ,则该帖子会被视为“测试帖”,主要用于测试社区功能,排查 bug 等,该标签下内容不定期进行清理。

    412 引用 • 1246 回帖 • 587 关注
  • 导航

    各种网址链接、内容导航。

    42 引用 • 175 回帖
  • frp

    frp 是一个可用于内网穿透的高性能的反向代理应用,支持 TCP、UDP、 HTTP 和 HTTPS 协议。

    20 引用 • 7 回帖 • 3 关注
  • RYMCU

    RYMCU 致力于打造一个即严谨又活泼、专业又不失有趣,为数百万人服务的开源嵌入式知识学习交流平台。

    4 引用 • 6 回帖 • 50 关注
  • abitmean

    有点意思就行了

    30 关注
  • 程序员

    程序员是从事程序开发、程序维护的专业人员。

    575 引用 • 3533 回帖
  • 域名

    域名(Domain Name),简称域名、网域,是由一串用点分隔的名字组成的 Internet 上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置)。

    43 引用 • 208 回帖
  • ReactiveX

    ReactiveX 是一个专注于异步编程与控制可观察数据(或者事件)流的 API。它组合了观察者模式,迭代器模式和函数式编程的优秀思想。

    1 引用 • 2 回帖 • 162 关注
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    8586 引用 • 39168 回帖 • 147 关注
  • 智能合约

    智能合约(Smart contract)是一种旨在以信息化方式传播、验证或执行合同的计算机协议。智能合约允许在没有第三方的情况下进行可信交易,这些交易可追踪且不可逆转。智能合约概念于 1994 年由 Nick Szabo 首次提出。

    1 引用 • 11 回帖 • 2 关注
  • Angular

    AngularAngularJS 的新版本。

    26 引用 • 66 回帖 • 532 关注
  • Love2D

    Love2D 是一个开源的, 跨平台的 2D 游戏引擎。使用纯 Lua 脚本来进行游戏开发。目前支持的平台有 Windows, Mac OS X, Linux, Android 和 iOS。

    14 引用 • 53 回帖 • 541 关注
  • 宕机

    宕机,多指一些网站、游戏、网络应用等服务器一种区别于正常运行的状态,也叫“Down 机”、“当机”或“死机”。宕机状态不仅仅是指服务器“挂掉了”、“死机了”状态,也包括服务器假死、停用、关闭等一些原因而导致出现的不能够正常运行的状态。

    13 引用 • 82 回帖 • 60 关注
  • 开源中国

    开源中国是目前中国最大的开源技术社区。传播开源的理念,推广开源项目,为 IT 开发者提供了一个发现、使用、并交流开源技术的平台。目前开源中国社区已收录超过两万款开源软件。

    7 引用 • 86 回帖
  • Postman

    Postman 是一款简单好用的 HTTP API 调试工具。

    4 引用 • 3 回帖 • 8 关注
  • Vue.js

    Vue.js(读音 /vju ː/,类似于 view)是一个构建数据驱动的 Web 界面库。Vue.js 的目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。

    265 引用 • 666 回帖
  • Shell

    Shell 脚本与 Windows/Dos 下的批处理相似,也就是用各类命令预先放入到一个文件中,方便一次性执行的一个程序文件,主要是方便管理员进行设置或者管理用的。但是它比 Windows 下的批处理更强大,比用其他编程程序编辑的程序效率更高,因为它使用了 Linux/Unix 下的命令。

    123 引用 • 74 回帖 • 1 关注
  • 创业

    你比 99% 的人都优秀么?

    82 引用 • 1395 回帖
  • FFmpeg

    FFmpeg 是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。

    23 引用 • 32 回帖
  • OnlyOffice
    4 引用 • 9 关注
  • BookxNote

    BookxNote 是一款全新的电子书学习工具,助力您的学习与思考,让您的大脑更高效的记忆。

    笔记整理交给我,一心只读圣贤书。

    1 引用 • 1 回帖 • 1 关注
  • CongSec

    本标签主要用于分享网络空间安全专业的学习笔记

    1 引用 • 1 回帖 • 17 关注
  • Elasticsearch

    Elasticsearch 是一个基于 Lucene 的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful 接口。Elasticsearch 是用 Java 开发的,并作为 Apache 许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

    117 引用 • 99 回帖 • 213 关注
  • Dubbo

    Dubbo 是一个分布式服务框架,致力于提供高性能和透明化的 RPC 远程服务调用方案,是 [阿里巴巴] SOA 服务化治理方案的核心框架,每天为 2,000+ 个服务提供 3,000,000,000+ 次访问量支持,并被广泛应用于阿里巴巴集团的各成员站点。

    60 引用 • 82 回帖 • 605 关注