HTML5技术

让数据决策你的行为--拉勾网数据分析 - Zery

字号+ 作者:H5之家 来源:H5之家 2016-01-19 17:03 我要评论( )

前言 我们每天都在产生数据,出行,社交,购物,吃饭 等等,每一个行为伴随着数据的产生,如果将这些数据收集起来,并加以处理分析便可以反过来影响你的行为。 举个最简单的例子在各大电商网站搜索自己想买的商品,这一过程就产生了数据,电商网站会记录你所

  前言

  我们每天都在产生数据,出行,社交,购物,吃饭 等等,每一个行为伴随着数据的产生,如果将这些数据收集起来,并加以处理分析便可以反过来影响你的行为。

举个最简单的例子在各大电商网站搜索自己想买的商品,这一过程就产生了数据,电商网站会记录你所搜的商品数据,并稍作处理分析,基本就可以计算出你所需要购买的商品,

然后计算最合适你的商品,并以广告形式推送给你,最后你很有可能会从他推荐的商品中选一个付款,这个例子就形像的解释了,你是如何产生数据,而后数据又是如何影响你的行为的。

 

  前些日子突然想到了如下几个问题,

  在一线城市中 北京 上海 的薪水真的比深圳还高吗?

  JAVA工资真的比.NET 的要高吗?

  前端现在平均薪水大概是多少?

  除了几个一线城市外,哪些二线城市是比较有潜力的?

  市场上工作1-3年 3-5年经验的 薪水一般都是多少?

      这些问题我想大家或多或少的都聊到过,但是却没有相应的数据来支撑你的想法,往往都只是聊聊就过了。基于以上的问题,我开始想通过数据来证实,想想还是通过招聘网站的数据来分析,

因为招人是企业真实的需求,企业的需求就代表的市场的需求,反过来企业发布的招聘信息一定会按当前市场行情来定,比如薪水当市场平均水平是 1-3年经验 7K 时 企业的发布招聘信息一会以市场行情做一个参考,

不然没有竞争力 招不到好的人才,必然会影响公司的发展。 这样这些发布的招聘信息还是具有一定的真实性的

 

一 采集数据

  1.1 拉钩网介绍

  拉钩开通的城市暂时还只有如下几个城市,所以城市就抓取下图中的这些

  岗位的话因为本文主要针对的是开发类的数据分析,所以只抓取开发的岗位信息 

      

 

      

 

 

1.2 程序介绍

  整个流程是这样的 先从拉钩取数据入,存入Redis队列,然后通过定时器把数据从Redis中取出通过Dapper(轻量级的ORM)存入DB,最后以图表形式展现出来。

     所用到的一些东西 Redis ,Dapper, Sqlserver ,百度图表控件Echarts

  1 Lagou 是一个控制台程序,主要用来抓取数据,并存入Redis

  2 Lagou.Repository  抓到数据后的持久化与查询

  3 Lagou.Web 将数据以图表形式展现

     

1.3 操作步骤

    1先把Redis安装并启动

    2 在Lagou.Repository项目中运行sqlScript.sql脚本创建表,在DapperHelper.cs中配置好数据连接地址

    3 把Lagou控制台设为启动项目并运行,结果如下图。 等所有城市下的职位都取完后,数据就抓取完成!

    4 将Lagou.Web 项目设为启动项目并运行整个过程就结束了!

    

 

二 分析数据

 

  

 

         从图中可以看出  一线城市 北上深广  对人才的需求量是最大的

  其中又以北京为第一,为什么北京会是第一呢? 首先 是地域特殊 是首都,其次 国内最早的一批互联网公司基本都在北京创立的带动了这一行业的发展,

  同时也吸引了相应行业的人聚集,人的聚集又相应带动公司的聚集,两者相互影响使得北京成了互联网的主力军。

  另外北京众所周知薪水 是各大城市中最高的,因为这一行业内的从业人员较多,相应优秀的人也会更多,优秀的企业也会更多,企业对优秀人才的渴望是从未满足过的,这种环境下自然后拉高行业的整体薪水

 

        再说二线城市 排第一的杭州 我自己的想法 觉得是可能阿里巴巴带动的 当然政府的功劳肯定也是有的,但是如果没有阿里巴巴对整个行业的影响,当前的环境恐怕不是政府努力就能改变的。

   为什么成都会排二线城市的第二呢? 

  1 事实上这两年有很多公司 承受不了一线城市发展的速度以及生存的压力与人力成本,就把公司迁到了节奏稍慢点的二线城市。

  2 另外大的公司开始把业务做到的全国,开始在各个二线城市设立分公司,基本上互联网一梯队的公司都在二线城市有分部了。

  3  政策方面,这两年成都政府在政策上进行了大力的扶持,而且扶持力度惊人。

        所以这两年开始越来越多的公司开始把公司从一线城市迁到二线城市,或者扩展到二线。直接影响了成都互联网行业的快速发展

    通过数据可看 一线城市 北上深广 未来仍是互联网行业的主力军。二线城市  杭州 成都 武汉 南京 是主力军 如果想从一线退到二线 这几个城市都是不错的选择

 

 

 

2 城市对某一职位的需求数

  

 

    先看JAVA 

    JAVA在互联网这块的发展这几年明显超越了.NET  再加上 今年的互联网+ 概念导致了一大批的互联网公司掘起。在创业的初期,如何以最花最少的钱获得最大的效益成了初创公司都要考虑的问题

  其中就包括 人力(主要指招聘) 以及软件(开发工具的授权费用)。另外JAVA开源较早,开源社区提供了很多好的包而且支持跨平台,所以从图中可以看出 在一二线城市对拥有Java技能的人才,需求一直就很旺盛。

  但是站在技术角度讲现在JAVA能做的.NET 都能做,而对于公司来说怎么活下去才是关键。

  本人所在公司 15年就被微软发现使用了盗版软件,被要求买license如果整套环境都用正版至少得要上百万,最后死缠烂打也花了10多万才算解决这事儿

 

 

  

   再说.NET 

    一线城市需求还是比较大的,城市之间的差距也不是很大,在一线城市中JAVA与.NET 需求量都相差不大,大致原因,应该还是一线城市公司的基数大,对.net,与JAVA 的需求都比较大

  但到了二线城市 反差就比较大了,.NET 数据 基本上不到一线城市的一半了,可能也是受互联网+的影响,其实本来和JAVA应该持平的,但是互联网+的概念一出大批的互联网公司起来

  考虑到之前说的公司成本问题,才导致对JAVA技能的人需求增加,还有一种可能是,近几年JAVA占市场比逐年增加导致.NET市场减少

 

  最后看看JavaScript 

     这一两年 JavaScript这一岗位可以说是发生了天翻地覆的变化,也使得 前端工程师 这一职位被独立出来各种优秀的前端框架也层出不穷。也从传统的pc浏览器到了移动端浏览器,

   一线城市需求最大的还是 北京和上海 几乎是深圳和州各自的2倍了。

  这也更加证明了北京是全国的互联网中心,随着移动互联网的迅速发展 各个城市的需求应该也会快速加大。

 

 

 

3 城市对人才年限的需求数

  

     可以看出来,不管是哪个城市 对1-3年 和3-5 年的人才 需求是最多的

  这个其实很好解释,放到自己的工作环境来说基层员工和中层员工是生产力的大军,而高层只要几个,把控好方向与进度就行了.

  剩下5-10年的 要么就是招的架构师级别的,要么就是工作岗位的要求需要至少5年以上的经验

 

4 同职位不同城市薪水对比

 

   

 

  先解释点 拉勾发布的职位都是会带上薪水范围的,图中的彩色柱状条是对该薪水断的职位的总和

 

   先看JAVA

      一线城市以 11-15k 的和16k-20k的 为主,然后是21k-25k的,

   而二线城市 则以 6k-10k的和11k-15k的为主,然后是16-20k 的 所以一线城市要比二线城市的薪水高一个梯队,这个大家也都是知道的,不做多的解释了。

 

 

 

  .NET 的 

 

  最近总有人说搞.net 的工资没有搞JAVA的高,但都是以身边的人为例子而以数据缺乏准确定性

  通过图要可以看出

     发布的JAVA职位在一线城市中 16k-20k 的数量是要超过 11k-15k的数量的,而二线城市中  6k-10k 与11k-15k的数量是不相上下的,而且还有不少 16-20k 职位

  而.NET 的职位 在一线城市中11k-15k的职位数量远超过16k-20k的数量 而二线城市中6k-10k 的职位数据也是远超过11k-15k的职位数,而16k-20k的就更是寥寥无几了

    通过两图对比可以看出 在一线城市 JAVA以11k-15k与16k-20k 为主 且16k-20k的为主导,.NET 也以11k-15k与16k-20k 为主

  但是却是以11k-15k为主,二线城市就更不用说,图一对比就懂了

  结论也不用说了

 

 

5 行业薪水分布

 

   

 

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • HTML5 进阶系列:indexedDB 数据库 - _林鑫

    HTML5 进阶系列:indexedDB 数据库 - _林鑫

    2017-04-27 14:02

  • 云计算之路-阿里云上:数据库连接数过万的真相,从阿里云RDS到微软.NET Core - 博客园团队

    云计算之路-阿里云上:数据库连接数过万的真相,从阿里云RDS到微软.N

    2017-04-08 15:00

  • 云计算之路-阿里云上:RDS数据库连接数过万引发故障,主备库切换后恢复正常 - 博客园团队

    云计算之路-阿里云上:RDS数据库连接数过万引发故障,主备库切换后恢

    2017-04-07 16:00

  • 在IIS上部署你的ASP.NET Core项目 - 王杰光

    在IIS上部署你的ASP.NET Core项目 - 王杰光

    2017-04-07 08:00

网友点评