设为首页 - 加入收藏 延安站长网 (http://www.0911zz.com)- 国内知名站长资讯网站,提供最新最全的站长资讯,创业经验,网站建设等!
热搜: 团体 华为 苹果 发布
当前位置: 首页 > 综合聚焦 > 移动互联 > 评测 > 正文

Python爬虫:爬一下十月份的就业情况

发布时间:2019-11-06 14:24 所属栏目:[评测] 来源:千锋python学院
导读:不知不觉,十月份已经过去了,传说中的金九银十招聘季也应该随之结束了,不知道有换工作打算的朋友有没有找到理想的下家,反正我没有 于是乎,我再次转战 Boss 直聘,我就是想看看,到底什么工种比较好找工作呢。当然了,这里工作种类实在是太多了,我就挑

不知不觉,十月份已经过去了,传说中的金九银十招聘季也应该随之结束了,不知道有换工作打算的朋友有没有找到理想的下家,反正我没有

Python爬虫:爬一下十月份的就业情况

于是乎,我再次转战 Boss 直聘,我就是想看看,到底什么工种比较好找工作呢。当然了,这里工作种类实在是太多了,我就挑选出 Python,Java,数据分析和产品经理这四种岗位来做下简单的分析。

Python爬虫:爬一下十月份的就业情况
  • 获取数据

我在前面就写过一篇获取 Boss 数据的文章,可以戳这里查看(查看)。但是后面有人反映说 Cookies 过期时间太快了,我自己尝试之后也确实如此,那么这种情况下,使用 selenium 就是更好的选择了。

由于网站页面结构并没有变化,所以以前的解析网页的代码基本可以复用,只不过从 bs4 解析变为 webdriver 解析

  1. def get_jobs(page, city, job_type): 
  2.  Chrome_driver = webdriver.Chrome(options=options) 
  3.  c_code = city_code[city] 
  4.  for i in range(1, page + 1): 
  5.  try: 
  6.  print("正在抓取第 %s 页数据" % i) 
  7.  uri = '/%s/?query=%s&page=%s' % (c_code, job_type, i) 
  8.  Chrome_driver.get(config.url + uri) 
  9. ... 

同时这里要注意的是,Boss 网站会检测浏览器是否在受 selenium 控制,所以我们还要增加一条配置,来绕过该检测

  1. from selenium.webdriver import ChromeOptions 
  2. options = ChromeOptions() 
  3. options.add_experimental_option('excludeSwitches', ['enable-automation']) 

之后就可以运行程序等待完成了

  1. if __name__ == '__main__': 
  2.  for i in city_code.keys(): 
  3.  get_jobs(10, i, 'python') 
  4.  get_jobs(10, i, 'java') 
  5.  get_jobs(10, i, '数据分析') 
  6.  get_jobs(10, i, '产品经理') 

每种岗位我只爬取了前10页,毕竟我们翻看工作的时候,也不会翻看到10页以后吧

而对于城市,我则选择了如下的城市

  1. city_code = { 
  2.  'beijing': 'c101010100', 
  3.  'shanghai': 'c101020100', 
  4.  'guangzhou': 'c101280100', 
  5.  'shenzhen': 'c101280600', 
  6.  'hangzhou': 'c101210100', 
  7.  'xian': 'c101110100', 
  8.  'wuhan': 'c101200100', 
  9.  'chengdu': 'c101270100', 
  10.  'nanjing': 'c101190100' 
  • 招聘薪资整体分析

首先我们先来看下不同城市间,同种工作的招聘薪资对比,正所谓没有对比,就没有伤害

Python爬虫:爬一下十月份的就业情况

图中的薪资来源:选择岗位中招聘薪资区间最多的作为普遍薪资,如对于西安的 Java 岗位,10-15K 是最多的薪资区间,那么西安 Java 岗位在图中的数值即为(10+15)/2 + 32/10 = 15.7

Python爬虫:爬一下十月份的就业情况

从图中的数据可以看出,北京、上海、深圳和杭州的普遍薪资是高其他城市一等的,那么应该是第一阶梯,所谓的“北上广深”可能即将成为过去式了。

同时还能看出,虽然近些年 Python 混的风生水起,大红大紫,但是薪资相对来说却不是很高,所有的城市都没有超过30K,相比杭州的 Java,深圳的数据分析和北京的产品经理来说,Python 还是太弱势了。

而从整体来看,产品经理绝对是总体薪资水平很高的岗位,无论程序猿们服不服气,你们的战友(天敌)就是会压你一头。

下面再来看看不同城市对于不同岗位的需求程度,我这里默认需求程度高,那么普遍薪资也高。

  • 岗位城市需求

Python 需求情况

Python爬虫:爬一下十月份的就业情况

能够看出,对于 Python 来说,北京、上海和深圳可能是比较好发展的城市,而南京竟然垫底,这让我情何以堪啊。

Java 需求情况

Python爬虫:爬一下十月份的就业情况

上海和杭州是独一档的存在,拥有阿里巴巴的杭州,招聘高级 Java 可不是闹的哦。而其他城市则分布的较为平均,看来老牌语言的威力就体现在这里了,哪个公司敢说自己一点 Java 都不用呢?

数据分析岗位

Python爬虫:爬一下十月份的就业情况

对于数分岗位,深圳一马当先,我想这会不会和腾讯有着莫大的关系呢,毕竟分析好自己和别人的数据,才更好。。。

而北京也是独占第二档,看来近来大火的数据分析岗位,还是在大城市,大厂中更加有发展前途哦。

产品经理岗位

Python爬虫:爬一下十月份的就业情况

能够看出,北京应该是产品经理的天堂,这也非常符合北京这座城市的身份地位–引领中国互联网的潮流。

而深圳、上海、杭州和南京对于产品经理来说也会有不错的发展,毕竟这几座城市,是多少年轻人梦开始的地方!

  • 总体岗位分布

最后再来看看总体岗位需求分布情况

Python爬虫:爬一下十月份的就业情况

可以清晰的发现,当前的岗位需求分布还是分为三大块,北京地区,长三角地区和广州-深圳地区。

无论是当年的改革开放还是如今的互联网热潮,东南沿海地区一直都走在前列,大型企业入驻,人才涌入,大大推动了地区的发展,从而也水涨船高,无论是薪资还是需求量,都遥遥领先于其他地区。

而对于中部城市西安、武汉和成都等,不是它们不够好,而是先天的差距,需要后天更多的资源倾斜才能弥补。

  • 岗位名称

说了这么多,那么各个企业到底都在招聘什么岗位呢

【免责声明】本站内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。

网友评论
推荐文章