前言

从智联招聘爬取相关信息后,我们关心的是如何对内容进行分析,获取用用的信息。

本次以上篇文章“5分钟掌握智联招聘网站爬取并保存到MongoDB数据库”中爬取的数据为基础,分析关键词为“python”的爬取数据的情况,获取包括全国python招聘数量Top10的城市列表以及其他相关信息。

一、主要分析步骤

  • 数据读取

  • 数据整理

  • 对职位数量在全国主要城市的分布情况进行分析

  • 对全国范围内的职位月薪情况进行分析

  • 对该职位招聘岗位要求描述进行词云图分析,获取频率最高的关键字

  • 选取两个城市,分别分析月薪分布情况以及招聘要求的词云图分析

二、具体分析过程

import pymongoimport pandas as pdimport matplotlib.pyplot as pltimport numpy as np
% matplotlib inline
plt.style.use('ggplot')
# 解决matplotlib显示中文问题plt.rcParams['font.sans-ser