依据爬取的招聘信息建立机器学习模型

现已爬取到招聘信息,包括岗位名称,岗位地点,公司名称,薪资水平,工作经验要求,学历要求,公司福利,详细要求。想要据此建立机器学习模型,可以有什么样的思路呢?

这不是看你要达到一个什么样的需求吗?
举个例子,可以做职位匹配度预测模型,利用TextCNN或者Fasttext做职位匹配度预测,用户输入数据,然后利用它做职业推荐算法模型,用这个来做推广。我有过这方面经验。

可以按照以下步骤来建立机器学习模型:

  • 对爬取到的招聘信息进行清洗,去掉重复的信息,空白字符和无用的字符。
  • 将清洗后的信息按照特征和标签的形式存储,其中,特征包括岗位名称,岗位地点,公司名称,薪资水平,工作经验要求,学历要求,公司福利等,标签包括详细要求。
  • 设定目标(比如薪资段作为类别)
  • 选择合适的机器学习算法,例如逻辑回归、支持向量机、决策树等,进行模型的训练。
  • 使用训练好的模型对新的招聘信息进行预测,输出预测结果。

如果按照专家系统的构建思路,需要先分析数据的相关性,然后对数据标签进行分组。如果数据量不够大,可以根据开发者的主观经验进行初步的数据规范化设计(数据收集录入设计,数据整理入库方案设计,数据统计与合组方案设计),这部分工作主要是为了准备好基础数据。之后则是,使用常用的软件包来进行数据处理。