随着科学技术的飞速发展,计算机的普及以及人类生活的渗透,越来越多的高校为它们提供了“计算机科学与技术”和其他相关专业最受欢迎的专业之一。该国伴随着许多创新而出现了计算机职业。职位的出现不可避免地导致对人才的充分需求。
但是目前,计算机专业人员的就业普遍下降。当前的社会就业竞争异常激烈,尽管IT行业发展迅速,人才缺口在逐步扩大,但IT行业中许多求职者的工作目标不明确,对就业市场的了解也不清。已经变得空前,他们正面对自己。您最喜欢的公司可能需要与许多人竞争才能获得职位。对于一些工作技能强,综合素质高的申请人,他们反复被理想的公司所接受,因为他们不了解工作市场和公司招聘需求,没有经验和策略可申请,而且公司很难招到他们需要的可靠人才。
为了解决这个日益重要的就业问题,我们考虑使用当今流行的大数据分析和应用技术对计算机行业的招聘信息进行更详细的分析。“大数据”在物理学,生物学,环境生态学,军事,金融和通信领域中存在已久。近年来,互联网和信息产业的发展引起了人们的关注。随着计算机和信息技术的飞速发展和普及,工业应用系统的范围迅速扩大,工业应用生成的数据爆炸性增长,而企业级大数据的范围从数百TB甚至数十PB到数百PB不等。远远超过了现有传统计算机技术和信息系统的处理能力。因此,在现实世界中寻找有效的大数据处理技术,方法和手段已成为当务之急。人们越来越意识到数据对企业的重要性。大数据时代对控制人类数据的能力提出了新的挑战,并为人们提供了空前的空间和潜力,以探索更广泛的取胜方法。
我们的项目研究可以通过使招聘信息与众不同来帮助即将进入社会的求职者和学生了解总体策略和方法,并在申请工作时具有越来越清晰的目的和相关性搜索公司,我们可以帮助求职者阐明哪些技术公司需要的人才,不同职位的薪水和知名度,竞争力是什么等,以及有关ITIndustry的最新招聘信息以网站和微信小程序的形式进行统计和分析并可视化。他们想帮助求职者了解更多有关企业招聘趋势,职位信息变化以及当今社会最稀有和最热门的技术的信息。我们希望通过数据分析,我们将发现准备进入IT行业的学生或学习者,可以帮助阐明他们的学习趋势,设定更清晰的学习目标和努力,帮助求职者明确和完善自己在工作场所的行为,并鼓励竞争:帮助企业招聘人员了解国内知名公司的总体招聘趋势,以调整招聘方向。
两种分析思路在分析数据之前,我们的团队从51Job人才招聘网络等各种国内招聘网站上获取了招聘信息,我们主要使用python履带技术来获取网站上与计算机行业相关的不同区域的详细招聘信息。获得的信息属性主要是信息来源,出勤时间,招聘职位的名称,工作所在的省,市和地区,求职者的工作经验要求,学术要求,工作分配,其他要求,员工福利,员工上限和下限,员工平均数员工人数,工作所属的公司,公司的主要业务类别,公司的类型,公司的介绍,薪资范围,薪资上限,最低工资,平均工资,共计数百万个数据。
然后,我们使用Kettle清理数据。这些具有范围,真实性,及时性和结构性的数据为我们的团队分析数据奠定了良好的基础。最后,在共同协商下,我们的团队成员决定收集有关不同省市的劳动力需求和平均工资,招聘信息中包含的热门技术关键字和福祉关键字以及编程语言的受欢迎程度的数据,然后进行更详细的分析。。时间序列预测的算法分析和协同过滤的推荐。分析工具主要是Python3,因为Python包含大量的第三方模块,例如Pandas,Numpy,Matplotlib等,这对于数据的分类,分析,处理和可视化非常有用。为了更直观地呈现数据分析的结果,我们使用了Tableau和Java。
最后,我们决定使用两种软件形式完美显示数据:Web前端和移动客户端用户应用程序。下图显示了我们的数据分析的内容层次结构:
图1:数据分析层次结构图
3.分析内容
1.我们首先进行全面分析,首先从在全国不同地区对计算机相关工作的需求分布进行分析,主要分为三个逐步进行的步骤。
1)第一步,我们首先创建每个城市的劳动力需求统计数据,接收包含相关数据的表格,并选择要通过matplotlib显示的劳动力需求排名最高的十个最佳城市(请参见以下插图):
图2:十个最大城市的就业需求
2)您需要在每个地区雇用哪些职位?因此,我们根据不同职位对每个地区的招聘信息进行分类,并计算了每个地区不同职位的招聘需求,从而反映了工作的热情。图3以广州为例,显示了最受欢迎的职位空缺统计。由于此分析的内容更加复杂,因此我们创建了一个数据库,并在自己开发的网站上使用SpringBoot和Mybatis连接到AutoNavi maps API,以使用多维GISMake纬度和经度对齐来更分层地完成此分析任务。显示效果图如图4所示:
图3:每个地区不同职位的招聘需求图4:多维GIS显示最受欢迎的招聘需求
3)每个职位的薪水是多少?这些职位的最高薪水与最低薪水之间有何差距?在这方面,我们进行了更深入的分析,采用了更加科学的统计方法,我们选择了算术平均值来表示平均水平,而工资上下限之间的差距取决于工资的分散程度。数据,因此我们选择标准差作为指标,其数学公式如下:
图5:标准差的计算公式其中N代表自由度,xi代表不同样本的价值,这里代表每个职位的平均薪水,r代表样本平均值,这里是平均值的平均值所有职位的薪水。我们继续在公式后编写Python程序,并在进一步分析后接收到数据.Tableau呈现的效果图如图6所示。
图6:广州各职位的平均工资和标准差
2.最流行的编程语言是根据设置信息中的编程语言数来计算的。
图7:最受欢迎的编程语言及其频率
3.我们使用Python3的Jieba模块从几个最热门的技术关键字的招聘信息,流行技术和统计信息中提取关键字。比例如下:
图8:最受欢迎的技术关键字及其频率
4.求职者非常关注工作的收益。因此,我们对从不同公司招聘职位的收益进行了关键词提取和分析。下图显示了各个关键词的比例。
图9:职位空缺的福利关键词5.以上数据分析结果只能查看并且没有明显的实际用途,为此目的,我们使用数据预测算法对趋势进行了更详细的研究。数据预测使用AutoregressiveIntegratedMovingAverage模型(ARIMA))模型,即基于数据与自身之间的关系,预测数据趋势的微分积分自回归移动平均模型(参见图10)。
图10:ARIMA模型6.我们还进行了深入的分析-基于Pearson相关系数的协作过滤算法。该算法使我们能够向不同的用户推荐他们感兴趣并适合他们的招聘信息。(或PCCs),用于确定两个变量X和Ymeasure之间的相关性(线性相关性),其值在-1和1之间。
4.结论与总结
通过对收集到的与计算机相关的招聘信息进行更详细的分析,我们的团队得出以下结论:
1.总的来说,中国对计算机行业相关工作的需求很大,尤其是在广州,上海和深圳等技术先进的沿海城市,对计算机人才的需求仍然很大。职位需求最大,在此统计中总计148,737。
2.关于计算机职位,开发工程师对人才的需求很高,薪水水平也很高。由于诸如建筑师这样的职位必须具有非常广泛的专业技能,因此这些职位的薪水水平相对较高,我们团队这次计算得出的平均建筑师薪水约为24,000元/月。计算机工程师和开发人员的薪水通常比计算机讲师的薪水高得多。总体来说,公司经理人员的工资水平高于正常员工和实习生的工资水平,分析结果与工作场所情况相吻合。3。在编程语言的流行度方面,根据我们收集的数据,Java仍然是企业招聘的第一语言。由于Java语言的强大功能,许多公司运行的软件项目有着千丝万缕的联系,这种趋势是不难打破,因为它开放了与Java有关的编程,并且多年来继承了Java在项目开发中的重要作用。分析结果表明,Python,SQL,C / C ++和JavaScript在公司招聘中的参与率也很高很高。根据官方统计,Python和JavaScript在最近几年变得越来越流行。随着它们的使用和功能的不断增加,ARIMA算法预测这两种语言的流行度在未来将继续增加。SQL和C / C ++是非常经典和稳定的语言,在许多开发项目中都是不可替代的角色。因此,该公司非常认真地雇用他们。
4.大多数公司会以“五险”,“一金”和“年终奖金”等福利吸引求职者,而这些福利恰好是大多数求职者所希望的。
总而言之,我们的团队本身就收集了与国内计算机相关的招聘信息,并对这些数据进行了各种分析,从不同的角度对中国计算机行业的当前就业状况以及结果进行了一些了解和报告。所获得的一般都符合实际情况。基本上与官方权威统计一致更及时的数据。使用更有效的分析方法来检查更强大,更深入的数据挖掘算法,以总结和显示更真实有效的分析结果。
好了,今天的故事就是在这里与您分享的,我是您的朋友,哥哥,大华仔,下期见。如果您喜欢这篇文章,请确保喜欢,评论,张贴,添加书签并关注它。
免责声明:作者保留版权,严禁任何形式的手稿冲洗,如需商业转载请联系作者,如需非商业转载请注明出处。
如果您想学习更多精彩内容,请快来关注“老大哥华仔”