|
雇用告白的数量能必然水平上回响每一种软件的风行水平,并从中预测出哪一种在未来会越发风行。以美国最大的雇用网站Indeed.com为统计平台,通过对某一天数据科学地位的雇用数量举办统计阐明,得出数据科学软件的变革趋势。
为了公正,本文回收了一种专门的要领,用来在数据科学地位范畴内统计每种软件的雇用数量,文中所有的图片也都是在这个前提下取得的,统计日期为2017年2月24日。 正文 各类软件雇用量见下图。个中最多的是SQL,快要18000,然后别离是Python和JAVA(13000阁下),Hadoop(10000阁下),R,C系列和SAS(这是R首次在在数据科学地位陈诉中高出SAS),Apache Spark,Tableau(5000阁下,限数据科学地位),Apache Hive(3900阁下),Scala,SAP,MATLAB,SPSS。个中Scala,SAP,MATLAB,SPSS均为2500阁下。
雇用量小于250的软件列在了下图中,别离是:Alteryx(240),Microsoft(Azure Machine Learning and Microsoft Cognitive Toolkit,157),Julia,FORTRAN,Apache Flink(125),H2O(100)。以操纵容易为卖点的SAS Enterprise Miner、RapidMiner和KNIME雇用量都是90阁下,或许是因为各公司认为没有须要礼聘专家?SPSS模块也是同样范例的接口,但却只有50个地位。开源的MXNet深度进修框架有34个地位,而Tensorflow是它的12倍,可是两者都很年青,有足够大的潜力在将来快速成长。
下面我们先来看一下R是如何高出SAS的。从下图可以看出,在2012年到2017年2月28日这个时间段,SAS的地位需求一直都很不变,而R则不变增长并最终在2016年早期高出了SAS。别的按照blog post所述,R于2015年就已经在学术出书物中高出SAS。
再来看一下Python和R。Python和R谁更风行的争论是由来已久,可是从来都没有几多数据支持。可是单从雇用地位上来看,Python于2013年就已经高出了R(如下图)。虽然我们要清楚,R只是纯真用来举办数据阐明,而Python在数据科学规模用途更遍及。
|



















