KDnuggets:2013年数据分析/数据挖掘/数据科学使用语言排行榜

最受欢迎的语言仍然是R( KDnuggets 读者中有61%用户在用),python(39%),SQL(37%).SAS仍然稳定在20%之间。增长最快是:Pig/Hive/Hadoop为基础的语言、R、SQL,同时perl, C/C++, 与Unix 在下降。同时我们发现,R与python用户存在一定的重叠。

之前的KDnuggets的调查主要是关注:统计与分析软件,但有时候一个全面与强大的编程语言是需要的。这也是最近一次的KDnuggets调查关注的重点,我们咨询:
在2013年中,什么样的程序或者统计语言你是在做分析、挖掘、科学计算的时候所需要的?
基于超过对700名会员的调查,最受欢迎的仍然是R语言(61%的调研会员在用),python(39%),SQL(37%),平均每个调研对象使用2.3种语言。
趋势对比过去二年的调查结果,发现2013的趋势是一样的:

2012年调查:什么样的语言可用于数据分析与数据挖掘。 2011年调查:什么样的语言可用于数据分析与数据挖掘。

· 增长率最高的语言,对比2013 vs 2012是Julia,使用人员增加超过2倍。但仍然是一门小众语言,在2013年也仅有0,7%的用户使用。
· 在比较普通的使用语言中:增加相对较大的语言,对比 2013 vs 2012:
· 以hadoop为基础的语言:Pig Latin/Hive/other,19%的环比增长,从2012年的6.7%增加到2013。
· R,16%的环比增长。
· SQL,14%的增长(SQL的增长是的来源于Hadoop和其它的大数据系统中的SQL接口增长)。

语言的使用份额下降最大的是:

Lisp/Clojure, 77% 下降 Perl, 50%  下降 Ruby, 41%  下降 C/C++, 35%  下降 Unix shell/awk/sed, 25%  下降 Java, 22%  下降

R与PYTHON的使用者是否有重合呢?是的。在使用R语言的13%的用户中,更可能使用python与总体相比要高出13%。下面是哪些语言更可能被R语言用户使用(与总体相比)。

评论:

有一些评论说,比如:指出SPSS也是自己的语法和SAS一样–在下次的调研中,我们将会包括进来。
样本的区域分布为:

US/Canada, 50.8%, Europe: 25.7%, Asia: 11.8%, Latin America: 6.7%, AU/NZ: 3.2%, Africa/Middle East: 1.5%

注:本文来自中国统计网翻译小组——@数据海洋 编译

英文原文:

Top Languages for analytics, data mining, data science

自:中国统计网

 

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处: KDnuggets:2013年数据分析/数据挖掘/数据科学使用语言排行榜