在这个快速变化的技术世界中,持续学习是保持竞争力的关键。一旦停止学习,就会开始落后。在这种学习过程中,不断地寻找新工具和技术的最新发展。正是在这种不断学习的愿望驱使下,大约一年前接触到了Julia。当时它还处于非常早期的阶段——现在仍然如此!
但是,Julia有一些特别之处,使其成为所有未来数据科学家必须学习的强大工具。因此,决定写几篇文章来介绍它。这是第一篇文章,提供了学习Julia的动力、安装方法、当前可用的包以及如何成为Julia社区的一部分。
Julia是一种高级、高性能的动态编程语言,专为技术计算而设计,具有易于编写的语法。它提供了一个复杂的编译器、分布式并行执行、数值精度和广泛的数学函数库。
理解其强大之处的最简单方式是将其视为一种语言,它具有像R这样的广泛统计包,像Python一样易于编写和学习,并且具有与C/C++相似的执行速度。如果仍然对提到的内容不感兴趣,请查看下面一些常见基准的比较:
C语言由gcc 4.8.2编译,从所有优化级别(-O0到-O3)中选择最佳时间。C、Fortran和Julia使用OpenBLAS v0.2.12。Python实现的rand_mat_stat和rand_mat_mul使用NumPy(v1.8.2)函数;其余是纯Python实现。
从数据科学能力的角度来看,一些重要的特点是:
现在可能已经迫不及待地想尝试上述承诺的Julia了,让快速介绍几种选项来测试新轿车(它具有跑车般的加速度):
截至2015年7月9日,Julia共有610个包。如果过滤掉测试失败或未经测试的包,只剩下381个包。在这些包中,过滤出了与数据科学相关的包,并且拥有超过15个星标。以下是这些包的列表:
包 | 描述 | 版本 | 星标 |
---|---|---|---|
BackpropNeuralNet | Julia中的神经网络 | 0.0.3 | 18 |
Bokeh | Julia的Bokeh绑定 | 0.1.0 | 26 |
在Julia中安装和使用包非常简单。如果想安装/添加一个包,只需在编程界面中输入以下内容:
Pkg.add("Gadfly")
这将安装该包及其依赖项。一旦包安装完成,可以通过调用“using”来加载它:
using Gadfly
简单吧!
Julia得到了一个紧密的开发者社区的支持。以下是一些可以加入的邮件列表: