在数据分析领域,Python和R语言都拥有丰富的库支持。本文将介绍两个在各自领域中广受欢迎的机器学习库:Python的Scikit-Learn和R的Caret。
Scikit-Learn是Python中一个强大的机器学习库,由David Cournapeau在2007年作为Google暑期代码项目开始开发。同年,Matthieu Brucher加入项目。2010年,INRIA的Fabian Pedregosa、Gael Varoquaux、Alexandre Gramfort和Vincent Michel参与项目,并在同年2月1日发布了首个公开版本。自那以后,项目得到了许多新的贡献。
Scikit-Learn提供了一系列的监督和非监督算法,并且构建在SciPy之上。如果想要获得Scikit-Learn在Python中机器学习的实践经验,这里有一个step by step guide
。
R平台被证明是统计计算和应用机器学习中最强大的平台之一。Caret(Classification And Regression Training)是R中最大的项目之一。Caret包由Pfizer的Max Kuhn创建和维护。开发始于2005年,后来开源并上传到CRAN。这里有一个practice guide
,用于在R中使用Caret包实现机器学习。
为了帮助大家在Python和R中分别提高对Scikit-Learn和Caret的熟练度,提供了相应的速查表。可以通过点击[点击这里]
下载这些速查表的PDF文件。