在机器学习、深度学习架构和框架的快速发展中,保持最新知识变得越来越困难。同事建议参考并参与一些开源数据科学项目,这一直是保持行业趋势更新和职业发展的秘密武器。以下是2020年7月创建或发布的顶级开源数据科学项目列表。
想象一下,能够将一种编程语言转换为另一种,而无需了解任何一种语言的知识,这听起来是不是很神奇?Transcoder是一个转编译器,用于将一种高级语言的源代码转换为另一种,如C++、Python和Java。
传统上,使用转编译器来转换已经过时或废弃的语言的代码库。这些通常依赖于手写的规则,需要大量的手动工作,代码缺乏可读性,最终导致项目成本高昂。
Transcoder的引入彻底改变了这一领域。Transcoder利用最新的无监督机器翻译技术,训练了一个完全无监督的神经转编译器。这个开源项目展示了它能够成功地在C++、Java和Python之间转换函数,并且准确度很高。
# 示例:C++和Java函数转换为Python
# 来源:https://github.com/facebookresearch/TransCoder
YOLO,即You Only Look Once,当谈论需要高准确度、快速计算和并行处理的实时目标检测时,它一直是最喜欢的实时架构。以下文章包含了更多关于这个架构的信息:
Complex YOLO是一个基于最新架构YOLOv4的PyTorch实现,基于论文“Complex-YOLO: Real-time 3D Object Detection on Point Clouds”。随着自动驾驶汽车和其他自动驾驶车辆的引入,基于Lidar的3D目标检测变得非常重要,但它们带来了自己的一系列挑战。
挑战在于能够从高度稀疏的3D数据中实时推理。Complex YOLO是一个最先进的3D目标检测系统,能够以高精度很好地处理这些挑战。
# 示例视频:https://github.com/maudzung/Complex-YOLOv4-Pytorch
这是OpenMMLab家族中又一个伟大的开源项目,如MMDetection和MMClassification。目标检测一直是计算机视觉社区中的一个持续问题,但主要是在2D目标预测的方向。但随着进入未来,可能想要关于对象的额外信息,如其大小、方向和位置,这使得3D目标检测变得非常重要。
3D目标检测在机器人技术、自动驾驶车辆、图像检索和增强现实领域有着重要的应用。可以使用基于PyTorch的MMDetection3D对象检测工具箱,在3D目标检测领域工作。
# 示例视频:https://github.com/open-mmlab/mmdetection3d
让给两个爱上这个库的理由。首先,它智能地统一了许多NLP任务,其次它的座右铭是“像树懒一样放松,让DeText为理解”。
DeText是LinkedIn工程团队开发的最先进的框架,用于NLP相关任务的深度文本理解,如排名、分类和语言生成。
让问一个基本问题——当打开浏览器时,最常做的事情是什么?或多或少会在搜索栏中输入查询。在后端,许多复杂的NLP任务发生,以显示基于查询和推荐的最佳结果。
随着深度学习NLP技术的进步,如BERT,NLP领域发生了革命性的变化。这为这个增长空间提供了新的能力,但没有一个适合所有框架的解决方案。这就是DeText的用武之地。有了DeText,用户可以根据任务类型更改NLP模型,并利用这些模型使搜索和推荐系统比以前更好。
# 来源:https://github.com/linkedin/detext
如果一直在处理时间序列数据,那么有一个额外的奖励给!直到现在,许多时间序列任务都分散在不同的库中。但sktime将一切都整合到了一个地方。
Sktime,也被称为Sklearn的时间序列数据,是一个Python机器学习工具箱,用于时间序列算法。
# 安装命令:pip install sktime