2020年7月开源数据科学项目精选

在机器学习、深度学习架构和框架的快速发展中,保持最新知识变得越来越困难。同事建议参考并参与一些开源数据科学项目,这一直是保持行业趋势更新和职业发展的秘密武器。以下是2020年7月创建或发布的顶级开源数据科学项目列表。

目录

  • Complex YOLO V4 – 复杂的实时3D目标检测
  • MMDetection3D – 深入3D目标检测
  • DeText – 深度神经文本理解框架
  • Sktime – Sklearn的时间序列版本

Transcoder – Facebook的编程语言转换器

想象一下,能够将一种编程语言转换为另一种,而无需了解任何一种语言的知识,这听起来是不是很神奇?Transcoder是一个转编译器,用于将一种高级语言的源代码转换为另一种,如C++、Python和Java。

传统上,使用转编译器来转换已经过时或废弃的语言的代码库。这些通常依赖于手写的规则,需要大量的手动工作,代码缺乏可读性,最终导致项目成本高昂。

Transcoder的引入彻底改变了这一领域。Transcoder利用最新的无监督机器翻译技术,训练了一个完全无监督的神经转编译器。这个开源项目展示了它能够成功地在C++、Java和Python之间转换函数,并且准确度很高。

# 示例:C++和Java函数转换为Python # 来源:https://github.com/facebookresearch/TransCoder

Complex YOLO V4 – 复杂的实时3D目标检测

YOLO,即You Only Look Once,当谈论需要高准确度、快速计算和并行处理的实时目标检测时,它一直是最喜欢的实时架构。以下文章包含了更多关于这个架构的信息:

Complex YOLO是一个基于最新架构YOLOv4的PyTorch实现,基于论文“Complex-YOLO: Real-time 3D Object Detection on Point Clouds”。随着自动驾驶汽车和其他自动驾驶车辆的引入,基于Lidar的3D目标检测变得非常重要,但它们带来了自己的一系列挑战。

挑战在于能够从高度稀疏的3D数据中实时推理。Complex YOLO是一个最先进的3D目标检测系统,能够以高精度很好地处理这些挑战。

# 示例视频:https://github.com/maudzung/Complex-YOLOv4-Pytorch

MMDetection3D – 深入3D目标检测

这是OpenMMLab家族中又一个伟大的开源项目,如MMDetection和MMClassification。目标检测一直是计算机视觉社区中的一个持续问题,但主要是在2D目标预测的方向。但随着进入未来,可能想要关于对象的额外信息,如其大小、方向和位置,这使得3D目标检测变得非常重要。

3D目标检测在机器人技术、自动驾驶车辆、图像检索和增强现实领域有着重要的应用。可以使用基于PyTorch的MMDetection3D对象检测工具箱,在3D目标检测领域工作。

# 示例视频:https://github.com/open-mmlab/mmdetection3d

DeText – 深度神经文本理解框架

让给两个爱上这个库的理由。首先,它智能地统一了许多NLP任务,其次它的座右铭是“像树懒一样放松,让DeText为理解”。

DeText是LinkedIn工程团队开发的最先进的框架,用于NLP相关任务的深度文本理解,如排名、分类和语言生成。

让问一个基本问题——当打开浏览器时,最常做的事情是什么?或多或少会在搜索栏中输入查询。在后端,许多复杂的NLP任务发生,以显示基于查询和推荐的最佳结果。

随着深度学习NLP技术的进步,如BERT,NLP领域发生了革命性的变化。这为这个增长空间提供了新的能力,但没有一个适合所有框架的解决方案。这就是DeText的用武之地。有了DeText,用户可以根据任务类型更改NLP模型,并利用这些模型使搜索和推荐系统比以前更好。

# 来源:https://github.com/linkedin/detext

如果一直在处理时间序列数据,那么有一个额外的奖励给!直到现在,许多时间序列任务都分散在不同的库中。但sktime将一切都整合到了一个地方。

Sktime,也被称为Sklearn的时间序列数据,是一个Python机器学习工具箱,用于时间序列算法。

# 安装命令:pip install sktime
沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485