2020年7月开源数据科学项目精选

在机器学习、深度学习架构和框架的快速发展中，保持最新知识变得越来越困难。同事建议参考并参与一些开源数据科学项目，这一直是保持行业趋势更新和职业发展的秘密武器。以下是2020年7月创建或发布的顶级开源数据科学项目列表。

Transcoder – Facebook的编程语言转换器

想象一下，能够将一种编程语言转换为另一种，而无需了解任何一种语言的知识，这听起来是不是很神奇？Transcoder是一个转编译器，用于将一种高级语言的源代码转换为另一种，如C++、Python和Java。

传统上，使用转编译器来转换已经过时或废弃的语言的代码库。这些通常依赖于手写的规则，需要大量的手动工作，代码缺乏可读性，最终导致项目成本高昂。

Transcoder的引入彻底改变了这一领域。Transcoder利用最新的无监督机器翻译技术，训练了一个完全无监督的神经转编译器。这个开源项目展示了它能够成功地在C++、Java和Python之间转换函数，并且准确度很高。

# 示例：C++和Java函数转换为Python
        # 来源：https://github.com/facebookresearch/TransCoder

Complex YOLO V4 – 复杂的实时3D目标检测

YOLO，即You Only Look Once，当谈论需要高准确度、快速计算和并行处理的实时目标检测时，它一直是最喜欢的实时架构。以下文章包含了更多关于这个架构的信息：

Complex YOLO是一个基于最新架构YOLOv4的PyTorch实现，基于论文“Complex-YOLO: Real-time 3D Object Detection on Point Clouds”。随着自动驾驶汽车和其他自动驾驶车辆的引入，基于Lidar的3D目标检测变得非常重要，但它们带来了自己的一系列挑战。

挑战在于能够从高度稀疏的3D数据中实时推理。Complex YOLO是一个最先进的3D目标检测系统，能够以高精度很好地处理这些挑战。

# 示例视频：https://github.com/maudzung/Complex-YOLOv4-Pytorch

MMDetection3D – 深入3D目标检测

这是OpenMMLab家族中又一个伟大的开源项目，如MMDetection和MMClassification。目标检测一直是计算机视觉社区中的一个持续问题，但主要是在2D目标预测的方向。但随着进入未来，可能想要关于对象的额外信息，如其大小、方向和位置，这使得3D目标检测变得非常重要。

3D目标检测在机器人技术、自动驾驶车辆、图像检索和增强现实领域有着重要的应用。可以使用基于PyTorch的MMDetection3D对象检测工具箱，在3D目标检测领域工作。

# 示例视频：https://github.com/open-mmlab/mmdetection3d

DeText – 深度神经文本理解框架

让给两个爱上这个库的理由。首先，它智能地统一了许多NLP任务，其次它的座右铭是“像树懒一样放松，让DeText为理解”。

DeText是LinkedIn工程团队开发的最先进的框架，用于NLP相关任务的深度文本理解，如排名、分类和语言生成。

让问一个基本问题——当打开浏览器时，最常做的事情是什么？或多或少会在搜索栏中输入查询。在后端，许多复杂的NLP任务发生，以显示基于查询和推荐的最佳结果。

随着深度学习NLP技术的进步，如BERT，NLP领域发生了革命性的变化。这为这个增长空间提供了新的能力，但没有一个适合所有框架的解决方案。这就是DeText的用武之地。有了DeText，用户可以根据任务类型更改NLP模型，并利用这些模型使搜索和推荐系统比以前更好。

# 来源：https://github.com/linkedin/detext

如果一直在处理时间序列数据，那么有一个额外的奖励给！直到现在，许多时间序列任务都分散在不同的库中。但sktime将一切都整合到了一个地方。

Sktime，也被称为Sklearn的时间序列数据，是一个Python机器学习工具箱，用于时间序列算法。

# 安装命令：pip install sktime

7个应该添加到简历中的开源数据科学项目
6个让在面试中印象深刻的开源数据科学项目
6个在家尝试的开源数据科学项目

人工智能在全球问题解决中的应用

本文探讨了人工智能如何助力解决全球面临的五大紧迫问题，包括塑料污染、疾病控制、能源消耗、粮食危机和医疗诊断，为创造更加可持续和充满希望的未来提供支持。

商业智能工具概览

本文介绍了六种高效的商业智能和数据分析工具，帮助企业提升数据成熟度，发掘可操作的洞察。

2020年7月开源数据科学项目精选

目录

Transcoder – Facebook的编程语言转换器

Complex YOLO V4 – 复杂的实时3D目标检测

MMDetection3D – 深入3D目标检测

DeText – 深度神经文本理解框架

人工智能在全球问题解决中的应用

商业智能工具概览

沪ICP备2024098111号-1

上海秋旦网络科技中心：上海市奉贤区金大公路8218号1幢联系电话：15216758379

2020年7月开源数据科学项目精选

目录

Transcoder – Facebook的编程语言转换器

Complex YOLO V4 – 复杂的实时3D目标检测

MMDetection3D – 深入3D目标检测

DeText – 深度神经文本理解框架

人工智能在全球问题解决中的应用

商业智能工具概览

沪ICP备2024098111号-1

上海秋旦网络科技中心：上海市奉贤区金大公路8218号1幢 联系电话：15216758379

上海秋旦网络科技中心：上海市奉贤区金大公路8218号1幢联系电话：15216758379