强化学习在现实世界的应用

虽然强化学习已经存在一段时间,但许多人认为其应用仅限于计算机模拟,这是一个误解。实际上,强化学习在工业界有着广泛的应用。以下是来自DataHack Summit 2018的强化学习专家Balaraman Ravindran教授的一段话:

在本文中,将介绍DataHack Summit 2019上的四个精彩环节,这是印度最大的应用人工智能机器学习会议。将有机会听到并与目前正在处理现实世界强化学习用例的杰出专家和实践者互动。这是一个绝对不想错过的机会!座位有限,建议今天预订位置。

还鼓励花些时间听听这两个关于强化学习的DataHack Radio播客节目:

  • 与Balaraman Ravindran教授一起探讨强化学习
  • 与Xander Steenbrugge一起探索强化学习的应用与潜力

以下是DataHack Summit 2019上强大的强化学习环节:

相信都使用过Uber或Ola(或类似服务)平台来叫车。都变得非常依赖这些出租车聚合商,让从一个地方快速到达另一个地方。

从客户的角度来看,最不被重视的方面之一是预订出租车和出租车到达家门口之间的短暂等待时间。想一想——会等半小时的出租车吗?不太可能,对吧?

在当今竞争激烈的出租车服务行业中,预测未来客户请求的位置并相应选择路线至关重要,以获得竞争优势。这些策略性选择的路线导致客户等待时间更短,出租车司机的燃油成本更低。对每个人来说都是双赢的!

在这次主题演讲中,印度理工学院德里分校的助理教授Sayan Ranu博士将讨论实现这一目标的算法。通过在真实数据集上的广泛实证评估,他将展示所提出的策略导致客户等待时间缩短高达70%,客户数量增加40%,拒绝率降低20%。

这次主题演讲的关键收获:

  • 路线推荐的概述及其工作原理
  • 理解强化学习对出租车行业的影响

这是不想错过的一次演讲!

这是DataHack Summit 2019上最受期待的主题演讲之一。如何将强化学习的研究发展带入现实世界?强化学习(RL)在工业环境中的哪些地方和方式起作用?

强化学习多年来一直充满希望(DeepMind全力投入RL并非巧合)。但在将其引入工业界的进展方面进展缓慢。

好消息是——有专家已经成功地弥合了这一差距。很高兴宣布其中一位专家,Harshad Khadilkar博士,他将谈论强化学习在现实世界中的应用。

他将简要概述强化学习及其内部工作,坚持数学直觉而不是严格的方程和推导。

在此之后,他将强调人们在将强化学习从计算机模拟和游戏转移到现实世界时面临的主要挑战。演讲将重点关注这些问题的潜在解决方案,以及来自交通、物流和供应链运营领域的实际示例。

这是Harshad博士本人关于从DHS 2019中可以期待的关键收获的快速视频:

这是另一个实际原因,为什么不能错过参加DHS 2019!

所以预订座位,到那里去!

已经听说了如何弥合在模拟设置中使用强化学习和进入工业应用之间的差距。是时候看看代码是如何工作的了!

相信这将吸引所有数据科学家和机器学习实践者的兴趣。这是一个难得的机会,可以看到一个行业级强化学习主题的动手编码会话。

以下是Richa和Hardik将在这次黑客会话中介绍的主要主题:

  • 强化学习在现实生活问题上的应用简介,而不是游戏环境
  • 应用强化学习解决简单用例的代码演示,例如解决在线3D装箱问题
  • 主要关注点将是设计架构、训练范式和结构化实验

这是Hardik Meisheri关于可以从这次黑客会话中期待什么的短视频:

黑客会话是关于机器学习、深度学习、强化学习、NLP等趋势案例研究和应用的一小时动手会话。

金融似乎是机器学习完美的领域,对吧?都是关于数字、寻找模式、分析趋势等。但强化学习在哪里发挥作用?

好吧,即将在Sonam Srivastava的精彩黑客会话中找到答案!Sonam将进行一次动手编码会话,展示如何使用强化学习自动管理投资组合。

强化学习在金融领域的应用仍处于起步阶段,但潜力无疑是无与伦比的。以下是Sonam的黑客会话结构:

  • 介绍深度强化学习和如何定义一个RL问题?
  • 介绍问题陈述和网络架构的定义
  • 使用的网络类型
  • 评分函数
  • 如何优化成本和其他细节
  • 笔记本的演示:
    • 探索性数据分析
    • 演示RL框架+其他比较框架
    • 与其他比较框架的结果演示
  • 关于深度RL用于投资组合优化的更多资源/论文
沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485