本次会议汇聚了数据科学和机器学习领域的专家和实践者,共同探讨了R语言在这些领域的最新进展。会议为期两天,每一天都聚焦于不同的主题,从tidyverse的应用到深度学习的实践,内容丰富而深入。
第一天的议程主要集中在tidyverse的应用上。主题演讲由Diane Cook带来,她探讨了“tidyverse及其在数据科学未来中的挑战”。她强调了tidy数据在将原始数据转化为统计教科书中的数据中所扮演的粘合剂角色,并预测它将继续在未来的各个领域中发挥作用。
Davis Vaughan介绍了“tidyverse中的时间序列和金融分析的未来”,他揭示了几个包,这些包正如其名所示,使得处理混乱的时间序列和金融数据变得更加容易。Emily Riederer创建了一个名为“tidycf”的包,这个包极大地简化了现金流分析,并使其更易于解释。
Emily Robinson则聚焦于“tidyverse中不为人知的明星”,她的演讲探讨了一些不太为人所知的tidyverse函数,这些函数可以帮助整理数据。可以。
第一天的其他一些演讲包括:
RStudio
中的调试技巧,由Amanda Gadrow介绍- 使用
Shiny
和Stack Overflow数据理解PCA,由Julia Silge介绍 - 与数据库合作的最佳实践,由Edgar Ruiz介绍
Plumber
:将R代码转化为API,由Jeff Allen介绍
可以在观看第一天的全部视频。
第二天的议程重点放在了R中的深度学习上。主题演讲是JJ Allaire带来的“使用TensorFlow和R进行机器学习”,他首先介绍了张量的基础知识,并介绍了R中的tensorflow
包。Allaire先生通过展示多种部署tensorflow和keras模型的方式结束了他的演讲,包括直接发布到RStudio Connect。
紧随其后的是Google的Michael Quinn,他的演讲主题是“在RStudio中使用TensorFlow、BigQuery和CloudML Engine进行大规模机器学习”。一旦开发了一个tensorflow或keras模型,就可以使用‘cloudml’包将其部署到Google的CloudML。
Javier Luraschi(来自RStudio)的演讲主题是“使用tfdeploy部署TensorFlow模型”。‘tfdeploy’包提供了一种统一的方式来直接将模型部署到包括CloudML和RStudio Connect在内的各种平台。
会议中最引人注目的演讲之一是由Ali Zaidi带来的“使用CNTK-R在Minecraft中进行强化学习”。Zaidi先生展示了他如何训练一个深度学习模型来控制流行视频游戏Minecraft中的一个角色。这个角色被教会如何在一个令人困惑的迷宫中导航,以及理解一些自然语言的片段。用于训练模型的包是“CNTK-R”。
其他一些引人入胜的演讲包括:
- “可以在20分钟内制作一个包”,由Jim Hester介绍
- “为tidyverse做出贡献”,由Mara Averick介绍
- “通过高级分析实现影响:打破采用障碍”,由Aaron Horowitz介绍
- “用R进行故事讲述”,由Olga Pierce介绍
- “用sparklyr构建Spark ML管道”,由Kevin Kuo介绍