在数据分析领域,一个重要的进步已经实现。基础的数据管理、分析和可视化工具Microsoft Excel,通过整合Python功能,其分析能力迈出了重要的一步。这一集成标志着数据分析、机器学习、预测分析和数据清洗等领域的一个重要里程碑,所有这些功能都可以在熟悉的Excel环境中无缝访问。这一创新结合了Python编程语言的高级特性和Excel界面的可识别性,有效地弥合了两者之间的差距。Microsoft已经正式推出了Excel中Python的公开预览版。这种能力将Python脚本的强大功能与Excel公式的熟悉和多功能性无缝融合,全部集成在一个工作簿中。
要开始在Excel中使用Python,选择一个单元格,访问功能区的公式选项卡,点击“插入Python”。这提示Excel识别在指定单元格中创建Python公式的意图。或者使用函数=PY。可以使用公式栏进行类似编程的编辑行为。按下Enter键创建新行。通过点击向下箭头图标扩展公式栏,一次查看多行代码。
在Excel中,可以利用Python库的强大功能来制作可视化图表,创建机器学习模型,并进行高级分析。将Python直接集成到Excel是由新的PY函数促成的,它允许直接在Excel单元格中输入Python代码。使用Excel中的Python不需要安装任何额外的工具。点击Excel功能区公式部分的“插入Python”按钮后,可以开始编写Python代码。
内置的xl() Python函数使得从工作簿传输数据成为可能,并且可以将=PY()的Python代码输出作为结果返回。默认情况下,Python单元格将输出格式设置为Excel值,将单元格代码生成的任何Python对象的值转换为类似于Excel输出的格式。
Excel提供了内置的连接器,并使用Power Query,Microsoft的数据操纵工具,以促进外部数据的导入。对于从外部源导入数据,使用Excel的“获取和转换”功能。此功能使用Power Query来促进导入过程。请记住,使用Python在Excel中处理的任何数据应该要么来自工作表,要么通过Power Query。
Microsoft保证在Microsoft Cloud基础设施内安全执行Excel中的Python,将企业级安全集成到Microsoft 365体验中。这一保证确保代码在Microsoft Cloud环境中执行,而不是本地。它使用Azure容器实例在安全容器内隔离,增强安全措施,防止未经授权的访问。
它促进了广泛Python包的集成。在Excel中,可以获得像pandas这样的库用于数据操纵,statsmodels用于高级统计建模,Matplotlib和Seaborn用于创建数据的图形表示。
用户可以自信地与团队成员共享包含Python的Excel工作簿。同事们可以毫不费力地参与和更新基于Python的Excel中的分析,而不需要担心安装额外的软件、Python运行时或处理库和依赖关系。
如果拥有最新的内部版本Excel,请按照以下步骤访问Pythonin excel。选择插入Python,然后选择自定义python公式并将更改框选为Python模式。否则,可以直接在任何单元格中输入=py,激活Python模式。
第一步是选择Excel的数据集并将其发送到Python以创建数据框。可以通过引用Excel的单元格来做到这一点。当按下Ctrl+Enter时,会创建一个数据框。可以使用Python输出下拉菜单在Excel或Python视图之间切换。
如果需要查看数据集,点击数据卡,可以看到数据框的开始和结束。让看一个按日期分组的sales列的示例。在这里,所有内容都根据日期进行分组。即使更改原始数据集中的任何值,结果也会立即反映出来。单元格中显示的一切都是l的结果。
由于Python计算是在Microsoft的云平台上执行的,因此对用户本地Python设置的任何自定义调整不会自动反映在与Excel集成的Python中。像许多协作工具一样,Excel中的Python需要互联网连接。
无法建立与Power Pivot数据模型的连接。Power Query不支持当前文件中的Excel表格。需要直接连接到表格。使用Python创建的动画图表目前不兼容或不可用。目前仅适用于Microsoft 365 Insiders Beta Channel用户,适用于Windows的Excel桌面版本,版本为2309 Build 16.0.16818.20000或更高版本。
一旦完成对公众开放的初始测试阶段,可能会有限制与在Excel中使用Python相关。这些限制可能包括有限的支持和可能与即将发布的Excel版本冲突。这种结合有效地利用了Python和Excel的力量。在尝试将Python和Excel集成的历史中,包括使用中介库和高级插件如PyXLL以增强Python在Excel中的能力,当前的集成是一个重要的进步。Python在Excel生态系统中的集成预示着卓越协同作用的新时代。这种集成提供了使数据分析、自动化和可视化用户能够利用的潜力——以前仅限于Python或Excel。
目前,此功能处于公开预览阶段,预览期结束后,Microsoft表示某些功能将需要特定许可证,没有它将无法访问。随着一般可用性(GA)日期的临近,将提供更多关于此的信息。尽管确切的GA日期尚未披露,但Microsoft有一个通过集成额外功能如语法高亮显示、自动完成和改进的错误反馈来增强用户体验的愿景。