Power BI 面试问题解析

Power BI 是微软开发的一款流行的数据可视化和分析软件产品。通过建模数据和使用报告及仪表板讲述数据故事,Power BI 面试将为提供各种数据洞察。因此,对于每一个有抱负的数据分析师来说,了解 Power BI 变得非常重要。本文将讨论一些重要的 Power BI面试问题,帮助更好地理解 Power BI 技术。

初级数据分析师必知的Power BI面试问题

Power BI 是微软开发的一种数据可视化工具,它通过从多个来源(如 Excel、SAP 等)可视化数据集来帮助提取原始数据的有意义信息。使用 Power BI,可以通过共享 Power BI 报告与任何人共享数据洞察。

以下是Power BI的五个构建模块:

  • 可视化:可视化是指表格、柱状图、散点图、地图等,可以用来直观表示数据。
  • 数据集:数据集是 Power BI 用于创建可视化的数据集合。数据集是许多数据源的组合,如 Web、Dataverse、CSV 等。
  • 报告:报告是一起出现在页面上的可视化集合。报告可以是使用 Power BI Desktop 或 Power BI Service 开发的。报告可能包含多于一页的内容。
  • 仪表板:仪表板是单页展示,上面添加了一个或多个可视化。例如,销售仪表板可以有饼图、KPI 记分卡、条形图、地图等。
  • 磁贴:磁贴是一个矩形框,用于存放卡片、饼图等可视化元素。

Power Query 是一个数据准备和数据转换引擎,用于执行 ETL 处理。使用 Power Query,可以改变列的数据类型、旋转和展开列、汇总和分组行、连接和追加数据等。因此,Power Query 有助于执行数据转换、数据清理、改变数据形状等。

查询折叠是 Power Query 的一种能力,其中在查询编辑器中定义的步骤生成一个单一的查询语句来检索和转换源数据。查询折叠提高了查询处理性能。

Power BI 中有以下三种数据集连接模式:

  • 导入模式:导入模式是 Power BI 中的默认数据集连接模式,它提供快速性能。导入的数据始终存储在磁盘上,在查询或数据刷新过程中,数据必须完全加载。
  • 直接查询模式:直接查询模式不导入数据,而是直接从底层数据源使用原生查询检索数据。当数据量非常大且数据几乎实时时,使用此模式。
  • 复合模式:复合模式可以集成各种直接查询数据源,或者结合通过导入和直接查询模式导入的数据集。它提供了最佳性能。

过滤器用于过滤数据。过滤器可以应用于视觉级别、页面级别或报告级别。此外,钻取过滤器可用于从报告的一个页面钻取到另一个页面。以下是 Power BI 中可用的不同类型过滤器:

  • URL 过滤器 - 临时
  • 传递过滤器
  • 钻取过滤器
  • 交叉钻取过滤器
  • 包含/排除过滤器
  • 手动过滤器
  • 自动过滤器
  • 钻取过滤器(调用钻取)
  • 钻取过滤器(临时)

以下是仪表板和报告的区别:

  • 仪表板:仪表板只包含一页。
  • 报告:报告可能包含一个或多个页面。
  • 仪表板:可以为仪表板设置警报。
  • 报告:报告上没有设置警报的选项。
  • 仪表板:只能在 Power BI Service 中开发。
  • 报告:可以在Power BIDesktop 或 Power BI Service 上开发。
  • 仪表板:只有在用户将整个报告页面固定到仪表板时,才可能在视觉中进行钻取。
  • 报告:在报告中可以在视觉中进行钻取。

Data Analysis Expressions (DAX) 是一种公式语言,用于在 Analysis Services、Power BI 和 Excel 数据模型中的 Power Pivot 构建公式。DAX 包含各种函数,如过滤函数、逻辑函数、聚合函数等。DAX 用于计算 Power BI 中的计算列和度量的结果。以下是 Power BI 中一些常用的 DAX 函数:

MIN, MAX, COUNTROWS, DISTINCTCOUNT, SUM, AVG SWITCH, OR, AND, IF ISFILTERED, ISCROSSFILTERED, ISBLANK CALCULATE, FILTER, VALUES, AND ALL ISEMPTY, SUMMARIZECOLUMNS, UNION, INTERSECT, EXCEPT, NATURALINNERJOIN, NATURALLEFTEROUTERJOIN VAR (Variables)
  • 计算列:计算列中的值在报告刷新时计算。
  • 度量:度量中的值是即时计算的。
  • 计算列:计算列消耗内存,即值存储在内存中。
  • 度量:度量消耗 CPU,即值不存储在任何地方。
  • 计算列:计算列主要用于逐行计算。
  • 度量:度量主要用于保存聚合结果。
  • 了解了 Power BI 是什么以及 Power BI 的构建模块是什么。
  • 了解了如何在 Power BI 中获取数据以及 Power BI 中可用的数据集连接模式。
  • 看到了仪表板和报告之间的区别。
  • 了解了如何在 Power BI 中使用过滤器。
  • 此外,还了解了 Power Query、DAX 函数以及如何使用 DAX 函数。
沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485