Power Query 是 Power BI 中的一个强大工具,它允许用户从多种数据源中提取、转换和加载数据。以下是使用 Power Query 的一些主要优势:
数据提取:Power Query 支持连接到各种数据源,比如数据库、Excel 文件、网页和 API。这使得用户能够从多个来源提取数据并将它们合并成一个数据集进行分析。
数据转换:它提供了广泛的转换选项来清洗、过滤、排序和重塑数据。用户可以执行诸如删除重复项、拆分和合并列、合并和追加查询以及数据透视和反透视等操作。
数据加载:它与 Power BI 无缝集成,允许用户将转换后的数据加载到数据模型中,用于构建报告和仪表板。它还支持数据刷新和更新,确保报告始终是最新的。
Power Query 是Power BI的内置功能,无需单独安装。只需打开 Power BI 并导航到“获取数据”选项卡中的“获取数据”选项即可访问 Power Query。
要开始使用 Power BI 中的 Power Query,请按照以下步骤操作:
连接到数据源:Power Query 支持连接到包括 Excel 文件、数据库、网页和 API 在内的各种数据源。要连接到数据源,请从“获取数据”菜单中选择适当的选项,并按照提示建立连接。
了解 Power Query 编辑器:一旦连接到数据源,Power Query 将打开 Power Query 编辑器。这是用户可以执行数据转换的地方。编辑器提供了一个用户友好的界面,可以预览数据并提供一组转换选项。
Power Query 提供了多种转换来操作数据。让探索一些常用的转换:
过滤和排序数据:它允许用户根据特定标准过滤和排序数据。例如,用户可以过滤数据以仅包括某些行或按升序或降序排序数据。
删除重复项:它提供了一个选项,可以从数据集中删除重复的行。这在处理可能包含重复条目的数据时非常有用。
拆分和合并列:Power Query 允许用户根据分隔符将一列拆分为多列或将多列合并为一列。
合并和追加查询:它允许用户根据共同列合并多个查询或追加查询以垂直合并数据。
除了基本转换外,Power Query 还提供了高级数据操作技术:
使用函数和参数:Power Query 允许用户创建自定义函数和参数来执行复杂的数据转换。函数可以在多个查询中重用,提高效率。
处理日期和时间函数:它提供了一系列的函数来处理日期和时间数据,例如提取日期的部分、计算日期之间的差异以及格式化日期。
处理错误和异常:它提供了错误处理功能,允许用户在数据转换过程中处理错误和异常。用户可以定义自定义错误处理逻辑或跳过有错误的行。
自定义列创建:Power Query 允许用户基于计算或表达式创建自定义列。这对于创建计算字段或执行复杂计算非常有用。
高级数据转换:它支持高级数据转换,如取消透视多个列、对数据进行分组和聚合以及使用 M 或 DAX 公式执行高级计算。
Power Query 支持多种数据源的导入和操作。以下是一些示例:
从 Excel 导入数据:它允许用户从 Excel 文件中导入数据,包括多个工作表和命名范围。
连接到数据库:Power Query 支持连接到 SQL Server、Oracle、MySQL 等数据库。用户可以从表、视图或自定义 SQL 查询中导入数据。
使用 Power Query 进行网页抓取:它提供了网页抓取功能,允许用户通过指定要抓取的 HTML 元素从网页中提取数据。
API 集成与 Power Query:Power Query 支持与 API 的集成,使用户能够通过指定 API 端点和参数从 Web 服务中导入数据。
使用 Power Query 与云存储服务合作:它允许用户连接到 Azure Blob Storage、SharePoint、OneDrive 和 Google Drive 等云存储服务以导入数据。
以下是 Power Query 提供的一些用于清洗和标准化数据的功能:
删除空白行和列:它提供了删除数据集中的空白行和列的选项,确保数据的清洁。
处理缺失值:它允许用户通过用默认值替换、用前一个或下一个值填充或删除包含缺失值的行来处理缺失值。
标准化和格式化数据:Power Query 支持数据标准化和格式化操作,例如将文本转换为大写或小写、去除前导或尾随空格以及格式化数字或日期。
处理文本和编码问题:它提供了处理文本和编码问题的功能,例如替换特定字符、去除特殊字符或转换文本编码。
数据质量检查和验证:Power Query 允许用户通过对数据应用规则或条件来执行数据质量检查和验证。这有助于识别和修复数据质量问题。
Power Query 提供了多种数据转换技术,例如:
聚合和分组数据:Power Query 允许用户根据特定列聚合和分组数据,从而进行求和、平均值、计数等计算。
计算列和度量值:它支持使用 M 或 DAX 公式创建计算列和度量值。计算列在数据加载时计算,而度量值在数据分析时计算。
高级数据转换:它提供了高级数据转换选项,如使用高级连接类型合并查询、取消透视多个列以及使用 M 或 DAX 公式执行复杂计算。
条件逻辑和 IF 语句:它还允许用户应用条件逻辑和 IF 语句,根据特定条件执行不同的转换。