如何使用Power BI提取和分析数据

数据分析领域,获取精确的HTML代码并提取所需数据是一项相当复杂的任务,但Power BI使得这一过程变得异常简单。本文将通过一个实例,展示如何使用Power BI从不同的购物网站提取数据,并进行比较以找到特定产品的最优惠价格。

首先,需要打开一个网页数据源,并提供想要提取数据的网页URL。以Amazon.in网站为例,将从以下URL提取数据:

https://www.amazon.in/gp/goldbox?ref=nav_topnav_deals

接下来,当点击确定按钮后,Power BI会尝试提取数据,并为提供表格。在弹出的新窗口中,可以看到Power BI提供了两个表格,但这些表格中并没有包含有用的信息。为了提取符合需求的数据,需要点击“添加表格使用示例”按钮。

点击按钮后,将看到一个新弹出屏幕,其中包含两个部分:第一部分是网页视图,可以看到想要提取数据的页面;第二部分是将通过给Power BI提供几个示例来创建的表格结构。

现在,需要提取产品名称、价格和折扣百分比。将通过1或2个示例来训练Power BI。假设第一列将包含产品名称。在网页上,产品名称如“Kevin 80 Cm”、“WOW Raw apple”等。在第一列中,将尝试输入“Kelvin”,将看到Power BI提取的数据列表。只需选择确切的名称,按照这个步骤操作2或3行,将惊讶地发现其余行的数据将自动填充。

接下来,在下面的表格中添加另一列,用于存放商品的价格。例如,“Kevin 80 cm TV”的价格是8499。当点击并尝试输入金额8499时,Power BI足够智能地提供具有相似值的提取数据列表。按照相同的步骤操作接下来的2或3行,将发现所有价格都将与产品名称相对应。

现在,将获取折扣百分比的数据。例如,“Kevin TV”的价格是39% off。为了实现这一点,只需在网格中添加另一列,并尝试输入39%,就像在下面的图片中看到的那样。重复这个步骤几行,Power BI将为其余的行完成这个任务。

哇,已经提取了想要的数据,就像在下面的图片中看到的那样:

现在,只需点击加载按钮继续操作,将看到以下屏幕。继续操作,选择“自定义表格”。

现在,好消息!得到了想要的数据,就像在网格中看到的那样:

唯一可能困扰是,在“折扣百分比”列中,看到了括号和“% Off”的额外文本。为了避免这个问题,只需按照在下面的屏幕中看到的示例添加另一列。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485