数据不仅仅是数字的集合,它能够揭示在传统报告中不易被识别的各种关系。本文将分享如何利用Tableau创建一个简单的仪表板,以揭示从联合国人道主义事务协调厅支持的ReliefWeb获取的数据源中的洞察。下载了关于“联合国儿童基金会欧洲难民和移民响应:人道主义情况报告#39(2021年1月1日至3月31日)”的PDF报告文件。
本文将解释在准备分析时可能需要执行的一些常见步骤,例如计算新字段和突出显示各种动作,以增强可视化效果并揭示隐藏的洞察。现在已经拥有了数据,下一步就是从这些数据中生成洞察。让开始吧!
首先,需要确保所有数据都正确地放置在维度和度量部分,并且需要清理数据面板。在数据分析工作流程中,数据准备是一个关键阶段。在对数据进行更多细化时,可能只需要源文件中的一些选定字段进行分析。有时,还需要从现有字段计算字段,以清晰地描述数据的故事。
Tableau将数据分为两类(可以在数据面板中看到这种划分):维度和度量,前者表示定性数据(蓝色),后者表示定量数据(绿色)。然而,如果记录ID或序列号是数字且不需要聚合(求和或平均),则它被归入维度部分。数据准备是数据分析中的关键步骤,图像来源:pixabay.com。
Tableau有许多内置的有利功能,可以将繁琐的计算转化为简单的计算。可以选择左侧面板中的适当字段,并从中计算新的度量。如果想创建一个新的度量,在顶部菜单下,选择“分析”>“创建计算字段”并输入创建新度量的公式。例如:DATEDIFF(‘分钟’, [开始时间], [结束时间]),这个公式返回开始时间和结束时间的差异,使用“分钟”作为单位,可用于趋势分析。
DATEDIFF('minute', [开始时间], [结束时间])
计算维度的一个例子是周末和工作日的计算:
IF DATEPART('day', [开始时间]) = 1
OR
DATEPART('day', [开始时间]) = 7
THEN
'周末'
ELSE
'工作日'
END
此外,为了从不同的角度将信息分解成小部分,可能需要经常在数据准备中应用切片和切块。例如,如果想通过定义时间段来扩展数据。这可以由四个六小时的时间段组成:夜间(凌晨12点至早上6点),上午(早上6点至中午12点),下午(中午12点至下午6点)和晚上(下午6点至午夜12点)。然后公式可以写成如下:
IF DATEPART('hour', [开始时间]) >= 0 AND DATEPART('hour', [开始时间]) < 6
THEN '夜间'
ELSEIF DATEPART('hour', [开始时间]) >= 6 AND DATEPART('hour', [开始时间]) < 12
THEN '上午'
ELSEIF DATEPART('hour', [开始时间]) >= 12 AND DATEPART('hour', [开始时间]) < 18
THEN '下午'
ELSE '晚上'
END
这是一个方便的工具,用于查找模式,它在保持整个数据的上下文的同时识别和突出显示数据。例如:从顶部菜单中选择“分析”>“高亮显示器”>“字段名称”。要修改默认属性,请右键单击数据面板中的字段名称。在“默认属性”>“数字格式”下,选择“数字(自定义)”,并可以在打开的窗口中指定详细信息,如下所示。
可以为所需字段更改默认属性,以显示带有应用按钮的筛选器窗口。右键单击字段以进行筛选,并点击“显示筛选器”。在图例中将显示一个小框以筛选选定的字段。然后点击右上角的下拉图标,并在“自定义”下选择“显示应用按钮”。
排除表格中的字段。使用可视化工具进行探索性趋势分析:可以使用日期和时间字段找到数据中的趋势,例如检查从秒、小时、年等的各种模式。离散和连续时间分析:Tableau非常擅长在将它们应用到可视化中时将时间显示为离散或连续。当将日期字段拖到画布上时,必须决定是想要连续的还是离散的,以及想要它在哪个级别上呈现(例如:天、小时、分钟值)。