在创建引人入胜的数据可视化时,经常面临挑战。尽管许多文本试图解释数据可视化的吸引力所在,但这些文本往往基于调查数据,这些数据并不总是反映真实情况。大多数文本背后的科学是定性的,这种分析形式可能不适用于所有情况。此外,可能会发现,在项目中,被要求交付的结果方向模糊不清。
坦率地说,可以向保证,开发引人入胜的数据可视化没有通用规则,经常会被投入到几乎没有方向的项目中。如果没有通用规则,那么数据可视化如何变得引人入胜呢?“引人入胜”是一个由数据可视化的用例讲述的故事。虽然没有创建引人入胜的数据可视化的通用规则,但有一些方法可以确保开发是有用的。
首先,任何数据可视化的目的是讲述一个故事(数据可视化以多种方式发生)。因此,不要将自己局限于条形图和折线图。有时候,简单的文本就能令人信服地讲述故事。更具体地说,直观数据可视化应该能够在一瞥之间传达信息。这意味着,无需文字,在10秒内,有人应该能够理解数据可视化的含义。
例如,假设试图可视化项目2010-2022年的年度收入。很容易提供一个包含年份和年度收入两列的电子表格,这[技术上]会讲述数据的故事。然而,从表格数据中,不清楚是否有任何趋势,或者是否有任何异常年份。更好的做法是提供一个带有明确趋势线的条形图或散点图,并确保数值以项目的货币表示。在这种情况下,数据可视化不仅会显示项目的年度收入,而且足够简单,任何人都能理解其含义。
这样做:
# 假设这是Python代码,用于生成一个简单的条形图
import matplotlib.pyplot as plt
# 假设的数据
years = ['2010', '2011', '2012', ..., '2022']
revenue = [10000, 12000, 15000, ..., 20000]
plt.bar(years, revenue)
plt.xlabel('年份')
plt.ylabel('收入')
plt.title('项目年度收入')
plt.show()
而不是这样做:
# 假设这是Python代码,用于生成一个复杂的折线图
import matplotlib.pyplot as plt
# 假设的数据
years = ['2010', '2011', '2012', ..., '2022']
revenue = [10000, 12000, 15000, ..., 20000]
plt.plot(years, revenue)
plt.xlabel('年份')
plt.ylabel('收入')
plt.title('项目年度收入')
plt.show()
虽然上述例子很简单,但可以想象哪种方式更能讲述数据的故事。同时请注意,虽然从表格中很容易注意到年度收入的稳定增长,但在实际项目中,数据集可能不会这么小。例如,可能发现自己正在可视化过去三年最喜欢的零食的日销售额。
最后,尽量避免在任何视觉上使用过于技术性的术语,相信。工作从来不是揭示数据的R平方值,而是用“英语”或给定语言解释它意味着什么。如果想解释数据的高方差,数值帮助不大;相反,可以图形化地展示数据点过于分散或分散,很难找到任何趋势。
直观简单的数据可视化有一个额外的好处,它让人们想要看得更多。当工作易于理解时,受众不会感到不知所措或困惑。作为一个数据可视化专家,应该能够不使用太多学术术语来解释工作。在美国,当某人用只有专家知道的术语说话时,有一句谚语,“用英语告诉”。本质上,这意味着专家,尽管他们努力获得知识,却没有能力与他们试图帮助的人沟通。保持数据可视化直观简单,以免压倒受众,当他们想要了解更多时,准备好简单地谈论努力产生的发现和洞察。
数据可视化很重要,但一个不为人知的英雄(可能被忽视的组成部分)实际上是允许可视化的分析。这类似于去看最喜欢的音乐家的音乐会,而不考虑所有建造音乐家站立舞台的人。没有适当的科学或数学(取决于项目),数据可视化可能会迫使人们忽略工作。科学和分析的角色可能不是,但作为负责创建数据面貌的人,必须对数据质量可能不足的时候有所警觉。因此,必须审查实际尝试可视化的数据!这不是真正的探索性数据分析,而更像是同行评审。记住,正在团队合作交付产品,如果能早点发现错误,可以为许多参与者节省时间和精力。
然而,仅仅查看数据是不够的;分析也是必要的,以便能够正确构建数据可视化。在上面的例子中,当被要求可视化年度收入时,怎么知道使用哪种趋势线?有各种各样的趋势线[包括但不限于],线性、多项式和指数。如果选择一个多项式趋势线,怎么知道多项式方程应该在什么程度上停止?可能还听说过这被描述为自由度。
在上面的例子中,使用了两个周期的移动平均,但可以附加任何数量的趋势线;然而,对于项目来说,什么是有意义的,完全取决于……至少在开发过程中(请记住,是技术专家,所以这些类型的决策通常由负责,但总是要为同行的意见留出空间)。以下是可以应用于同一图表的各种类型的趋势线。
最终,要使数据可视化引人入胜,必须获得项目负责人的认可。前面提到,技术决策是……在开发过程中。事实是,最终,必须获得项目负责人的认可。项目负责人通常会报告更新和结果(或者如果不害羞的话,可以报告)给他们的领导;这个过程可以重复到组织负责人或投资者。
应该努力在第一次就创建超出最大梦想的数据可视化,尽管实际上,在接受之前有一个漫长的开发和审查过程,所以准备好继续开发数据可视化。
列出的这些提示可能看起来基础。然而,当这些简单的提示被遵循时,它可以带来从未想过的机会。在某些情况下,如果工作做得很好,可以向组织中的许多不同团队展示,从经理到总裁;可能性是多种多样的。向领导展示可能看起来微不足道,但不要低估站在领导面前的力量,即使只是一次。除了展示机会外,随着工作改进,将成为公认的专家(这意味着正在证明对组织的价值),这有助于为建立积极的声誉,并在同事中建立信任。