数据可视化的新趋势与技术

在新生儿的成长过程中,变化是持续不断的。短短十天内,婴儿的外貌就与出生时大不相同。这种变化对于间隔一段时间观察婴儿的人来说是显而易见的,但对于每天照顾婴儿的人来说,他们可能并未察觉。同样,在数据分析行业中,日复一日工作的分析师们也可能忽视了这些变化。幸运的是,数据分析行业的变化速度是以月而非天来计算的。本文旨在强调数据可视化方式的一些关键变化,并提供一些资源,以便开始利用这些变化。

数据可视化变化的驱动因素

数据量的增加:随着待分析的数据每秒都在增长,正确的可视化变得越来越关键。过去,可以通过滚动数据来大致了解数据质量和值的日子已经一去不复返了。虽然这可能让一些分析师感到害怕,但数据量的增加为数据的切片、切块和表示提供了过去普通分析师无法实现的方式。

数据类型的多样性:随着数据量的增加,新的数据集也越来越主流化。需要分析用户评论、情绪、客户电话和各种非结构化数据的需求导致了新型可视化的使用。使用图数据库和可视化来表示非结构化数据就是数据多样性增加导致变化的一个例子。

技术进步:技术的改进以前所未有地推动着分析行业的发展。这种影响主要体现在两个方面:

随着传感器成本的显著降低和移动设备的兴起,现在拥有了大量的以前无法获得的数据。智能手机可以帮助地理标记执行的每项活动,无论是搜索还是拍照。这些传感器不仅可以提供位置,还可以揭示大量关于客户行为的洞察。一家汽车保险公司已经开始根据汽车/智能手机中的传感器测量的驾驶安全性向更安全驾驶的人提供折扣。

当在攻读硕士学位论文(8年前)时,创建一个非结构化网格来模拟物体上的气动流动可能需要几天时间。今天,同样的计算可以在几分钟内完成。同样,过去需要几个小时的可视化现在可以在几秒钟内完成。这使得创建可能计算密集型的可视化成为可能。创建跟踪社交媒体讨论链、它们对网站流量的影响以及最终客户行为的可视化在过去由于缺乏计算能力而无法想象。

地理空间可视化和分析的增加使用:在地图上显示地理分布是最简单的、也是最有效的信息表示方式之一。它可以用于简单的应用程序,如查看网站流量(下图示例),也可以用于更高级的应用程序,如映射银行分支机构和客户人口统计,以确保正确匹配。由于更好的工具和越来越多带有纬度和经度的数据可用,这些图表的使用在过去几年中显著增加。

地图(包括热图)的使用可以通过各种工具和库来实现。其中一些如下:

Google Maps – 以Geo图表形式存在的最简单图表 Qlikview / SAS 以及其他工具通过插件和扩展 额外的映射软件/库,如Modest Maps, Leaflet, Polymaps, CartoDB, Kartograph, D3.js

图表表示的兴起:图表表示可以用来直观地表示许多故事。它们代表了对网络的思考方式。以下是一个可视化的示例,该可视化来自HBR博客。该可视化显示了社交媒体讨论对纽约时报网站流量的影响。推文和转推显示为线条和点,而每篇文章的点击量以黑色显示在下方。当没有推特讨论时发生峰值,流量可能来自其他来源。

为了创建一些可视化的图表,可以使用像D3这样的库,或者像Gephi, Neo4j这样的专业工具,或者任何像R, SAS这样的高级工具。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485