数据可视化不仅仅是将数字和图表简单地呈现出来,它是一种强有力的工具,能够揭示数据背后的故事和模式。正如Ben Shneiderman所说:“可视化能够回答未曾意识到的问题。”虽然来自非技术背景,但在数据科学领域工作多年,深刻体会到了数据可视化的重要性和它所带来的变革。
在刚进入数据科学领域时,对数据的看法还停留在传统的散点图、条形图等基础图表上。但随着对数据可视化技术的深入了解,意识到了数据可视化的无限可能。一个精心设计的数据可视化可以揭开原始数据集的层层面纱,这往往是一个成功的数据科学项目与平庸项目之间的关键区别。
本文旨在展示数据可视化的强大力量,汇集了11个令人惊叹的可视化案例,覆盖了多种主题。为了证明可以使用任何工具来实现这些可视化,将涵盖Python、R、Tableau和D3.js。挑战是:拿起这些可视化(为所有可视化提供代码),并用选择的工具创造自己的版本。
R语言中的数据可视化
ggplot2库的创建使得R成为数据可视化的首选工具(至少对于程序员来说是这样!)。开始数据分析之旅时使用的是R,并且立刻被ggplot的美丽和力量所吸引。时尚的可视化、即时的洞察、挖掘模式——所有这些都只需要几行代码。难怪即使是硬核的Python程序员也会在他们的Jupyter笔记本中导入ggplot2(是的,现在这是可能的)。
如果使用R并且还没有探索ggplot2,那么请务必今天就开始:《R中数据可视化的全面指南》、《R用户在使用ggplot2包时经常问的10个问题》、《在R中创建BBC风格的可视化》。这不仅仅是一个可视化,尽管这当然不是问题,对吧?上述仪表板是BBC数据团队发布的可视化的集合。已经关注BBC网站多年,所以这是一次受欢迎的发布。
BBC数据团队实际上已经开发并发布了一个R包和一个R cookbook,用于生成上述风格的可视化。R包叫做bbplot。它提供了创建和导出ggplot风格的BBC数据团队使用的可视化的函数。以下是帮助入门的关键资源:bbplot包、BBC的R cookbook。
Tableau中的数据可视化
Edward Tufte是数据可视化领域的先驱。觉得这句话非常适用于使用Tableau生成的可视化。Tableau提供的功能和定制化几乎是无与伦比的。如果对开始使用Tableau感兴趣,来对地方了!以下是一系列文章,帮助从Tableau初学者过渡到专家:《Tableau初学者指南——数据可视化变得简单》、《中级Tableau指南——面向数据科学和商业智能专业人士》、《学习高级Tableau的逐步指南》。
这是一个真正令人惊叹的可视化。只取了完整仪表板的一部分。这个可视化的范围和覆盖的数据量是惊人的,对于任何对这种分析感兴趣的人都非常有用。每个数据点都包含了关于每个席位的详细信息,包括获胜者的名字、州、党派和选区。看看这个可视化有多整洁,尽管它包含了大量的信息。这是在日常/每周/每月报告中都可以追求的,对吧?