数据可视化是一种将数据转换为直观图形的技术,它能够帮助更快速、更直观地理解数据背后的故事。就像将剧本转化为电影一样,数据可视化让数据活灵活现。通过图形和图表,可以更容易地识别出相关参数之间的强关联性。人类大脑处理视觉图像的速度比处理文本快60,000倍,因此,图形、图表等视觉表现形式更易于大脑处理。
本文将分析和可视化全球COVID-19疫苗接种的最新情况。将使用Plotly和Seaborn进行数据可视化,使用pandas进行数据分析。以下是导入所需库的代码示例:
import numpy as np # 线性代数
import pandas as pd # 数据处理,CSV文件I/O(例如pd.read_csv)
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
from plotly.offline import download_plotlyjs, init_notebook_mode, plot, iplot
import plotly.graph_objects as go
import plotly.figure_factory as ff
from plotly.colors import n_colors
from wordcloud import WordCloud, ImageColorGenerator
init_notebook_mode(connected=True)
from plotly.subplots import make_subplots
from pywaffle import Waffle
import warnings
warnings.filterwarnings("ignore")
top10 = new_df['vaccines'].value_counts().nlargest(10)
data = dict(new_df['vaccines'].value_counts(normalize=True).nlargest(10) * 100)
vaccine = ['Oxford/AstraZeneca', 'Moderna', 'Pfizer/BioNTech', ...]
fig = plt.figure(
rows=7,
columns=12,
FigureClass=Waffle,
values=data,
title={'label': '疫苗比例', 'loc': 'center',
'fontsize': 15},
colors=("#FF7F0E", "#00B5F7", "#AB63FA", "#00CC96", ...
labels=[f"{k} ({v:.2f}%)" for k, v in data.items()],
legend={'loc': 'lower left', 'bbox_to_anchor': (0, -0.4), 'ncol': 2, 'framealpha': 0},
figsize=(12, 9)
)
fig.show()