“你不能做足够的草图。画出一切,保持你的好奇心。”
美国画家约翰·辛格·萨金特 (John Singer Sargent) 为使用木材、油漆或木炭等传统媒体工作的艺术家提出了这一建议。它也适用于数据可视化从业者。毕竟,我们也是艺术家,只是在一种略有不同的媒介——信息中工作。
每当我不确定如何显示我的数据时,我就会开始画草图以产生想法并获得清晰度。我坐在我的白板前或拿起我的平板电脑,绘制一些适用于我的数据集的图表——让自己充满好奇心,不受制图工具的束缚。
最近,我需要可视化来自实验性试验参与者的葡萄糖观察数据集。如果拟议的治疗引起任何与血糖相关的副作用,它们将在这里可见。
这是特定队列的原始数据。
重要的是要注意,这里没有需要强调的特定发现或见解。相反,此视觉对象的目标是以易于理解的格式提供数据,这将成为定期更新报告的一部分。这样,医生和研究人员就可以轻松监控观察结果的任何变化。
我不确定完成这项任务的最佳方法,所以我开始画草图。
草图 #1:数据表
我的第一个想法是使用一个 table ,但是一个简化的版本。与原版相比,它没有重复和不必要的信息。作为一种格式,数据表对于几乎所有受众来说都是直观且熟悉的。我还可以预见到有人需要查找精确的葡萄糖测量值的情况,使用表格比使用图表更容易做到这一点。
也就是说,表格确实需要大量的认知努力来处理。例如,快速查看葡萄糖水平的趋势是一项挑战。此外,该表仅显示研究中众多队列中的一个的观察结果——您可以想象,如果需要为其他队列包含额外的表格,将导致这种方法很快失控。
这是一个可靠的第一张草图,但我一直在探索——这一次,使用视觉效果。
草图 #2:箱线图
箱形图旨在很好地显示分布,我的数据集由分布度量(如平均值和标准差)组成。这应该是一场理想的比赛——或者至少我最初是这样说服自己的。
这个草图的问题始于第 3 天的数据。只有一个观察值,因此会导致没有盒子的箱线图。仔细观察后发现,在我的数据集中,大部分时间都是这种情况。这令人失望;箱线图应该有箱子,对吧?
缺乏观察并不是唯一的挑战。箱形图不是众所周知的图表类型。如果您是一名统计学家,您可能会定期看到箱形图(或它们的近亲小提琴图)。但对于那个世界之外的任何人来说,它们都是罕见的,不熟悉的读者在试图理解它们时面临陡峭的学习曲线。
在这种情况下,参与研究的研究人员和医生可能熟悉图表类型,因为他们使用了大量科学信息。尽管如此,我仍然不是这种观点的忠实拥护者。我会说这值得勾勒出来以排除它。
草图 #3:抖动图
抖动图本质上是箱形图,它显示所有单独的点,同时仍然给出分布的感觉。我个人认为它们是显示数据集分布的一种非常直观的方式。与之前的草图相比,我也对这个版本中第 3 天到第 19 天缺乏观察结果感觉更好。
对我来说最大的缺点是在 Excel 中创建会很麻烦——尤其是对于有更多观察的队列。 (这是先画草图的一个好处。我可以尝试新的方法并决定是否值得付出额外的努力来学习如何构建。)
我最终得出结论,抖动图是一个可行的选择,但我一直在画草图,看看是否有另一个更容易创建的合适图表。
草图 #4:点图
在这里,我画了一个点代表每天所有观察的平均葡萄糖读数。这种观点对我来说是平淡无奇的。它起作用了,但抖动图似乎提供了更多的潜力。
当我轻松地将点图转换为折线图时,我的思想不断演变。
草图 #5:折线图
看到沿水平轴的时间分量促使我考虑连续折线图。不过,这里的挑战在于我的数据集中的观察结果并不是定期收集的。如果我在我的工具中重新制作它,我需要将日期展开以显示每一天的等距间隔,无论是否进行了观察。否则,我就有可能扭曲数据——例如,让第 3 天和第 7 天之间平均读数的增加看起来比实际情况要极端得多。在画草图时,我添加了红色箭头来提醒自己这一点。
只绘制平均值而不是单独观察的一个好处是我在图表上创建了大量空间。我可以使用该空间为整体研究平均值和标准偏差添加参考线。我什至可以把这个折线图变成一个组合图(折线和数据表),这样就可以清楚地看到每日队列平均值背后几乎没有观察值。
这是它的外观草图。
我喜欢这个,并提议将这个线表组合作为报告的可视化。这是完成的 Excel 版本:
令我惊讶的一件事是如何以多种不同方式可视化相同的数据集。决定在特定情况下使用哪一个从来都不是直截了当的。必须考虑许多因素才能最终决定哪种可视化最适合该场景。
这就是草图数据很棒的原因。我可以相对快速地迭代并测试想法,而不必学习如何在特定的图形工具中进行测试。我也很感激它迫使我放慢脚步,对图表上的每个元素都有意识。我很少画不必要的杂乱,所以它也是一个微妙的提醒,不要添加边框和网格线之类的东西。最重要的是,它提供了一个在流程早期从其他人那里获得反馈的机会。
如果您喜欢遍历图表并探索利弊,请在 5 月 31 日与我和其他数据讲故事者 Mike 一起参加关于图表数据的高级现场活动。我们将分享一个快速流程来帮助您决定使用哪个图表,并允许您集思广益、绘制草图并讨论针对另一个真实场景的不同图表选择。
原文: https://www.storytellingwithdata.com/blog/unsure-of-how-to-graph-data-sketch-it