如何使用热图来识别复杂数据中的模式

分析和理解大量原始数据会让任何人头晕目眩。这就是为什么后退一步,对数据有一个概括性的看法是很重要的之前深入到更细粒度的分析。从海量数据集中提炼见解的一个很好的工具——对视觉理解来说特别方便——是热图。

对于那些熟悉商业智能(BI)和数据可视化的人来说,如果我提到术语“热图”,你们每个人可能会想象完全不同的东西。尽管您每天都接触到令人眼花缭乱的图表和图形,并且您了解BI术语,但仍然很可能会想到多个热图变体。

这完全没问题!许多人没有意识到的是,热图本身并不是数据可视化,而是可以应用于各种数据可视化的可视化属性,以更好地阐明数据中的趋势、异常值和模式。他们的工作效率也很高。事实上,在数据可视化和数据发现中,模式识别是一个比较容易被忽视的方面,而热图很好地弥补了这一差距。

虽然这篇博客将特别关注我们在Dundas提到的“热点地图”(强调图表),至少有三种与热图相匹配的数据可视化所有我能想到的

什么热图是什么?

让我们开始谈正事吧。如果你还在阅读这篇文章,那是因为你有大量复杂的数据,并且对如何利用热图来揭示其中的模式很感兴趣。或者你想给你的地图可视化添加一些热量(如果你感兴趣的话)类型的热点地图,不要担心,你肯定会想要阅读这篇博客确保你的地图可视化永远不会失败)。

那么,热图到底是什么?它本质上是一个表格矩阵,利用颜色的多样性和强度来可视化和检查复杂的多变量数据。通过水平和垂直显示变量,并根据一些预定义的逻辑为新创建的单元格着色,您可以更好地看到数据集之间的方差、模式和相关性(如果存在的话)。

现在,与其依赖于我的描述能力(或缺乏描述能力),不如让我们看一个构建热图图表的示例邓达斯BI为了理解一个人可能长什么样:

哇,真漂亮!在典型的热图图中(如本例中的情况),每个轴将用于显示一个类别(例如,月几号沿着底部,和一天中的时间沿着侧面)。然后,各个行和列将根据它们所包含的值进一步划分为颜色编码的子类别(或单元格),该值基于它们在前面提到的交叉行和列之间的关系。

H热点图是否已读?

当使用这种类型的图表分析数值数据时,由于颜色强度的变化,低值和高值之间的差异是明显的。细胞的颜色越浓,值越高。从本质上讲,这就是阅读热图的方式。

你可能会注意到的是颜色的比例(传说不能热图使用从0到1400的梯度比例尺(我们已经在视觉上以200为增量进行了分解,以便观众更好地掌握值的变化)。

还记得之前我提到过热图在归纳大量数据方面很出色吗?没有?第一段,第三行!现在你可以开始理解为什么了。由于它们严重依赖颜色来传达价值,因此很难准确地识别颜色深浅之间的差异,并隔离单个数据点。这并不是说热图不能用于更细粒度的分析,它只是更适合于高层次的概括,可以作为进一步调查的跳板。

构建Dundas BI的热图

涵盖了什么而且如何热点图;如果你感兴趣的话建筑看看Dundas高级解决方案架构师Jeff Hainsworth的视频。

在这个精彩的视频中,我们将介绍如何阅读、理解和构建热图,并介绍一些使用Dundas BI构建的独特示例。

打印