用关系图连接你所有的点

每个人的数据中可能都有比他们意识到的更多的关系。任何两列都可以描述一种关系,比如来源和目的地,发送者和收件人,用户和他们的社会关系,或者从一个页面到另一个页面的网站导航。如果同一组值可以出现在任意一列中,那么只有这两列可以用来映射实体之间的一些复杂连接或网络,这些连接或网络可能是您意想不到的。

Dundas BI具有内置和功能齐全的关系图,可以使用这样的数据进行探索性分析或可视化和更好地理解这些连接。与不同的图表类型一样,每种类型的关系图都最适合不同的情况,因此您可能希望使用我们的re - visualization选项来根据场景在它们之间切换。

关系图

一个很好的开始是我们在Dundas BI中称为关系图的地方,它显示一个或者由“链接”连接的圆形“节点”的网络图。这种类型的图可以完全可视化由数据决定的任何类型的关系结构。这是一个“力向”图,这意味着所有节点都需要几秒钟才能以最佳方式布局,但这取决于你的源值和目标值,它可以是一个圆圈中的任何东西:

到一个可以出现集群和更复杂模式的互联网络:

Dundas BI本身使用这种图表的内置版本来显示数据源中表之间的关系。右键单击“探索”窗口中的任何数据表或数据立方体中的转换,并在上下文菜单中选择“关系”以查看该表及其所有相关表:

您可以使用它来探索相关数据,右键单击图表中的表“节点”,然后单击Expand继续向外展开图表(上面的图表展开了几次)。

来源和目标

为了充分利用这些图中的大多数来理解一些潜在的复杂关系,您所需要做的就是确定哪一列是您的“源”(或“从”)字段,哪一列是您的“目标”(或“到”)字段。在关系图或桑基图中,切换到数据分析面板中的可视化选项卡,并确保在源名称和目标名称下分配了这些:

在许多情况下,两列之间有一个明显的方向相关联,例如一个发送方一个收件人。如果没有任何特定的方向,只需将每一列指定为源或目标。

让我们来看一个具体的例子,其中有两组区域id,一组来自销售人员表,另一组来自客户表(与销售订单相关):

这些id表示同一组销售区域,但是每个销售人员的位置很容易与客户的位置不同。

您的数据可以由可以显示的常规文本组成,但在这种特殊情况下,我们希望首先将数字ID代码转换为更友好的区域名称。我们可以使用从主菜单快速创建的层次结构,其中TerritoryID作为成员键,Name作为标题,并将该层次结构拖放到两个ID列上。你也可以使用数据立方体来“查找”每个TerritoryID的名称:

可视化

在Visualization选项卡中分配Source和Target之后,我们已经可以看到连接的位置。在Width下添加包含交易总金额的数据还可以可视化哪些是相对较强的连接:

其中一些地点是“独立的”,因为我们只在每个地点内进行销售,而不是在它们之间进行销售。我们可以选择把它们过滤掉。(提示:一个快速的方法是用公式测量如果美元美元。标题== $To$.标题)返回1过滤到返回值1。)

在我们的例子中,我们可以在每对位置之间有两个方向的销售交易,所以使用属性窗口中的显示链接箭头和链接类型选项,我们可以显示像这样的曲线连接,清楚地显示每个方向:

如果你想看得更清楚,或者想“理清”一些紧密相连的节点,你可以点击并拖动节点,鼠标悬停在某个链接上,或按住该链接以查看工具提示中的详细信息。

地理关系

您可能已经注意到上面的示例实际上是位置数据。在实际地图上绘制这些可预测的和现实的位置是非常有益的,一旦你有了一个以这些位置为点的地图(称为“符号”)。

在地图的数据分析面板中,这次分配相同的数据,但作为路径下的符号链接开始和符号链接结束。我们可以类似地根据我们的交易金额来调整链接的大小,并像前面的图中那样显示弯曲的方向链接:

您还可以使用Dundas BI的图表可视化来实现这一点,它可以根据自定义图表绘制数据,该图表可以显示大型平面图或校园地图等内容。

在某些情况下,您的位置可能很难以这种方式查看,例如,如果一些位置非常接近,而另一些位置则很远。并非所有地理数据都需要在地图中查看,就像图表更适合比较单个值而不是依赖于地图上的颜色或气泡一样。

桑基图

桑基图可以可视化数据之间的相同链接,但是以一种更专门的方式,更多地关注在每个节点之间移动的数量,以及通常它们从左到右移动的位置。

我们可以将上面的关系图重新可视化为桑基图(Sankey Diagram), Dundas BI将提供帮助,但正如我们所看到的,这组特定的数据是可能不太合适

这里有一个更好的例子,数量通常朝着特定的方向移动:

这比包含相同数据的关系图更有优势。上面的布局更有条理,不需要拖动来重新排列节点,我们可以更好地比较链接的宽度:

桑基图还可以帮助您理解更复杂的场景,就像关系图一样,仅基于作为源和目标的值。该图显示了在开始和结束之间以多步流或多个阶段移动的能量(太瓦时):

在链接重叠的情况下,这些图表非常具有交互性,因此您可以将鼠标移动到不同的链接上以突出显示它们,或者拖动节点来探索它们的连接。

和弦图

Dundas BI中的弦图类似于桑基图,但不需要表示主要沿特定方向流动的数据。相反,通过围绕圆圈外部排列的一组节点,它们可以表示进入的数量这两个的方向。

弦图再次使用分配为源和目标的数据,这次直接放置在数据分析面板的Metric Set选项卡中。

以下是关系图的原始示例,这次可视化为和弦图:

外部节点之间的每个链接或“和弦”都像桑基图一样大小,允许您比较由它们的宽度表示的数量。每个和弦的每个结尾都是不同的,因为它们代表两个方向。

上面突出显示了中部-东北部和弦,它用橙色进行颜色编码,因为中部到东北部的值比东北到中部的值大。

我们的桑基图例子也可以作为和弦图:

但是这种情况可能比原始的桑基图更令人困惑——比较确定值流动方向所花费的时间。在这种情况下,它实际上比这种圆形排列看起来更容易混淆,因为数量是朝着一个方向流动的(从右半部分流向左半部分)。当数据像原始和弦图示例那样向多个方向移动时,或者当桑基图从左到右的移动不太适合时,和弦图可能是更好的选择。

层次关系

层次关系就像您以前见过的普通组织层次结构,其中有“顶部”或“根”项,下面的每个项总是有一个父项在上面。这种关系结构的特殊情况被称为“树”(即使它们通常不是从根开始从下往上可视化的)。树形图专门处理这些类型的关系:

树形图不使用源和目标数据,并且您不需要分配它们来在关系图或桑基图中显示层次数据。这里是我们上面使用的相同的区域数据,但没有分配Target:

请注意,每个位置现在都被分割成多个节点,分布在“树”中,我们失去了轻松比较所有连接及其数量的能力。

在许多其他情况下,这将更有意义,因为Dundas BI允许您创建层次结构,使用时间维度层次结构,或只是将数据分组到层次结构中,因此您现在几乎肯定已经在使用层次结构数据。为此,您可以使用关系图、桑基图、树形图、表、树状图、太阳爆发图或其他图表类型来探索、分析或可视化数据,但这是另一个完全不同的主题。

总结

每种类型的关系图在不同的情况下都是很好的选择:

  • 关系图:灵活地可视化各种关系和网络。布局是使用物理引擎确定的,有些不可预测。
  • 地图和图表:可视化地图或自定义图表上位置之间的关系。布局在地理上是准确的,但不灵活。
  • 桑基图:最适合可视化物品之间的数量移动,通常是在一个方向上,尽管可以有多个“阶段”。它将数据中的项目排列成可预测的从左到右的布局。
  • 和弦图:最适合一组相互连接的项目,其中数量可以在它们之间双向移动,或者具有比典型的桑基图更复杂的连接。
  • 树图:专门用于层次关系或结构,提供比其他图更整洁的布局。

如果你以前没有使用过一些数据,尝试使用关系图,并根据你的发现考虑在它们之间切换!

作者简介

杰米Cherwonka

Jamie Cherwonka是Dundas Data Visualization的数据可视化研发总监。他的视觉设计遵循最佳实践,以将数据新手转变为可视化冠军而闻名

打印