平行坐标-美国大学的多元分析

当我们发布Dundas BI 4时,我们知道作为一个寻找答案的业务分析师,您总是在探索数据。正是基于这一点,我们不断努力帮助您通过更智能的可视化和极端定制发现见解,提供完美的组合,以在您需要时看到它们。

基于度量的性质和放在度量集上的层次结构,Dundas BI现在推荐特定的数据可视化。作为这些建议的一部分,Dundas BI可能会提供一些预先配置的可视化,其中之一是平行坐标图。

当在Dundas BI中选择时,Parallel Coordinates可视化将创建一个新的折线图,其中度量集已被转置,以沿下轴放置度量名称,沿左轴放置百分比。平行坐标图为最初选择的每一行数据显示一条单独的线(即每一行将显示单个维度值的不同度量值,如特定的学校或特定的商业实体),绘制其每个值在每个度量值的百分比的总范围内的位置。现在可以在度量之间找到总体模式,同时可以很容易地筛选出单个行(即特定维度值),将其性能与所有其他行(即所有其他维度值)进行比较。

平行坐标图是不漂亮.从远处看,它经常因为重叠的线条而显得凌乱不堪,难以辨认。但美学并不是它的强项。当剖析平行坐标图的价值时,你必须抛开你先前对它与折线图相似的任何保留。与表示随时间变化的折线图不同,并行坐标图连接了一系列值,每个值与不同的值相关联,度量事物的多个方面。换句话说,它的优势不在于它传达数据真相的能力,而在于揭示有意义的多元模式和比较。

用例

使用Dundas BI和美国大学发布的真实数据,我们将研究如何使用并行坐标图来搜索主要模式和例外,以及如何从其杂乱中获得重要的观察结果。我们使用的数据集包括美国大学的统计数据,例如:

尺寸:

  • 美国不同的大学

这些措施(每一项都与具体的大学有关):

  • 毕业生平均收入
  • 毕业生十年后的平均收入
  • 毕业生平均债务
  • 学费
  • 毕业生坐在平均
  • 大学(学校)规模

我们首先将数据拖放到度量集上(即从Universities维度开始),当我们这样做时,Dundas BI的推荐引擎开始分析和配置我们的数据,以理解表示它的最佳方式。除了默认的图表类型(散点图、数据条形表、树状图等),Dundas BI还提供了通常需要计算的智能可视化。然而,在这种情况下——因为我已经删除了至少4个测量值,而且系统能够理解与我的数据集相匹配的计算类型,只需一次单击就可以轻松完成——Dundas BI提供了将其重新可视化为并行坐标图的选项。

图1:Dundas BI基于数据选择推荐可视化

只需点击一下,我们就可以在平行坐标图中看到我们的六个测量值。由于这不是一个基于时间的图表,垂直轴发出的每条线代表了不同的大学,显示了不同的测量,标准化为100%。我们现在看到的是相对于其他大学的百分比价值。



图2:在Dundas BI中创建的平行坐标图-测量美国大学的几个方面

分析多变量数据的挑战通常归结为分析人员能否看到同时显示的所有不同组合,快速识别模式并进行比较,而不必一次从数据集包含的众多变量中分离出两个变量。并行坐标图是一种强大而方便的可视化工具,因为它允许我们同时查看大量数据点,并查看特定度量在模式方面有多接近,或者它们如何与同一类别的度量相比较(例如,大学vs.大学)。然而,正如我之前提到的,平行坐标图的主要特点是,它能够让我们快速关注(在这种情况下)不同的大学,并查看它们在特定度量中与其他大学的比较中表现如何/有多相似。

以下视频演示了当鼠标停留在不同的大学上时,可视化将如何在平行坐标图中刷出(即高亮显示)正确的序列:

例如,我们可以利用这个特定的数据可视化得出的一个模式是,越大的学校往往学费越低。然后,我们可以深入研究特定的大学,并将它们与其他大学进行比较,比如,麻省理工学院(MIT)将是10年后平均收入最高的学校之一(刚刚超过哈佛),但进入该校所需的平均SAT成绩并不高于主流学校(尽管处于高端)。



正如这个用例所证明的那样,并行坐标图是一种独特的、有价值的可视化方法,因为它允许您一眼就检查大量数据,同时分析单个度量以获得针对整体的有意义的见解。

请随意今天就试试Dundas BI吧,并探索自己的发现与平行坐标图表和其他高级可视化,使用您的数据集。

打印