数据可视化简史

编者注:本博客最初发表于2013年10月,为了准确性、相关性和全面性,于2019年9月进行了全面的修改和更新

在17世纪之前,数据可视化主要存在于地图领域,显示土地标记、城市、道路和资源。随着对更精确的测绘和物理测量需求的增长,需要更好的可视化。

1644年,佛兰德天文学家迈克尔·弗洛伦特·范·朗仁被认为首次提供了统计数据的可视化表示。下面的一维线形图显示了当时托莱多和罗马之间经度差的12个已知估计值,以及提供估计值的每个天文学家的名字。这里值得注意的是,虽然Van Langren可以在表格中提供这些信息,但真正直观地显示估计的广泛变化的是使用图表。

专题制图始于18世纪。地质、经济和医学数据专题制图的尝试是在接近世纪末时进行的。介绍了函数的抽象图形、测量误差和经验数据的收集。

这一时期还诞生了William Playfair,他被广泛认为是我们今天使用的许多最受欢迎的图表(线、条、圆和饼图)的发明者。许多统计图表类型,包括柱状图时间序列图、等高线图、散点图等都是在这一时期发明的。下图是Playfair(1821)绘制的一幅图表,显示了从1565年到1820年250年间小麦价格、周工资和在位君主的价格。

19世纪后半叶是弗兰德所说的统计图形的黄金时代。那个时代的两个著名的数据可视化例子包括John Snow的(琼恩雪诺!1854年伦敦霍乱爆发的地图,以及查尔斯·米纳德1869年的图表,显示了拿破仑1812年声名狼藉的俄国战役军队的人数,x轴表示军队的位置,极端寒冷的温度表示冻伤致死的时间点。

这次也为我们提供了一个新的可视化图,玫瑰图,由弗洛伦斯·南丁格尔创建。

许多因素促成了统计制图的“黄金时代”:工业革命创造了现代商业;官方政府统计部门,以支持越来越有意识和越来越全球化的民众;人们越来越认识到数字数据在社会规划、医学、军事、工业化、商业和交通方面的重要性。统计理论还提供了解释大型数据集的方法。

统计可视化的发展趋势在20世纪初遇到了一个小障碍。弗兰德将这个时代描述为数据可视化的现代黑暗时代。统计学家越来越关注准确的数字,并认为图像过于不准确。虽然该领域的创新可能确实偏离了数据可视化,但这一时期见证了数据可视化在公众意识中的增长。各种各样的图表迅速被应用到教科书、商业应用、科学和政府中。

[编者注:统计学家在这个时代对数据可视化冷眼相待,但20世纪上半叶也将心理学作为一门科学向前推进;特别是,认知心理学和人类知觉研究的发展,使人们对大脑如何解释信息和识别模式有了更好的理解。这项研究对于发展和完善数据可视化最佳实践科学起到了重要作用。]

20世纪下半叶是弗雷德所说的“数据可视化的重生”,这是由计算机处理的出现带来的。计算机使统计学家能够收集和存储越来越大的数据量,并能够快速和容易地将信息可视化。20世纪60年代和70年代出现了美国的John W. Tukey和法国的Jacques Bertin等研究人员,他们分别在统计学和制图学领域发展了信息可视化科学。20世纪80年代初,爱德华·塔夫特(Edward Tufte)出现了,他的开创性著作《数量信息的可视化显示》(The Visual Display of Quantitative Information)至今仍在大学课程中用于数据可视化和统计分析。塔夫特还向我们介绍了火花线,它在一小部分空间内给出趋势的大致形状。

在过去的三十年里,数据可视化领域爆发出数十个甚至数百个关注领域。仪表板和数据发现工具计分卡应用、分析套件和各种其他软件工具使企业、研究人员和个人能够以新的和越来越富有想象力的方式探索他们的数据。现代著名的作家和教育家,包括Alberto Cairo、Stephen Few和Colin Ware,继续完善数据可视化的科学和艺术,并将其带到新的高度。

对于数据可视化来说,我们生活在一个激动人心但又充满挑战的时代。即使我们发现了收集、汇总、分析和可视化数据的新方法,我们也发现了一些新的和重要的社会挑战,涉及侵犯隐私和潜在的数据滥用——有意和无意的。当我们进入信息时代,想象未来为我们个人和社会所准备的东西,既令人兴奋又令人恐惧。兰迪·巴赫曼说得好:我们还什么都没看到呢!

打印