数据可视化因当代信息量的剧增,开始更加深入人类社会的生活,逐渐成为了我们消费信息的主流方式。有趣的是,托了中文强大构词能力的福,“数据可视化”(Data Visualization)作为一个译词,隐隐显得莫名地高端难解了。
其实”化“字跟在某个字、名词或者形容词后通常构成一个动词,常用于翻译“ization”后缀:如工业化(industrialization)、现代化(modernization)、全球化(globalization)。这样理解来,”可视化“也在描述一种“让大家看见的”发展方向,或者能力。数据可视化的领域是广博且在不断扩展的,那用五个字去完整地整个领域终究稍显单薄。本文旨在给数据可视化(Data Visualization)下一个定义,尽力为大家引入数据可视化的无穷趣味和无尽可能性。
那么,什么是数据可视化呢?
出色的可视化作品往往都有夺目而入的标题,搭配得当的颜色,文如其义的字体,真知灼见的分析。我们其实在欣赏一幅好的可视化作品的同时,也在欣赏”交流的艺术“,”颜色的艺术“,”字体的艺术“,”分析的艺术“等等等等。当此类艺术致力于将数据呈现给大众时候,就成了“数据可视化的艺术”。其实早有学者先贤在数据可视化领域做出许多探索和成就。当今国际数据可视化界的翘楚Nadieh Bremer(作者认她为数据可视化第一人)曾对数据可视化下过定语:“Encode data into visual elements”。即,把数据编入视觉元素。白话就是:“看见”数据。但是,光是看得见数据,就够了吗?我们又想“看”出什么呢?色彩斑斓的美感?发人深省的见解?还是可以自由探索的头脑风暴平台?管中窥豹,只可见一斑。或许我们在讨论”数据可视化艺术“的时候,太过于将其作为一个整体概念而忽略了这个领域更为宏大的重要组成部分:”数据“(Data)、“可视化”(Visualization)。
什么是数据?
来自Microsoft等研究机构的学者在2018年的数据下过一次定义:
数据:通过收集、整理和模型计算而输出的详细信息、计算成果及测量结果。并且这些信息可成为为未来推理和理解分析奠定基石的重要事实。
一言以蔽之:数据即信息。从你我今晚饭量到全球粮食总产,从周董新歌歌词到世界rapper说唱风格,从中国2020年洪水到全球变暖。如此皆是信息。而数据根本上是信息的进一步精炼,或者转述。这种精炼Nathan Yau多次在《Data Points》做出过一个比喻:好似摄影,数据根本就是在特定的时间和地点对现实世界信息的不完全捕捉(8)。照片中每个像素对真实世界色彩的记录,只是最接近我们对自然世界观察视角。阳光照之于万物,万物显现各异,光凭一张照片,总归有缺失有误差。
数据也是一样。数据集中每行每列,其实都是在对现实世界的各个元素的量化,可现实世界的复杂程度又不是通过单纯的测量可以精确概括的。
什么是可视化?
可视化就是我们转述游戏中最佳的下一环。“看”是我们人类利用自己视觉系统对于图像信息的特殊处理方式,来消化大量信息的重要方法。将自然世界的信息可视化,是人类自古用来增强自身认知能力的主要工具。而我们的祖先已经熟练使用可视化长达千余年之久。数据可视化是理解与探索的工具
到此为止,我们终于可以回答最初的问题了。当数据与可视化结合之时,我们创造出了最符合我们信息消化系统的视觉工具,来帮助我们探索和理解自然世界。换句话说,探索与理解,是数据可视化的决定性特质。当一个所谓的数据可视化作品无法达成基础目标(探索或理解)的时候,我们可以断定,这不是一个好的可视化作品。
楼主最近还看过