总说
数据可视化(Data Visualization)很早就是科学研究的一部分,早期的数据可视化工作主要还是和学术相关。但知道最近一二十年,随着计算机图形学(Computer Graphics)的发展,数据可视化开始发生了巨大的发展。
稍早的数据可视化工作,往往被看作数据处理的一部分(Friedman, 1998),显然并非一个创造性的工作,而是跟数据清洗、数据建模等工作息息相关的一部分。而本文试图阐述,数据可视化也是门创造性工作。
数据的复写还是再创造?
传统结构主义的符号理论
首先,我们来看看常识的对于可视化的理解如何的。
从传统的语言学/语言哲学看来,语言一直被当作是一个指称体系,即一个名词指称一个外界的事物,也称奥古斯丁的“图像说”(语言是世界在心中的图像)。再追溯的更早点,则是来自于柏拉图“理念”(Idea)这一概念的说法。
我们现实的语言/符号观也基本如此,而据索绪尔所说,语言因此具有两面的内容,即“能指”(Signifier)和“所指”(Signified),所谓能指就是指符号本身的符号学意义,而所指则是指其指称的事物。以这种观点下来看数学和数据,则可以看出数学和数据其实是对现实世界在“量”上的抽象,本质上说,是对于现实世界的模仿。因此,数据可视化工作则被放在了更加次要的地位,它是对数据的模仿,因此是对现实世界的模仿的模仿。
Edward Tufte在The Visual Display of Quantitative Information(1983)一书中就表示,优秀的数据可视化应具有的特征是“简洁,清晰和有效”。这个标准其实想表达的是,数据可视化的工作其实是追求一个对数据的保真的同时,更加清晰阐述数据特征的过程。显然,这就是模仿的一种境界,充其量只能是对于数据的复写而不是一个数据科学家或者可视化专家创造力的体现。
延异、解构与创造性
解构主义者德里达则提出了另一种符号模型。德里达取名其学说为“写作学”(Grammatology)而非传统意义上的符号学(Semiology)。因为德里达要降调的是,语言的精华之处在于动态地指称过程而非语言的意义(Meaning)或者语言指称的本质(Essence)。德里达用了延异(differance)表达这个过程,延异即包括“延”(to defer)也包括“异”(to difer)。因为语言其实就是在试图理解和解释一个事物(其实在他那里是一种现象),而当你在解释一个事物的时候,其实是将这个词语和外与之类似的词语区别开来(譬如,在解释树的时候,你是为了和草、灌木、植物、森林等概念区分开来),而语言体系实际就是这种差异体系,此即“异”;而解释的过程实际是推迟了对本身这个名词的理解,因为解释会把这些词语引向更多需要解释的词语,这个对“意义”解释的推迟,即“延”。德里达因此得出,其实语言体系是一个内部互相解释的体系,并不作用于外物,是一个封闭的循环的体系。
但是,德里达的理解不可完全作为一种消极的理解方式。其实,德里达正在重新解读一种“文本”和“解读者”之间的二元关系,“解读者”自己也是一种文本,而操作这个文本的实体确是一个具身(embodied)的肉体。因此,其实,于是说“意义”和解构在延异的过程中消解了,不如说解读本身就在创造新的“意义”实体,而哲学或者美学活动就是这种反复地解构。
这种理论一定程度上已经破除了能指/所指的二元体系,试图阐述一种极度创造力的“过程”。而显然,以此来看可视化工作,可视化的工作即是一种创造过程。
首先,要提取信息。这种信息来自于一种个性化的解读,数据并不会说话,数据是一种抽象的写作。而可视化则是一种解构这种写作文本的过程,它在创造意义,创造一个有待下一个解读者解读的意义。数据本身不是对于现实的复写,数据是一种新的形式化的差异体系,符号体系。而图则是在数据的基础上的另一种解构。
其次,图形创造出新意义。一种新的符号指称,使得人们构建出另一对数据的理解。试思考饼状图,为何人们喜欢饼图描述比例。事实上,很多数据可视化专家都在批判饼图,因为人们对于面积的比较弱于对长度的比较。但在实际炒作中,人们还是更喜欢饼图的模式,因为圆象征着一种完满,而这种对于数据的解构实际是在将“比例”纳入到人们对于“残缺”和“完满”、“部分”和“整体”的二元关系中去。一个直方的比例图,虽然在再现数据上很完整,但是人们却倾向于认为这是一种量的比较,是“部分”与“部分”的关系。而不同图对于不同关系的强调,不能说是孰优孰劣的。
最后,这种强调解读者的活动,也同时使得可视化工作用两个取向,不再是原来那种对数据复写的模式。
其一,是学术/开发倾向,这一倾向要求的更多地要求一种更加完整地复写程度,一边更好地预测和学术之间的交流。而往往,这种图的可图性(圈子外读者的可读性)不是很好。
其二,是客户倾向,这一倾向并非要图的“信息量”,而是某种美感、互动。
这两种倾向的直接划分,就是对于图信息量的要求。
譬如,一个开发/学术活动中,如果能用一张图展示两件事,很多开发者/科研人员会毫不犹豫地用一幅图实现,因为,一般而言,两张图的比较往往没有一张图之中的比较更为直观。
而在很多复杂网络的图之中,往往追求某种视觉效果,因为其实复杂网络中的很多可视化方式信息量其实很小,特别是当数据很大,数据又趋于平均的时候,这时候的网络图其实更加适用于一种展示性的作用而非学术作用;还有一个例子就是某些网页中的数据可视化设计,对于开发者/学术研究者而言这种属于冗余工作,但对一个面向客户的数据可视化工程师/设计师而言,如何生动确是最主要的母体。
总结而言,我们通过解构、重构和解读者三个角度重新审视了可视化的工作,可视化不再是一个流水线工作的一部分,而是一个数据工作者需要发挥独立创造力的事业。
结论
因此,事实上,我们用后现代的理论以及某些例子,实际上刻画出了一个数据可视化工作者的新姿态:不仅是一名工匠,更是一位创造性的“作者”。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。