聊一聊数据可视化
数据可视化(英语:Data visualization)被许多学科视为与视觉传达含义相同的现代概念。它涉及到数据的可视化表示的创建和研究。————维基百科 · 数据可视化
在 wiki 百科已经对数据可视化做出了非常好的解释,这里我也不希望仅仅只是做一个文字的搬运工,如果需要参考原文,请点击[[参考]](#参考)进行跳转查看。
那么到底如何理解数据可视化这个概念呢?
为了更加感性的来理解数据可视化这一话题,我们先来一组案例对照。
表格 | 折线图 |
---|---|
我相信无论是哪一种方式都有吸引你的地方,比如规整可靠的表格罗列、或者直观易懂便于分析的图表展示。那么到底那种方式更好呢?我认为两种方式都不错,只是在不同的场景中,会产生不同的展示需求,我们需要酌情使用,不过图表展示就更加的偏向于所谓的数据可视化。
数据可视化与我来说更多的着重点在于图,也就是通过形形色色的图表达适当的含义从而帮助人们去发现那些数据之间隐含的更深层次的意义。
那么就数据可视化这个词汇来看,它分为两个词,分别是数据、_可视化_,如果数据+可视化是数据可视化,那他对应的另一边是什么?数据不可视化?应该不是吧?我进行了一些资料的查阅,没有什么明确的对于此的问题,不过思考过之后我推测另一面应该指的就是数据表格。
另一方面来看,数据可视化也可能是感性的,对美好事物的追求是每个人都拥有的特点,那么一个美丽、直观、实用而又逼格高大的可视化方式必然是人人喜爱的。
脑科学家们关于大脑的研究表示人的大脑对图像的分析处理能力要远远的高于对文字符号的处理能力,这也就解释了为什么看图比看表格更容易发现数据的发展趋势或者数据之间的隐含关系。
所以综上所述,我的理解是,数据可视化就是通过一定的表现形式对数据进行图像化的展现,使得抽象的数据符号变得更具表现能力。
数据可视化的目的是什么?
通过一些方面的资料查看与翻阅,我大致上了解了何为数据可视化,那么为什么要做可视化呢?在没有可视化之前存在什么问题?可视化之后又解决了哪些问题?有没有什么能够切实的体现数据可视化的现实生活中的体现呢?
说起来我在北京也工作了好些个年头了,然而在来京之前,我对地铁是毫无概念的,不过虽说这么多年过去了,但地铁线路图在至今仍然让我感觉非常的方便。
还记得当我第一次乘坐地铁的时候完全不知道应该使用什么“姿势”去坐地铁,不明白所谓的到哪换乘、换乘几号线、坐开往哪个方向的列车究竟是什么意思,真的是一脸懵逼···可当我站在地铁线路图前面时,很多东西都变得一目了然了,你甚至能够知道到那个时候你乘坐的列车是开往哪个方向的。
我认为其实这就是数据可视化的好处,想象一下,如果你的手里始终攒着一张纸条,上面用文字描述了你应该如何换乘,那么你的认知肯定是模糊不清的,你甚至可能根本不知道现在在北京的哪个区。
可视化的好处除了体现在空间地图之外同样在其他方面也提供了一些便利,比如观察折线图可以直观的发现事物发展的趋势、观察柱状图可是快速的找到大量数据中表现比较极端的数据条目、观察关系图可以明了的看到不同的节点多边关系所产生的网络···
总的来说,通过将数据进行不同形式的可视化,我们可以更加快速的提取数据中所表现出的不同的信息,这是纯文字符号的数据表现形式所无法比拟的。所以说数据可视化的目的就是为了人能够快速、准确的掌握数据中的更多层次的信息。
一味的为了表现形式而进行的可视化是不可取的。
怎样进行数据可视化?
要搞明白怎么样进行数据可视化,我觉得第一步应该先要有数据。当你手里拥有了足够量的数据之后,可视化才会被提上议程。
那么假如现在已经有了足够量的数据,要做可视化,要“视”什么将会是一个非常明确的问题;现在数据给到了你的手上,当时你告诉我你不知道要展示一些什么东西,我相信这也一定会是在可视化阶段所必然面临的一个问题。
我们假如说现在北京地铁的运营情况信息已经给到了我的手里,这时候我把北京地铁全线路每一个次的列车日均运行次数进行了统计并且新城了一份柱状图报表。但可能用户希望关注的是列车日均载客数···
所以搞明白问题是什么是数据可视化的第二步,其实很多人包括我自己都会在没写地方存在一些保守的思想,比如说这个东西用的好好的,也没出什么问题,那么就不要动它,让它继续保持这个样子吧,如果不是万不得已绝不要改动它!
到目前为止,我理解的做数据可视化的目的在于发现数据间的更多信息,但是更进一步的目的是为了发现问题、趋势、因果、分布、或者商机。所以凡做可视化都应该拥抱变化,而不是固守成规,应该去主动挖掘问题,而不是只看自己想看的,忽略那些令人头疼的或者还未产生问题的因素。
最后才是选择使用合适的方式进行数据形式的展现。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。