为什么我们需要可视化?
说到可视化,我打算用一个非可视化的方式聊聊可视化 —— 回忆一下我那平淡无奇的往事。
三年前左右,进了一个做BI项目,当时看到BI这俩字母,根本不知道是啥啊,佯装狂懂之时,已问手中度娘,才知道是商业智能(Business Intelligence)。这才有机会接触到数据可视化这个概念。这词儿我当时还是第一次听。我不知道大家还记不记得第一次听这个词时候是什么感觉,反正我是乍一听没听懂。数据我知道是啥,可视化是个什么鬼呢?怎么听都不像中国话啊。
简单了解之后,我一拍大腿,哦!闹半天数据可视化就是把像在excel里这样的的数们搬到像饼柱线这样的图表里打扮打扮show出来啊!
实践出真知,那天我马上找了一个excel数据表,是个很简单的x市一年天气统计数据。就两列,一列时间,一列气温。这些数据看起来不错啊,规规矩矩的排列在excel的小格子里,干净整齐。那为什么要把数字放到那些图表里?这个难不住我,肯定是有人想找出x市一年内气温最高点吧,这时候柱线图显而易见的可以解决问题。
“这就是你想说的?”,我们的思考当然不能止步于此 ——
那别人是怎么想到使用柱线图的呢,怎么不是xx图?在别人想到使用柱线图之前,有没有人尝试过其他方法呢?带着这些问题,我陷入了回忆。
在柔和的bgm中,思绪已经飘到了初中教室,数学老师用直尺在黑板上画了一条意味深长的线,她转过头来对我们说,“同学们,这是一条数轴,从原点开始正方向是正数,负方向。。。”,这时候我眼前的excel中的x市的气温数值,一个个落在了脑中那条线上属于它们自己的位置,我在数轴最右侧找到了我想要的数字——42摄氏度,仿佛回忆起夏日那股热浪的同时,我突然发现,这不就是可视化么,那既然数轴这根儿线已经可以帮我解决问题,那柱图瞎凑啥热闹呢?那我又很自然的想到,原来不管柱图还是线图,其实就是互相垂直的两根儿线而已(学术点儿叫正交)。多了一根线,就能多呈现一个维度的信息,所以在柱图里,我就可以很容易的找出这个最高的温度对应的时间是哪月哪天。
总结:以上则是一个正常人由于自身正常的生理需求(快速聚焦数据,理解数据)而进行的合理的、有逻辑的推导过程。这实际上是一个帮助人把原本在excel中繁杂无规律的数据变得有规律、易查看的过程,也就是我理解的可视化。
那么我们回到最初的问题,就变得很容易回答了。
为什么需要汽车?因为有快点到达目的地的需求啊
同理:
为什么需要可视化?因为有快点理解数据的需求啊: )
一句话回答:可视化能够提高效率,如果如果没有可视化,我们的决策就会低效,这会导致金钱、时间的损失,甚至危及健康与生命。
从可视化课程中找到的,几个简单的例子说明可视化为什么高效。
一、一个几乎被用烂的例子,找到下面的3的数目。如果用一点可视化的方法,添加颜色映射,是不是省时又省力?
二、看下面一张表,介绍了各个工厂小麦(Cereal)的元素含量。你能否回答这些问题,看花了多长时间。1.那种小麦钾(potassium)含量更高?
2.钾(potassium)和纤维(fiber)之间是否有什么关系?如果有,哪些品种的小麦不符合这种关系?
3.那家工厂(manufacturer)生产最健康的小麦?
然后,看下面的这张图,他们表示了相同的信息量,回答同样的问题,你花了多长时间?
三、下面的四条数据集(I,II,III,IV),告诉我他有什么区别?你会发现,虽然他们感觉不同,但你计算一下发现,他们好像是一样的(后面四个不知道咋翻译,反正后面四个指标也是一样的):
- l x平均值均为9.0
- l y的平均值均为7.5
- l 最小二乘回归方程都是y=3+0.5x
- l 平方误差的和均为110.0
- l regression sums of squared errors (variance accounted for by x) = 27.5
- l residual sums of squared errors (about the regression line) = 13.75
- l correlation coefficient = 0.82
- l coefficient of determination = 0.67
然后我们给出他们的图,一目了然
下面将按照这个结构,对这个问题展开回答。
一、什么是可视化
二、可视化在哪些地方帮到了我们
三、对可视化理解与使用上的误区
做可视化的人,下面很多图都看过,我尝试对这些内容从不同的角度组织一下,各位轻拍。
一、什么是可视化(这一节有点学术)在计算机学科的分类中,利用人眼的感知能力对数据进行交互的可视表达以增强认知的技术,称为可视化。它将不可见或难以直接显示的数据转化为可感知的图形、符号、颜色、纹理等,增强数据的识别效率,传递有效信息。
可视化包括科学可视化、信息可视化与可视分析。
1.科学可视化在三个方向中出现最早,也最完善,主要针对真实存在的各种科学数据,应用在物理、化学、气象气候、航空航天、医学、生物学等领域。
2.信息可视化处理的对象是抽象的、非结构化数据,如文本、图表、软件、复杂系统等。其关键问题是在有限的展现空间中以直观的方式传达大量的抽象信息。
3.可视分析从911(没错,就是那次恐怖袭击)之后被美国的政府及科研机构提出来,被定义为以可视交互界面为基础的分析推理科学,融合了图形学、数据挖掘和人机交互等多项技术。
二、可视化在哪些地方帮到了我们这一部分中,我们打乱可视化的三个方向,从应用领域角度,看看可视化在哪些地方帮到了我们,或很可能会帮到我们。
1.医疗与卫生
1.1找到(验证)霍乱的发生与传播
这幅可视化作品是由一名流行病学家John Snow创作的,他是一名伟大的流行病学家。为了研究霍乱的传播,他于1854年创作的伦敦某个区域霍乱发生与水井的关系图。在图中,标出了水井,并且用横线标出了霍乱发生的人数。通过该可视化,直观且有力的证实了霍乱的传播与水井的关系,封住特定的水井,霍乱的传播明显减弱。
1.2证明了公共卫生与存活率的关系
现代护士之母——蓝丁格尔(Florence Nightingale),是克里米亚战争期间的一名护士,她通过在报告中使用的新的可视化的形式,有力的证明了公共卫生条件在存活率上的重要作用,并成功说服了议会就此展开了进一步调查。
在图中,蓝色部分半径代表了传染病和其它疾病的死亡人数,红色代表了受伤的死亡人数,黑色代表了其它的死亡人数。可以直观看出,非战斗死亡人数的比例很大,间接说明了公共卫生条件对战场存活率的作用。
1.3辅助诊断
没有CT,大夫就没法给病人诊断,严重后果就是没查出病因病人挂了。
2.交通
2.1对普通用户:实时路况报告
印象最深的,就是师姐下班前,经常一边跟我们聊天,一边刷新交通委的实时路况,在交通稍微畅通些时,再动身出发。这是交管局的实时路况播报的结果和路牌,通过最直接的颜色映射,以可视化的方式呈现拥堵情况,减小了堵在路上的几率。
2.2对管理者:实时监测、优化道路及交通、交通管制等
在今年举办的第一届可视分析大会(ChinaVA)上,有幸听了北京市交通信息中心王立勋老师的报告,三个感触,第一是交通数据是真正的多源异构大数据,第二是可视化在目前的交通监控、数据分析上发挥了重要作用,第三是还有很多事要做。分享其中的两张ppt。
下面再给几张看上去很“炫”的交通数据可视化与可视分析的图。
3.工业生产
3.1鱼骨图帮助提高效率,分析因果
鱼骨图由日本管理大师石川馨先生所发明,故又名石川图。鱼骨图是一种发现问题“根本原因”的方法,它也可以称之为“Ishikawa”或者“因果图”。这是管理学大师将可视化加入管理学思想的结果。
3.2监控生产
通过可视化的方式,可以实时监控各个生产环节的情况。不仅能够通过直观的方式对生产情况概况进行了解,对于生产过程中的异常,也能够及时的发现,提高了效率。
4.反恐
少数派报告中的情节。影片展现了未来先进的预防犯罪的手段,来事前得到犯罪信息,借以根除犯罪。在预防犯罪的小组里,领导约翰-安德顿(Chief John Anderton,汤姆-克鲁斯饰)的工作是最卖力的。。。
在这个预测犯罪的场景中,使用了各种可视化、交互及分析的方法,这也是可视分析提出的一个终极目的:通过可视化的方式分析各种多源异构的数据,最终实现对恐怖行为的预测和防范。
这,就在不远的将来。
5.信息传播
目前可视化在这个角度发挥的作用最为公众所熟知,我们举几个例子:
5.1拿破仑东征
1812年拿破仑进攻俄国的情况,笔文字描述要直观很多吧。
5.2 1864年法国红酒的出口情况
5.3 美国2010年中期大选与2008年大选各区域民意的变化
5.4 H7N9禽流感发病情况
5.5用户在一段时间,将他们的SUV卖掉,转手买了一辆更小的车。用户在品牌和车辆容量上是如何选择的,这幅图以可视化的方式给了答案
等等等等吧。
6.财经、文化、民生、军事等等其它方面,就不再一一举例了。这方面的内容,可以参考涂子沛先生的《数据之巅》上关于数据可视化的内容。包括美国LEHD项目、林正祥先生基于地图的可视化等等。
三、对可视化理解与使用上需要注意的问题1.信息传播是可视化的作用之一,也是最被广泛使用和认为的一项功能。但可视化发挥的积极作用远不止此。这也是经常被人们误解的。
2.可视化不同于信息图,相比信息图,可视化与可视分析数据量更大,目的也不尽相同。
3.可视化不仅能锦上添花,也能雪中送炭。
4.可视化与数据密不可分。相信在大数据时代,可视化与可视分析能够发挥更大的作用。
参考资料:- l 《数据之巅》,涂子沛,2014
- l 《数据可视化》,陈为等,2013
- l 维基百科
- l 百度百科
http://weixin.qq.com/r/D0NfR4XE9diKrcEk9xYd (二维码自动识别)
因为人对图像信息的解析效率比文字更高,而且人的大脑解析图像时是个复合过程,文字解析是后天教育出来的系统话体系化的过程,因此导致图像在表达信息时很难保证其解析的准确性,而文字正好弥补了它的缺点。 从另一种角度讲文字也是一种高度规范化系统化的图形。 你所说的可视化归根结底是为了提高信息传播的效率。使其更为直观,更为便于理解。
可视化可以使那些本来抽象的信息具象化,这样更易于被大脑所吸收消化,而视觉又恰好是人类接收信息的主要途径,有大约75%的信息是从视觉进入大脑的。
理解方便
一个快速的求职找工作"3围"公式XYZX=行业Y=企业Z=岗位所有人1共7大组合方向
第一层次:X,Y,Z第二层次:XY,XZ,YZ第三层次:XYZ大部分人是第一层次
比如你经常听到,我想找一个IT类行业的工作我想到IBM公司我想当一个采购专员人们工作了几年之后,就是第二层次的居多些
我想在IT行业,当产品经理我想在IBM公司,当人事专员我想在IT行业,腾讯这家公司最后人们才能清晰的找着自己的定位更易理解,又有颜值
恩。。。正好公司是做可视化的,就从公司PPT摘张图出来,就当打广告了。
如果你玩拿破仑全面战争(好吧,或者你对历史感兴趣),回忆下拿破仑东征俄罗斯的进军路线和兵力变化。
..好吧,之所以对可视化感兴趣,就是因为当初玩拿破仑全战,然后看到公司PPT的这张图啊,被称为历史上最好的统计可视化,和我脑子里的几乎一样啊。这类专业问题也不白答,给公司网站加个链接吧。动环监控可视化如果你是做数据中心管理工作,关注过动力环境监控系统,或者关注过温湿度云图想象下一个机房模块的温度情况(来自传感器)这是看数据,纯粹的机器习惯这是很多动力环境监控系统,这两年尝试做到的效果(其实连这个基本3D效果都没达到),即位置+数据这是俺们的产品,不觉得这才是人类思考的逻辑么?你们是谁?乞丐也需要可视化乞讨 但是也需要非可视化乞讨可不可视化对非特定的人来说不是那么重要
前面有很多人已经写的很详细的关于为什么需要可视化,从人类视觉,信息解读的简易性还有发现未知结构角度分析了。想补充一点就是可视化是在大数据流行的当下产生的。一个是作为一种信息传播的新媒介简化我们对数据的认知(普罗大众)。另外一种是用来进行深度数据分析的,基于的前提是在我们对数据一无所知的情况下(科研)
人是视觉动物
个人比较的懒,不喜欢写太多的东西,也没那么博学,目的言简意赅——简单,高效
推薦閱讀:
※產品設計裡面,怎麼平衡用戶習慣和用戶體驗的關係?
※如何評價2016/3/1知乎3.1版?
※豆瓣有哪些你不喜歡的用戶體驗細節?
※Zaker 與 Flipboard 區別在哪?
※像足記這樣「現象級」的App,為什麼火一把就死了?