数据可视化

可视化的数据能用来干嘛?现在越来越流行信息图这个模式了,把数据用图表的形式展示出来,加入一些对比和分析的文字,使数据更具可读性,读者也非常喜欢这种信息图。

但是Facebook最近展示了一个内部使用的工具,能够用来监控和修复服务器存在的问题。

这个工具叫Claspin,是由Facebook的员工Sean Lynch开发的,能够从TCP请求超时中扫描和推断出性能问题,并绘制一个热图使得解决问题更加简单。

Sean Lynch在一篇博客文章中指出,当他第一次来到公司,Facebook有两个缓存系统,memcache和TAO,使用成千上万的图表和仪表板来展示公司的运营数据存储阵列。最开始这些系统运行非常稳定,但随着Facebook的规模和复杂性的增长,想找到其中那一块出现问题变得越来越难。所以工程师们想到了一个更好的方式来展示数据,其实就是把复杂的图表简化,把一个主机的状态信息用一个小方块来表示,绿色表示运行正常,红色表示运行出现问题,黄色则居于前两者之间。

因为方块的排列就是服务器的物理布局的可视化显示,包括机架名称,行号等,所以任何级别的问题都是很容易发现和定位的。

Claspin搭建好并运行的时候,在一个30英寸的屏幕上,可以很容易的同时看到10000个主机的状态,由30种以上的颜色来表示主机的状态,并且是实时更新的。

数据可视化

鼠标移到对应的方块上,可以看到主机的各种状态属性,并且也是用颜色来表明问题等级的。

看起来是不是很有意思呢?