2

(。・∀・)ノ゙嗨,盆友们,这次我胡汉三又回来啦!这次我们要讨论的另一款功能强大的可视化工具是与Power BI师出同门的Time Series Insights(微软爸爸的怀抱).
俗话说的好,相亲前要先看简历!那么Time Series Insights简历会是什么样呢?他为什么能从众多追求竞争者中脱颖而出?是长相出众?还是个性独特?我们要从TSI的概念开始聊起!

1. Concept

根据Time Series Insights官方文档所述:

According to Time Series Insights' official documentation:
AZURE TIME SERIES INSIGHTS IS A FULLY MANAGED ANALYTICS, STORAGE, AND VISUALIZATION SERVICE THAT MAKES IT SIMPLE TO EXPLORE AND ANALYZE BILLIONS OF IOT EVENTS SIMULTANEOUSLY. IT GIVES YOU A GLOBAL VIEW OF YOUR DATA, LETTING YOU QUICKLY VALIDATE YOUR IOT SOLUTION AND AVOID COSTLY DOWNTIME TO MISSION-CRITICAL DEVICES BY HELPING YOU DISCOVER HIDDEN TRENDS, SPOT ANOMALIES, AND CONDUCT ROOT-CAUSE ANALYSES IN NEAR REAL-TIME.  

在这段言简意赅的浓缩概括中,几个闪亮的关键词引起了我的特别注意:
(There are a few glittering keywords which really catch my attention when I read this paragraph: ) 

  • FULLY MANAGED ANALYTICS, STORAGE, AND VISUALIZATION SERVICE

换言之, Azure TSI=SQL Database+Query System(powerful analysis)+Visualization Layer.
另外, 'Fully Managed' 可能暗示着TSI提供的解决方案是开箱即用的,无需工程师进行复杂的架构和调配的。从上述我们给出的公式也可以看出TSI是多种工具融合一体的产品,因此推测可能会非常易部署和上手(Also, 'Fully Managed' indicates that Time Series Insights is probably an out-of-the-box solution with no complex architecture and easy configuration. From the above formula that we gave, it can also be inferred that TSI is a handy and easy-to-deploy product)。

  • BILLIONS OF IoT EVENTS SIMULTANEOUSLY  

TSI支持同时对上千万IoT时间数据的可视化,以全局视角来展示数据,'extremely suitable for when the number of devices exceeded several hundred thousand. Even POWER BI doesn't have the ability to do this(特别适用于当IoT设备数量超过十万的情景。此时Power BI可能都没有这样的能力做到这一点).'

  • HIDDEN TRENDS, SPOT ANOMALIES, AND CONDUCT ROOT-CAUSE ANALYSES IN NEAR REAL-TIME

TSI能帮助用户发现数据潜在趋势,侦测设备异常且具备根源分析能力,而这一切的操作实现几乎都在实时完成。

  • TSI所解决的用户痛点:

challenges

这张截图来自微软首席项目经理OP Ravi在Microsoft Build 2017中针对TSI的产品展示演讲。
它阐述了在IoT数据可视化领域,现今客户的普遍痛点:

  • 数据总是被储存本地,无法在云端共享;
  • 工程师或数据分析师没有时间做可视化前的数据处理准备;
  • 很难去可视化IoT大量级数据(比如当数据的数量超过10万以上);
  • 可视化的工具能够公司被不同层级不同岗位的人员使用,易用易上手。

根据微软的另一产品经理Andrew Shannon在IoTSWC 2017会议中所描述,TSI原本只是一款Microsoft公司内部使用的产品,而正是因为他们发现其他公司也有着和微软同样的痛点,他们决定将这款产品商业化,并放入Azure生态环境。

  • 一张图对TSI的总结

core scenarios
TSI在这些核心场景中能展现其在市场中独特优势:

  • IoT时间序列数据的可视化和分析;
  • 针对多设备,多工厂的不同数据的统一视窗
  • IoT方案的验证和检测
  • 根源问题分析和异常侦测
  • 支持REST API, 自由灵活地在TSI上层开发您自己的APP

综上所述,TSI不同于一般的终端可视化软件,以展示数据仪表盘为主, 它是一款针对海量IoT设备数据的统一化可视和分析软件。它由多种工具集成,开箱即用,操作简便友好,对非专业工程师人员同样适用。

2. Architecture

TSI Architecture

作为Azure生态圈中一款IoT数据可视分析产品,TSI的架构主要依赖于Azure框架。事件数据从不同遥感设备上传入到Azure IoT Hub或Azure Event Hub中, 通过简单的设置即可将数据储存在TSI自带的SQL数据库,数据将以时间为主索引进行储存,最终通过TSI Explorer图形化展示。

  • 使用TSI后架构发生的变化(Comparison between 'before TSI' and 'after TSI')

Architecture before Azure TSI implementation
Comparison A. Architecture before Azure TSI implementation.
Architecture after Azure TSI implementation.
Comparison B. Architecture after Azure TSI implementation.
可以看到,在使用TSI后,架构设计中减少了产品使用的数量。并且省去了在存入数据库前对数据的预先流处理的环节。而TSI能完美地代替Stream Analytics,利用这些未经处理的原始数据自动生成可用的Schema供用户分析选择。这样一来不仅简化的了产品架构的复杂程度,也节省了一定的人力和金钱成本

3. Using Time Series Insights to explore your data

  • 配置过程

TSI配置过程较为简单,注意使用TSI的前提条件为:

  1. Azure可用的账户;
  2. 数据流经IoT Hub或Event Hub.

由于无复杂的构架,具体配置过程可参见微软官方手册
其他相关配置操作请参见上述链接中左方导航栏的How-to Guide。

  • 产品界面

TSI explorer为一款云端基于web的可视化及分析工具,其主要界面如下图所示:
TSI-layout
界面无法进行自定义设计和拖拽,相较于Power BI显然没那么灵活。可以在主仪表盘进行多个图表的展示。点击+号可添加图表。
逐个点击仪表盘中的每个图标,可以看到关于该图标的详细信息及界面展示:

  • Line Graph: 针对时间序列的数据可视化,Y-axis中展示的值可以根据界面中左方Query中的Measure来选择调配。使用与观察数据在某一项(例如设备温度)指标的走势趋向,方便决策和规避风险

line-graph

  • Heatmap: 整个界面与line-graph相似。同样针对于时间序列。 适用于根源分析和异常侦测。能快速发现设备在某个时刻的异常动向(颜色标识明显),根据异常的数据记录逐层分析出根本原因;

Heatmap
两个图表都能通过左上角滑动条灵活调配图表中的时间间隔;
左下角的Query能够对显示的数据做一些限制,例如只显示温度超过20度的数据等,query无需使用任何特定的编程语言只要进行简单的设置即可使用;
在图标上选择特定时间范围,右选后看到弹出的菜单可以选择Zoom或Explore Data。 Zoom可以进一步放大时间区间的数据,Explore Data后则出现图中右下角的图形框。可以看到时间范围内各个数据指标的图形可视化(Stats)和所有的数据库记录(Events);
在图形部分的左侧Filter Series下方的区域,选择右键,可以看到弹出的菜单。选择Spilt this series by...可以看到TSI按照数据不同自动生成的schema。侧面印证了TSI内部包含了对数据的流处理。 在我的例子我针对了不同设备的名称来拆分我的数据流。

  • 实时图形刷新频率<=60s  

The data update interval is usually within 60 seconds. And it only automatically refreshes the line graph of the following query sector.
auto-refresh
当要搜索的时间区域确定后,主界面所展示的line graph和heatmap是不会随时间自动刷新的。但搜索区域的索引line graph是会以小于等于1分钟/次的频率刷新的,不过条件是将界面右上角的autofresh功能打开。
在每次更改query条件或手动刷新也能让TSI展示数据库内的最新数据。但是就不要期待TSI能有流动的事实数据展示了,它做不到像POWER BI streaming dashboard中接近于实时的数据图形流动效果

4. Conclusion

总结一下TSI的优缺点:

Benefits:

  1. 易用 - TSI能自动对数据进行流处理,分析出可用的指标和数据结构,供客户进行可视化和分析。无编程技能的要求,适合各类人员的使用;
  2. 简单 - 从IoT Hub或Event Hub流出后所有数据处理可视化和分析都集成在了一个工具中。因此也能有效降低架构复杂度和成本(Simplicity - the whole logic of data aggregation is prepared in one tool; Reducing the number of services, and therefore costs(cost effective) – thanks to replacing Stream Analytics and databases which we no longer needed);
  3. 实时数据分析 - 数据进入TSI的延迟小于等于60s, TSI对数据的分析显示都是基于近乎实时的基础上(Real-time analytics – there is a live data preview via line graph and a heat map);
  4. 灵活 - 可以利用REST API构建您自己的APP,自定义可视化类型(Flexibility – the solution is accessible via APIs. You can customize your visualization on the top of TSI);
  5. 可伸缩 - 针对多设备地理位置分布的不同遥感设备产生的大数据,提供统一全局的管理和视图,可随意伸缩扩展适合观测走势趋向帮助决策或异常侦测根源分析( scalable, extremely suitable for when the number of devices exceeded several hundred thousand. Even POWER BI doesn't have the ability to do this)。

Caveats:

  1. 仅针对Azure生态使用且仅目前仅接受来自于IoT Hub或Event Hub的数据(Azure Eco-Environment----only accepts source from IoT Hub and Event Hub);
  2. 仅具备heatmap和line graph两种图形的可视化,无法自定义图形或修改图形,同样无法修改仪表板样式或图表样式。可视化限制性强(Only Line Graph and Heatmap, no customization or any edit);
  3. 不适用于实时数据的监测,无报警功能,无实时数据可视的能力;更适合于海量数据的可视化分析。

综上所述, TSI这款产品比较适合于

  • 各类开发资源有限的
  • IoT设备多且位置分布,种类各异的(例如石油,生产等传统行业的工厂)
  • 所提供的可视化数据及分析需要提供给公司不同人员使用(如工程师,数据分析师,客户经理等等)
  • 着重于实时数据分析,而不是实时数据的可视化仪表盘,对单个设备的数据监测需求不高的公司或客户方。  

[Appendix]Reference:

  1. https://predica.pl/blog/azure...
  2. https://www.youtube.com/watch...
  3. https://www.youtube.com/watch...

段子手女装大佬
55 声望15 粉丝

一个被论文困住的我啊啊啊啊啊啊。悲惨。写完论文再回来码字字!!