(。・∀・)ノ゙嗨,盆友们,这次我胡汉三又回来啦!这次我们要讨论的另一款功能强大的可视化工具是与Power BI师出同门的Time Series Insights(微软爸爸的怀抱).
俗话说的好,相亲前要先看简历!那么Time Series Insights简历会是什么样呢?他为什么能从众多追求竞争者中脱颖而出?是长相出众?还是个性独特?我们要从TSI的概念开始聊起!
1. Concept
根据Time Series Insights官方文档所述:
According to Time Series Insights' official documentation:
AZURE TIME SERIES INSIGHTS IS A FULLY MANAGED ANALYTICS, STORAGE, AND VISUALIZATION SERVICE THAT MAKES IT SIMPLE TO EXPLORE AND ANALYZE BILLIONS OF IOT EVENTS SIMULTANEOUSLY. IT GIVES YOU A GLOBAL VIEW OF YOUR DATA, LETTING YOU QUICKLY VALIDATE YOUR IOT SOLUTION AND AVOID COSTLY DOWNTIME TO MISSION-CRITICAL DEVICES BY HELPING YOU DISCOVER HIDDEN TRENDS, SPOT ANOMALIES, AND CONDUCT ROOT-CAUSE ANALYSES IN NEAR REAL-TIME.
在这段言简意赅的浓缩概括中,几个闪亮的关键词引起了我的特别注意:
(There are a few glittering keywords which really catch my attention when I read this paragraph: )
- FULLY MANAGED ANALYTICS, STORAGE, AND VISUALIZATION SERVICE
换言之, Azure TSI=SQL Database+Query System(powerful analysis)+Visualization Layer.
另外, 'Fully Managed' 可能暗示着TSI提供的解决方案是开箱即用的,无需工程师进行复杂的架构和调配的。从上述我们给出的公式也可以看出TSI是多种工具融合一体的产品,因此推测可能会非常易部署和上手(Also, 'Fully Managed' indicates that Time Series Insights is probably an out-of-the-box solution with no complex architecture and easy configuration. From the above formula that we gave, it can also be inferred that TSI is a handy and easy-to-deploy product)。
- BILLIONS OF IoT EVENTS SIMULTANEOUSLY
TSI支持同时对上千万IoT时间数据的可视化,以全局视角来展示数据,'extremely suitable for when the number of devices exceeded several hundred thousand. Even POWER BI doesn't have the ability to do this(特别适用于当IoT设备数量超过十万的情景。此时Power BI可能都没有这样的能力做到这一点).'
- HIDDEN TRENDS, SPOT ANOMALIES, AND CONDUCT ROOT-CAUSE ANALYSES IN NEAR REAL-TIME
TSI能帮助用户发现数据潜在趋势,侦测设备异常且具备根源分析能力,而这一切的操作实现几乎都在实时完成。
- TSI所解决的用户痛点:
这张截图来自微软首席项目经理OP Ravi在Microsoft Build 2017中针对TSI的产品展示演讲。
它阐述了在IoT数据可视化领域,现今客户的普遍痛点:
- 数据总是被储存本地,无法在云端共享;
- 工程师或数据分析师没有时间做可视化前的数据处理准备;
- 很难去可视化IoT大量级数据(比如当数据的数量超过10万以上);
- 可视化的工具能够公司被不同层级不同岗位的人员使用,易用易上手。
根据微软的另一产品经理Andrew Shannon在IoTSWC 2017会议中所描述,TSI原本只是一款Microsoft公司内部使用的产品,而正是因为他们发现其他公司也有着和微软同样的痛点,他们决定将这款产品商业化,并放入Azure生态环境。
- 一张图对TSI的总结
TSI在这些核心场景中能展现其在市场中独特优势:
- IoT时间序列数据的可视化和分析;
- 针对多设备,多工厂的不同数据的统一视窗
- IoT方案的验证和检测
- 根源问题分析和异常侦测
- 支持REST API, 自由灵活地在TSI上层开发您自己的APP
综上所述,TSI不同于一般的终端可视化软件,以展示数据仪表盘为主, 它是一款针对海量IoT设备数据的统一化可视和分析软件。它由多种工具集成,开箱即用,操作简便友好,对非专业工程师人员同样适用。
2. Architecture
作为Azure生态圈中一款IoT数据可视分析产品,TSI的架构主要依赖于Azure框架。事件数据从不同遥感设备上传入到Azure IoT Hub或Azure Event Hub中, 通过简单的设置即可将数据储存在TSI自带的SQL数据库,数据将以时间为主索引进行储存,最终通过TSI Explorer图形化展示。
- 使用TSI后架构发生的变化(Comparison between 'before TSI' and 'after TSI')
Comparison A. Architecture before Azure TSI implementation.
Comparison B. Architecture after Azure TSI implementation.
可以看到,在使用TSI后,架构设计中减少了产品使用的数量。并且省去了在存入数据库前对数据的预先流处理的环节。而TSI能完美地代替Stream Analytics,利用这些未经处理的原始数据自动生成可用的Schema供用户分析选择。这样一来不仅简化的了产品架构的复杂程度,也节省了一定的人力和金钱成本。
3. Using Time Series Insights to explore your data
- 配置过程
TSI配置过程较为简单,注意使用TSI的前提条件为:
- Azure可用的账户;
- 数据流经IoT Hub或Event Hub.
由于无复杂的构架,具体配置过程可参见微软官方手册。
其他相关配置操作请参见上述链接中左方导航栏的How-to Guide。
- 产品界面
TSI explorer为一款云端基于web的可视化及分析工具,其主要界面如下图所示:
界面无法进行自定义设计和拖拽,相较于Power BI显然没那么灵活。可以在主仪表盘进行多个图表的展示。点击+号可添加图表。
逐个点击仪表盘中的每个图标,可以看到关于该图标的详细信息及界面展示:
- Line Graph: 针对时间序列的数据可视化,Y-axis中展示的值可以根据界面中左方Query中的Measure来选择调配。使用与观察数据在某一项(例如设备温度)指标的走势趋向,方便决策和规避风险。
- Heatmap: 整个界面与line-graph相似。同样针对于时间序列。 适用于根源分析和异常侦测。能快速发现设备在某个时刻的异常动向(颜色标识明显),根据异常的数据记录逐层分析出根本原因;
两个图表都能通过左上角滑动条灵活调配图表中的时间间隔;
左下角的Query能够对显示的数据做一些限制,例如只显示温度超过20度的数据等,query无需使用任何特定的编程语言只要进行简单的设置即可使用;
在图标上选择特定时间范围,右选后看到弹出的菜单可以选择Zoom或Explore Data。 Zoom可以进一步放大时间区间的数据,Explore Data后则出现图中右下角的图形框。可以看到时间范围内各个数据指标的图形可视化(Stats)和所有的数据库记录(Events);
在图形部分的左侧Filter Series下方的区域,选择右键,可以看到弹出的菜单。选择Spilt this series by...可以看到TSI按照数据不同自动生成的schema。侧面印证了TSI内部包含了对数据的流处理。 在我的例子我针对了不同设备的名称来拆分我的数据流。
- 实时图形刷新频率<=60s
The data update interval is usually within 60 seconds. And it only automatically refreshes the line graph of the following query sector.
当要搜索的时间区域确定后,主界面所展示的line graph和heatmap是不会随时间自动刷新的。但搜索区域的索引line graph是会以小于等于1分钟/次的频率刷新的,不过条件是将界面右上角的autofresh功能打开。
在每次更改query条件或手动刷新也能让TSI展示数据库内的最新数据。但是就不要期待TSI能有流动的事实数据展示了,它做不到像POWER BI streaming dashboard中接近于实时的数据图形流动效果。
4. Conclusion
总结一下TSI的优缺点:
Benefits:
- 易用 - TSI能自动对数据进行流处理,分析出可用的指标和数据结构,供客户进行可视化和分析。无编程技能的要求,适合各类人员的使用;
- 简单 - 从IoT Hub或Event Hub流出后所有数据处理可视化和分析都集成在了一个工具中。因此也能有效降低架构复杂度和成本(Simplicity - the whole logic of data aggregation is prepared in one tool; Reducing the number of services, and therefore costs(cost effective) – thanks to replacing Stream Analytics and databases which we no longer needed);
- 实时数据分析 - 数据进入TSI的延迟小于等于60s, TSI对数据的分析显示都是基于近乎实时的基础上(Real-time analytics – there is a live data preview via line graph and a heat map);
- 灵活 - 可以利用REST API构建您自己的APP,自定义可视化类型(Flexibility – the solution is accessible via APIs. You can customize your visualization on the top of TSI);
- 可伸缩 - 针对多设备地理位置分布的不同遥感设备产生的大数据,提供统一全局的管理和视图,可随意伸缩扩展适合观测走势趋向帮助决策或异常侦测根源分析( scalable, extremely suitable for when the number of devices exceeded several hundred thousand. Even POWER BI doesn't have the ability to do this)。
Caveats:
- 仅针对Azure生态使用且仅目前仅接受来自于IoT Hub或Event Hub的数据(Azure Eco-Environment----only accepts source from IoT Hub and Event Hub);
- 仅具备heatmap和line graph两种图形的可视化,无法自定义图形或修改图形,同样无法修改仪表板样式或图表样式。可视化限制性强(Only Line Graph and Heatmap, no customization or any edit);
- 不适用于实时数据的监测,无报警功能,无实时数据可视的能力;更适合于海量数据的可视化分析。
综上所述, TSI这款产品比较适合于
- 各类开发资源有限的
- IoT设备多且位置分布,种类各异的(例如石油,生产等传统行业的工厂)
- 所提供的可视化数据及分析需要提供给公司不同人员使用(如工程师,数据分析师,客户经理等等)
- 着重于实时数据分析,而不是实时数据的可视化仪表盘,对单个设备的数据监测需求不高的公司或客户方。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。