当您在阿里云上使用云资源遇到问题时,可以通过查看文档、博客或者提交工单的方式来解决问题,但问题的处理周期可能较长,成本可能较高。为了解决上面的问题,阿里云推出了自助诊断系统,帮助您一键提交问题诊断,快速获取诊断结果。

本文将从技术角度来介绍阿里云自助诊断系统的优点及其实现方法,进一步阐述阿里云自助诊断系统的能够为您解决的问题。关于阿里云自助诊断系统的介绍信息,您可以通过查看 阿里云自助诊断系统 获取。

阿里云自助诊断系统优点

通过阿里云自助诊断系统提交问题诊断,不仅能够降低问题的反馈沟通成本,而且能够缩短问题的处理时间,提高了问题处理效率,同时,阿里云自助诊断系统诊断的时效性以及准确率还在不断的提升。

阿里云自助诊断系统依靠强大的技术支撑,相比其它问题反馈沟通渠道,具有以下几大优点:

  • 一键反馈,反馈问题方便、快捷
  • 反馈信息准确、全面,有助于问题处理
  • 秒级自动回复,时效性强
  • 问题精准投递,第一时间通知对应人员
  • 问题处理周期短,业务影响小
  • 问题闭环处理,用户体验好

当然,阿里云自助诊断系统也有其自身的一些问题,后续章节会进行详细介绍。

阿里云自助诊断系统实现

阿里云自助诊断系统,主要由四个系统模块组成,即:

  • 智能诊断库
  • 智能方案匹配
  • 诊断展示
  • 诊断反馈

目前,阿里云自助诊断系统支持对多种云资源、多种操作提交诊断。诊断系统整体架构如下图所示:

从上图可以看出,阿里云自助诊断系统中各个模块的组成不同,功能不同功能。

智能诊断库

智能诊断库是一个包含了不同云资源、不同操作类型对应的异常信息集合,涉及到了 ECS 实例、镜像、磁盘、弹性伸缩组等资源相关的信息。智能诊断库主要有四大支撑要素,即:

  • 近千诊断模板,包含了不同的云资源、不同的操作类型引发的异常信息对应的原因及处理方案,诊断方案由这些模板组合生成。
  • 海量的数据输入,这些数据主要包含用户提交的诊断、反馈信息,研发人员根据系统问题填充的信息,阿里云收集的异常信息等,这些数据的输入,促进诊断库不断的丰富和优化。
  • 智能学习优化,根据每天收集到的不同的异常问题和用户反馈等信息,智能诊断库利用自适应等学习优化算法,不断地优化模板。
  • 诊断大盘,每天实时生成诊断数据,包括诊断率,满意率,诊断时间等信息,之所以定义其为催化剂,是因为它能及时反应诊断库模板的覆盖率以及准确率等信息,推动新模板的增加以及现有模板的调优等。

上述四个要素,保证了智能诊断库生成的诊断方案具有较高的代表性和准确性。

智能方案匹配

智能方案匹配模块以诊断系统分发下来的用户异常问题作为输入,先分析异常对应的云资源类型及操作类型,建立二维模型,然后将二维模型输入到智能诊断库,利用最优的查找匹配算法匹配问题的原因及解决方案,如果匹配上,则生成诊断方案,输出到诊断展示模块,如果匹配不上,则通过内部系统匹配问题责任人,第一时间将问题推送到责任人,责任人处理完成后提交诊断反馈到诊断展示模块。

诊断展示

诊断展示模块主要用来展示诊断状态及查看诊断方案,您可以登录 阿里云诊断列表页 查看30天内提交的诊断信息,可以查看到当前诊断的状态,处理完成的诊断可以查看诊断方案,获取问题的原因及对应的解决方案。

诊断反馈

诊断反馈模块,主要用于接收您对诊断方案的反馈,不论您对诊断方案是否满意,建议您多提交诊断反馈,因为反馈信息作为智能诊断库的输入源之一,可以帮助我们促进诊断库的优化和改进,对自助诊断系统即为重要。

一个完整的自助诊断过程如下图所示:

即,当您操作云资源发现问题时,提交诊断,诊断系统接收到诊断信息以后进行匹配处理,根据匹配结果会有两种方案处理方案,即智能诊断、人工处理,用户查看诊断方案,并对诊断方案进行回复。

阿里云自助诊断系统现状及未来

目前,阿里云自助诊断系统已经接入 ECS 控制台ESS 控制台,后续将接入更多的云产品控制台。阿里云自助诊断系统目前支持智能诊断人工诊断两种模式,后续会支持更多的诊断模式,目前智能诊断率已经达到了 90% 以上,并且这一数字还在增长中。
阿里云自助诊断系统也有一些急需完善的地方,如:诊断系统需要覆盖更多的云产品和更多的操作类型;诊断方案准确性有待提高,最终实现用户诊断一个问题,解决一个问题。

写在最后

阿里云自助诊断系统目前还在不断的优化和改进,依靠其背后强大的技术支撑以及开发人员时间的投入,用不了多久,阿里云自助诊断系统会为您更加快捷、准确的解决问题,节约您的宝贵时间,改善您的使用体验。


本文作者:朴实无华
阅读原文
本文为云栖社区原创内容,未经允许不得转载。


阿里云云栖号
27.8k 声望35.7k 粉丝

阿里云官网内容平台