18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 行业动态 > AIOps能干什么?

AIOps能干什么?

时间:2022-03-30 00:39:01 | 来源:行业动态

时间:2022-03-30 00:39:01 来源:行业动态

根据Gartner的定义,AIOps的主要目标包括:通过采集当前环境中的运维数据,集成现有IT运维管理工具,利用算法等高级数据分析技术对IT系统中各个环节的问题进行快速定位、故障排除和预测;对来自业务环节中各个分布式系统的数据进行聚合分析,合理优化IT服务,挖掘关键业务的KPI指标,反哺业务端,帮助其做出明智决策;通过大数据和人工智能技术分析用户的行为日志和运维数据,发掘潜在的系统安全和合规问题,为企业的信息安全保驾护航。

功能看起来很多,但在笔者看来最为核心的功能有:发现异常、定位故障、基线预测等,这些都属于智能运维范畴,在此之上还有提供对业务支撑和运营,也就是现在一些厂商提的IT运营。与前面的核心功能相比,业务支撑和运营各家都有自己的解读。相比较而言,前面的几个功能更容易理解,也更为普遍。

以发现异常为例,传统IT运维工具中都会采用基于经验值来定义异常阈值,这种方法主要基于人的主观判断。而基于机器学习的方法,通过积累历史运维数据,根据日常运维的需求在数据特征的基础上建立算法模型,对模型进行周期性地训练学习,从而能为IT系统提供更为及时、准确、高覆盖的检测结果。比如,传统异常发现的流程是运维人员在系统中创建了业务路径,并对路径中关注的节点或连线进行告警设置。如数据中心网银交易服务器响应时间告警的设置为300ms,如果运维软件监测到响应时间超过300ms,系统告警。而采用AI方法进行异常检测时,运维人员不用对业务路径做任何告警设置,当机器学习算法检测到某个业务路径的某个节点或连线上产生了异常值,就会自动抛出异常事件。

抑制告警风暴也是AIops的非常实用的功能。所谓告警风暴是指在短时间内系统产生大量告警消息,这些消息有的是由某种共同因素引发,互相之间存在一定关联。大型企业的IT应用系统庞大而复杂,设备数量动辄成千上万,任何一个小小的IT问题都有可能引发告警风暴。大量同一事故源引发的告警信息会极大地干扰运维人员的工作,导致运维人员疲于应付大量的告警消息,需要耗费更多时间排查和处理问题,大大降低了运维效率,更为严重的是会让真正关键的告警信息淹没其中,由于无法第一时间发现根源问题,延误了故障处理时间。而AIops通过算法模型结合固定规则的方式对告警消息进行告警压缩和告警合并,在保证核心告警内容(即不压缩核心告警内容)的前提下合并告警消息数量,为运维人员提供有效的告警信息。

前面还提到,市场也有很多厂商提出IT运营,不只是让AIOps用于运维,还希望让AIOps为业务运营提供更多直接支持,比如对IT系统进行预警和预测,辅助决策,从而为企业的IT管理从IT运维向IT运营转型提供帮助。应该说,这应该是IT运维的发展方向,毕竟运营才能产生效益,Gartner也提出了这个观点。但与IT运维相比,IT运营还是一个更高级的阶段,如何支持还需要更多探索。这里不多赘述。

关键词:能干

74
73
25
news

版权所有© 亿企邦 1997-2022 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭