华为AIOps服务:让智能化运维触手可及

来源:企鹅电竞比赛    发布时间:2024-02-25 13:23:17 点击:1次

  如今,我们已步入了由5G、云和AI驱动的智能时代,置身于一个庞大的数字世界中,运维是支撑数字世界正常运作的一大基础性技术。随着数字世界的系统越来越庞大、复杂度慢慢的升高,运维对对智能化的要求就会慢慢的强烈。另一方面,随着“5G新基建”的加速实施,为数字化的经济的发展注入了新动能,驱动千行百业的智能升级。尤其是在电信领域,运维能力的智能演进慢慢的变成了电信网络能否持续发挥效能的关键要素。

  业界一致认为,智能运维将是构建数字世界的一个必选项。据Gartner的预测,到2022年,40%的大中型企业将部署AIOps平台。那么,我们第一步来看下,传统的人工和工具化运维为何将被淘汰?

  在信息化1.0时代,IT部门主要扮演业务部门跟随者的角色,运维主要承担封闭的IT环境中硬件和软件的日常巡检、维护和升级等工作,业务对IT的依赖程度不高,所以企业对运维效率的要求也不高。

  随着数字化的经济的时代来临,IT部门的角色发生了巨大改变,数字化转型过程中,当云、IT等部署达到一定的规模,传统运维工具和运维方法就捉襟见肘。以电信网络为例,60%的运营商存在运维系统割裂的问题,OSS各专业系统独立、新功能应用内上线周期长;被动式运维使得故障诊断依赖经验,故障处理耗时长,准确率低;自动化程度低导致程人工参与环节多,使得人工成本居高不下;人工积累的经验难以应对网络复杂化带来的新问题,90%的时间耗费在了定位故障上。

  虽然大家一致认为AIOps“真香”,但可惜的是,AIOps的应用和普及仍处于早期一个阶段。相关统计显示,企业AI实际应用率远低于行业预估的增长水平,AI运维应用面临着开发门槛高、周期成等障碍,主要体现为:AI落地在实际业务中,需要业务分析师、开发工程师等人员参与,而大部分企业组织面临着缺乏AI专业相关知识的员工;单一的AI技术没办法满足企业诉求,效果难体现,流程编排难度大,运维人需要人工编码开发不同场景的AI应用,耗时耗力;此外,AI技术是工具,数据是灵活输入,大部分公司和组织缺乏数据采集的能力,没有大量的干净的数据积累,使得AI的解决能力大打折扣。

  基于沉淀30余年的专业积累和通信领域的经验,早在2019年,华为发布了iMasterNAIE平台,AIOps服务基于iMasterNAIE平台,采用服务化架构提供AIOps平台能力,为网络智能运维提供了落地的捷径,以支持运营商、合作伙伴快速开发AI应用。

  据华为NAIEAI模型与训练服务部部长杨建介绍,华为AIOps服务拥有四大核心竞争力:

  首先,华为AIOps服务拥有电信领域的AIOps原子能力,提供20多个丰富的AIOps原子能力,覆盖预测,检测、定位、执行等多环节能力,轻松应对运维领域AI模型和算法开发门槛高、开发周期长等挑战;

  其次,提供零编码流程编排能力,针对不同场景,可视化拖拽式编排,大幅度的提高运维人员AI应用开发效率;

  再次,针对数据难获取,网元种类多,接口复杂不统一、数据治理时间长和数据标注成本高等挑战,AIOps提供了预制数据采集治理能力,提供一站式的数据采集、解析、治理等基础工具链,以及智能辅助数据标注能力。

  最后,围绕运维全流程提供了预制典型场景组合应用,10+开箱即用的APP,ADN解决方案预集成,快速接入运维流。

  经过两年的迭代发展,据了解,华为AIOps服务目前已经实现了规模应用,支持4个业务领域、110多个现网局点、API调用达每月4.1亿次、10万个KPI、每天1000万个警告、4T条日志,为通信网络提供了坚实的运维保障,并助力运营商及企业网络打造了一系列最佳实践:

  在电信网络中,核心网的故障对于网络质量和使用者真实的体验的影响最大,某运营商2019年发生核心网交换机软失效,导致了15万用户VoLTE业务中断10+小时,而核心网具有重复故障少,定位难、故障分析耗时长等运维调整,传统静态阀值检测无法适配业务动态变化,存在漏报、误报。华为核心网KPI异常检测APP,帮助某运营商提前5小时察觉缺陷,实现预测性运维。第一时间上报变更异常并发送告警短信,降低了业务损失,保障5G高端用户上网体验。

  运营商无线的基站从地理上分布非常广,面临人力成本高,告警量大,工单效率差的问题,此外,跨区域定位难,导致大量的无效单,依赖跨部门专家协同,通过AIOps来监督无线网络的告警,能轻松实现精准的派单。在2019年的实施效果就已达到了总体减少10%的空单数量,提升30%的运维效率。

  依靠华为AIOps服务,能提前14天预测数据中心的硬盘会不会出库。目前,在华为AIOps服务上,已经累计接入了全球200家以上的公司数,累计监控的硬盘数量超越了12万台。在2020年一年之间识别出了4000块以上的故障,识别了1000个以上的数据备份场景,来保证了数据中心的数据安全。

  “数字化转型道路千万条,智能运维第一条”。华为AlOps服务作为智能运维的AI能力引擎,笔者相信,以其AI技术能力与华为在电信领域的行业能力相结合,为运维智能化的发展提供了高效便捷的高速公路,让运维彻底告别“慢”和“痛”。

上一篇:DTW2023:华为AUTIN支撑以宽广为中心的新一代智能运维转型继续引领职业立异
下一篇:华为行业运维持续护航企业数智化转型