浅谈科技运维一线工作的数字化转型

来源:企鹅电竞比赛    发布时间:2023-12-30 12:36:55 点击:1次

  G行始终践行“以客户为中心”的服务理念,通过科技赋能,一直在优化业务流程,逐步实现数字化转型,提升对业务的服务支持,推动业务高水平发展。对于科技运维工作,是否也可借助数字转型赋能一线,在促进高质量发展的同时推动降本增效呢?

  G行运维一线时代,主要负责生产系统监控及批量手工操作。此时监控工具分散,批量工作需双人复核手工执行,告警后运维一线技术水平有限,独立处置水平较低,运维二线人员夜间呼起率较高。

  伴随G行技术平台的发展,运维一线工作内容进一步扩充,进入2.0时代,主要负责生产事件处置、事件通知通报、科技服务请求受理、安全权限管理等。依托统一监控管理平台,总览生产系统运作情况;依托批量自动化平台,日均调度14000余个批量任务;依托新一代运维自动化操作平台、IT服务管理系统等,事件及服务请求独立处置率为62%,运维二线夜间呼起率大幅度下降;依托综合管控平台、机房巡检智能管理系统、系统用户维护管理平台,实现物理安全管控、生产服务器用户权限管控。但由于运维一线在应用、系统、云、网络、安全管理等领域涉及使用的平台及产品已达数十个,部分平台和产品间无法相互连通,彼此形成信息孤岛,需要运维一线人工进行串联,造成运维一线工作中如下痛点:

  1、信息分散,需人工跨平台拼凑数据链,信息采集效率较低,通知通报效率较低;

  基于以上痛点问题,G行建开展科技运维一线工作台项目建设工作,打造运维3.0时代,将科技运营过程中的平台、流程、数据来进行整合,重塑业务流程,整合科技服务能力。

  数字化的基础在于连接,本项目将现有场景的业务需求提取最大公约数,整合现有工具平台、业务流、数据流资源,合力提升信息收集和通知通报效率,从而解决以上问题,提升运维一线人员的服务能力和服务效率。

  数字化转型项目的开展一般都会采用明确业务需求、深入挖掘痛点、针对性设计数字化场景解决方案的形式。本项目完整梳理了G行运维一线的工作内容、操作平台、业务流程、痛点及风险点,以“数据协同、功能复用、业务场景驱动”为建设理念:

  1、将生产系统配置项信息、维护人员信息及各类科技运营信息进行整合,实现生产系统数据整合,可快速提供运营所需数据;

  2、实现数字化外呼功能、信息采集模板定制化功能、内部通讯软件信息推送等功能,可结合不同业务场景,通过本平台做原子化配置,提升工作效率;

  3、将运维一线业务场景标准化,聚合数据与平台优势,实现场景数字化、自动化,弥补人工执行差异。

  数字化转型有力提升了运维一线工作的自动化水平,提升了运维一线在信息收集、通知通报等方面的效率及标准化程度。以下以运维一线每日基本工作事项为例,阐述本平台对运维一线工作效能的提升效果。

  为保证每日安全运营情况在科学技术板块内高效流动,运维一线每日汇总事件、变更、容量、安全等领域的情况,通过“晨汇报夕总结”的形式,对重点关注内容及风险隐患进行提示。运维一线项安全运营情况总结汇报内容。除总结汇报,每日需对安全运营情况做巡检及多次、定时通报,如开门检查结果通报、互联网带宽流量检查结果通报等。人工采集信息存在效率较低、容易出错的问题,定时通报存在受人工影响造成延误的问题。

  本平台将G行的IT服务管理系统、容量系统、科技运营数据平台等平台数据整合,建立晨会场景,每日自动汇总生成日报,将人工收集项降低至3项,实现晨会汇报内容电子化;建立安全运营情况汇报场景,将人工收集项降低至4项,提升信息收集效率及准确性;建立安全运营巡检场景,结合RPA技术实现自动化巡检,配合定时任务调度配置,实现巡检结果定时发布。提升信息收集能力、通知通报能力、安全运营能力,减少人因操作风险。

  为保障告警信息通报及时,运维一线根据统一监控平台及处置预案对相应管理员进行人工外呼,日均外呼248通电话。由于监控告警信息、系统与管理员的关联关系、管理员联系方式、告警处置预案分散在不同平台,运维一线人员在梳理完整信息链后,通过固定电话进行人工外呼,效率较低;伴随系统上全栈云数量逐渐增加,多系统集中告警场景需统筹各系统、各领域管理员迅速集结处置,人工并发通报效率较低。

  本平台将G行外呼平台、外呼通报规则、告警信息、人员信息进行整合,在数据及时来更新可用的前提下,以统一监控平台为操作平台,实现告警一键外呼、并发外呼功能,帮助运维一线将外呼通报能力由分钟级提升至秒级,单系统外呼效率提升83%,多系统并发外呼效率提升95%,实现通报能力跃迁。同时,本平台设置外呼对象除重机制,在保证通报准确到位的同时减轻管理员的压力。

  数字化转型既是需求的驱动,也是技术的进步和成熟的体现,更能带来降本增效的作用。G行的科技运维一线时代,工作内容逐步由简单手工操作转向更复杂的事件初步分析、部分事件独立处置等领域,需为安全运营提供更为有力的支撑,这就需要运维一线人员不断地学习新技术,掌握先进工具和方法,以适应发展的新趋势,提升安全运营能力,将人工操作向标准化、自动化、敏捷化方向转型。相信通过不断的提高自主研发能力、优化运维流程,逐步推动数字化转型,科技运维一线工作台项目将助力G行安全运营工作的开展,为G行的金融科技发展保驾护航。

上一篇:鹏Talk 你不知道的网络运维那些事儿
下一篇:运营维护