做好机房运维,助力疫情防控
为配合山东省某省级部门开展疫情网上宣传、教学和防控直播等工作,山东分公司运维部驻某数据机房春节假期值班人员,立即从值班状态转入应急值守状态,由2至3人组成的现场团队7*24小时连续运转。
出于抗疫需要,该数据机房的有关业务和负荷,从春节期间几乎全部关停状态突然转入最大负荷。传统业务全部开放、疫情填报业务紧急上线、网上教学点播和抗疫直播、视频会议等业务全面开启……要知道这个数据机房的正常运维工作是由包括网络、安全、服务器、数据库、动环等9人协作实现的。在时间紧、人员缺、任务急的情况下,第一时间满足用户最急迫的需求,保证数据机房各项工作安全有序开展,在关键时刻不掉链子,体现赛尔网络有限公司运维服务的价值,为抗疫工作贡献自己的力量成为我们工作的重点。现对于抗疫特殊时期如何开展运维工作做初步思考和总结。
首先,端正工作态度、统一思想。通过网络视频会议的方式,与运维团队全员再次明确,我们从事的是机房运维工作,机房7*24小时运行没有假期。同时保证各类业务在关键时刻及时开放和安全稳定运行是我们的责任,在当前全民抗疫特殊时期,更不能掉链子。我们应该向奋战在武汉和奔赴武汉的白衣天使们学习,作为运维人员能在这个特殊时期贡献自己的绵薄之力是值得骄傲和自豪的。
其次,科学编制并发布应急值守计划,并严格执行。根据最小聚集原则和人员实际情况,组织2至3名春节假期留级和返济骨干在现场值守,将感染风险降到最低;数据库、服务器等方向的技术人员自行隔离,通过VPN进行远程巡检和运维;视频会议和办公运维人员根据用户实际需求在家隔离待命,随时可赴现场处理各类问题。
最后,每日与全体运维人员召开网上视频会。在会上通报当日运维任务及完成情况,并通报个人身体状况普及抗疫知识,播放一线抗疫人员宣传片。
通过以上工作,数据机房运维团队统一了认识、凝聚了斗志,无论是在现场坚持值守的人员,还是隔离在家远程巡检并配合处理故障的人员,都表现出高度负责、积极主动的精神品质。春节抗疫期间,运维团队多次连续工作到深夜,凌晨两三点也能及时处置机房报警等故障。在多数人员未返岗的情况下,依靠高耦合的一二线运维人员配置,实现了与日常运维同样的效果,顶住了突然增长的业务压力,向用户充分展现出我们优秀的运维服务质量,为全国抗疫战斗贡献了自己的绵薄之力!