零事故背后揭秘NGSOC如何助力冬奥安全运营中心——标准化运营篇

diystuffs 区块链产品 2022-06-18 18:20:44 soc归0

  少次的改版调优经过了记不清多,大屏、各场馆网络安全监控大屏、实时监控大屏在可视化呈现上逐渐形成了综合网络安全监控。

  品联动外除了产,打通这一重要任务还有安全场景的。完成需求拆解、方案设计、开发、测试、交付上线8大应急安全场景、40个常态化运营场景一并。终最,了与奇安信全产品体系的集成NGSOC首次在冬奥实现。的日志接入从各设备,析到安全能力的协同、联动数据的集中呈现、关联分,即可实现一站式监测、调查、响应闭环安全运营人员只需要通过NGSOC,产品之间来回切换无需在众多的安全。

  全运营SOP的制定首先是标准化流程安,业务正常运转充分保障了。安全运营SOP大大提升了团队信心冬奥网络安全监控值班经理提到:“,解自己的岗位职责大家清晰明确地了,清造成处置不当避免因为事实不。一来这样,可以更加高效运转比赛现场业务系统。”

  营中心项目中在冬奥安全运,程的运转标准化流,具的紧密配合离不开人和工,运营中心核心安全监测平台而NGSOC作为冬奥安全,结合保证SOP高效落地如何跟安全运营团队紧密?

  预置规则有448条冬奥项目NGSOC,开幕式之前到冬奥会,到了958条规则已经达,有新增的场景需求而且在赛时也会,在补充规则每天也都,达到1043条冬奥结束时规则,的威胁、异常、违规监测场景覆盖云上、云下所有核心资产。务器上部署的业务组件小到场馆的办公机、服,系统、安全防护系统大到数据中心的业务,服务的系统就有采集其日志几乎是有IP设备、有提供,志就有对应的监测场景有分析、监测价值的日。

  高并发首先是,计数十人同时在NGSOC上进行相关工作总指挥中心从监控岗、分析岗、处置岗等共,的并发要求很高这对NGSOC,整个冬奥赛事期间但是NGSOC在,直很流畅运行一。次其,信全产品体系的接入NGSOC与奇安,上和云下所有业务监控范围覆盖了云,测、分析、处置工作平台需完成所有的监,P进行紧密结合与安全运营SO。外此,事件回溯外除了安全,人员、处置过程、处置结果平台还可以回溯告警处置,论功能告警评,的处置写出结论可以将每条告警,过往期告警进行关联所有近似告警可以通,出现和查看结论分析是否历史,分析研判从而快速,监控处置流程不需要重复走。

  2021年底测试运营虽然从初期交付部署到,程很累、很繁琐梳理标准化流,了SOP但是有,日进入冬奥准赛时阶段后到了2022年1月23,而轻松下来了整个团队反。练掌握SOP所有人都能熟,己的工作内容明确知道自,、如何处置该如何汇报,台操作也高度熟练对NGSOC平。人数多虽然,效协同、有序处置但是整个团队高,可以通过标准化流程解决绝大多数的安全事件都。

  时监控工作带来了最直观、最及时的呈现实时监控大屏为冬奥安全运营中心的实,警数据统计、告警处置状态可以实时的看到最新的告。警发生时当危急告,7*24H运营工作带来最及时有效的提醒大屏通过告警提醒声音、屏幕特效方式为,用高效做到实。

  以兑现“零事故”承诺背后的重要保障如果说冬奥安全运营中心是奇安信得,就是安全运营中心的保障那么安全运维和应急响应。一步为大家介绍下一篇我们将进,维保障和应急响应保障背后的故事关于冬奥安全运营中心的安全运。

  营中心项目中在冬奥安全运,上、云下1000+种数据源NGSOC平台共计接入云,备、应用系统、业务系统等所有核心资产涵盖终端、服务器、网络设备、安全设。超过80类日志种类,5亿日志日均3,志千亿级存量日。

  委赛时要求提升的背景下在问题日益凸显和冬奥组,挑战迫在眉睫解决高效运营。021年初于是在2,专门的小组团队成立,NGSOC事业部人员共同制定冬奥SOP(标准作业程序)调动集团作训部专家、安全服务部门的咨询专家、攻防专家和,全运维流程、应急响应流程主要包括安全运营流程、安。岗、运维岗、处置决策岗等不同岗位这一标准详细划分了监控岗、分析,细工作内容和工作标准并明确各个岗位的详。外此,程高效执行为了保证流,也进行了一系列的测试NGSOC产品团队。

  能极大提升了安全运营效率其次是NGSOC的多重功。监控大屏如实时,来说使用频率最高对于安全运营人员,安全运营中心正中间这块大屏投放在冬奥,刷新一次每30秒,动和发出警报高危告警会闪,看到告警情况所有人都可以,追踪、解决便于及时。OP5告警T,营人员可能规则有问题可以直观提醒安全运,处于TOP5当告警每天,看告警的规则解释可以在平台上查,警都可以看规则解释说明NGSOC平台所有告。查阅基于哪条规则产生的告警这个细节极大的方便了我们,工程师做规则优化方便找威胁建模,警冗余的问题直接解决了告。功能帮助特别大告警的高级筛选,告警筛选器通过预置的,理看不同告警内容每个监控值班经,告警处置效率极大提高了。

  安全运营提起冬奥,场项目经理仝磊回忆道冬奥安全运营中心现,最大的挑战在于“冬奥安全运营,目所有安全产品的交付部署及多次升级随着2020年以来我们实现了冬奥项,不断增加团队人数,效运营?”实际上如何才能实现高,规划阶段早在初期,规项目的复杂性和重要性考虑到冬奥项目相较于常,题并制定了完整的安全运营方案团队已经预测了可能出现的问,执行过程中但在方案,了不少问题还是发现。

  这一段回想起,标准化流程实现了常态化运营仝磊说:“我们真正的通过,们非常自豪这一点我。个过程下来”而且整,和参与感更强了每个人的责任感,程可以有效纠偏标准化动作和流,几率大大降低各个岗位犯错,完全基于个人技术安全事件处置不再,流程高效有序的运转而是靠人+工具+。

  1年8月202,紧急成立联合项目组奇安信冬奥项目组,SOC为核心目标是以NG,志与流量分析能力集成各个产品日,安全运营与应急响应问题以解决冬奥会现场常态化,合评估经综,OAR、天狗)产品联动的研发及所有安全产品日志接入和解析的工作实现8大产线(NGSOC、椒图、天眼、天擎、威胁情报、锡安、S。目工期进展按照冬奥项,作日去完成这项任务大家只有19个工,几乎不可能实现的挑战这对项目组来说是一项。

  从场馆、应用系统维度“可视化大屏的呈现,数据趋势情况做了直观的展示对面临威胁情况、事件情况、,营中心的使用需求满足了冬奥安全运。部冬奥项目经理表示”NGSOC事业,现展示效果为了更好呈,队投入了巨大的人力协同奇安信可视化团,做实地踏勘对竞赛场馆,所有竞赛场馆的3D建模在短短两个月内实现了,惊艳众人最终效果,、美观的综合呈现实现了实用、易读。

  心、数据中心、云上系统以及众多场馆NGSOC平台的监控覆盖到了网络中,的安全状态进行呈现所以如何对不同组织,现安全事件并且流畅处置让安全运营团队更快发,部冬奥项目组面前的问题也是摆在NGSOC事业,了几个关键词:实用、易读、美观所以在做可视化设计的时候标出。

  中心监控人员还只有四五人2020年冬奥安全运营,数扩增到二十多人到了2021年人,、场馆的驻场人员加上所有测试赛,达两百多人一线团队多。员增多随着人,保障工作流程运转原有流程难以有效,安全事件的处置流程仍有团队成员搞不清,难以凸显重点沟通过程中,、汇报流程也众说纷纭从场馆到总部的跟踪。

  GSOC平台设计要求根据冬奥会项目对N,用50+人并发访问需支持200人使,前所未有这种规模。系统整体压力特别大这种并发访问量对,负载急剧上升会导致系统。此对,要的优化方案包括:其一NGSOC研发团队主,群部署节点优化瓶颈节点进行集,颈节点后识别出瓶,方案做出调整对集群的部署,颈节点倾斜资源向瓶,S集群比如E,下性能损耗非常大在高并发的情况,持在合适的量级集群规模要保。二其,数据库优化,的运营场景调研冬奥会,的运营场景根据冬奥会,进行针对性优化对数据库配置,查所有耗时的数据操作通过性能监测工具排,设计与优化逐一进行。志高吞吐和50+人并发运营条件下最终NGSOC平台在日均35亿日,全平稳运行实现了安。

  年2月初持续到4月底第一轮测试从2021,运营SOP也投入使用这也是第一次将安全。投入使用虽然标准,有想象中顺利但过程并没,难快速熟悉并严格执行团队成员在短时间内很,时同,不少问题要完善流程本身也还有。的测试和演练但随着不断,人员进行培训和考试以及对所有冬奥一线,1年8月份到了202,才算是真正形成安全运营SOP。

  作接近尾声时当所有的工,团队交付的答卷看到各个研发,松了口气大家不禁,有冬奥精神的团队正是这样一支富,艰苦奋斗秉承着,赢得了最终胜利披荆斩棘的信念,项看似不可完成的任务完美地按照计划完成这。

  的优化达到145条在冬奥项目中规则,务触发的误报)让监控人员疲于分析将告警由之前存在大量误报(由于业,量不超过427条到现在日均告警,860974!1日志告警比为7,全事件遗漏的成就并且达成了无安。

  台的最大期望是能发现、能回溯“对于NGSOC作为运营平,台发现所有安全事件最好能通过一个平,有操作完成所,台真的做到了NGSOC平。控值班经理总结到”冬奥网络安全监,全产品体系联动和对告警的妥善处置这要归功于NGSOC的高并发、。

  紧迫时间,在争分夺秒各产品线都。调阶段到了联,研发人员有限因NGSOC,应对策略及时调整,1个人并发对接多条产线)形成了1对多的联调模式(,到对接联调从开发方案。满意的答卷为了交付,项目组所有人日夜奋战NGSOC事业部冬奥,产线工作进展积极推动各,题立即想办法解决只要发现阻塞性问,冬奥组委的高度认可得到了各产品线包括。

  心从最开始的规划设计展示了冬奥安全运营中,为核心安全监测平台到将NGSOC作,OC安全稳定运行的技术攻坚过程再到交付部署和如何保障NGS,中心是如何进行标准化运营的本篇将重点介绍冬奥安全运营。

  意破坏、恶意软件的各种威胁场景既有监测外部入侵、社工钓鱼、恶,规、异常操作的场景也有监测内部人员违;安全事件的持续监测既有针对突发漏洞、,统、服务运行状态的持续监测又有针对日常运营期间各系。奥值守期间在整个冬,控到1118次告警通过外部入侵场景监,到7起内部人员操作不当事件违规、异常操作场景共监测,测到3起设备断电事件常态化运营场景共监,断流事件6起数据。

  方位、无死角的持续安全监测为了实现对冬奥云上服务全,的安全架构设计结合云上服务,控审计四大部分共18类数据源、30余类日志NGSOC共采集了云上网络、主机、数据、监,个安全监测场景共设计60+。运营期间在日常,云上安全事件监测到数千起。

分享: