大规模安防监控系统故障检测方法的演进与发展
在现代化城市建设过程中,天眼工程、雪亮工程、天网工程、平安城市、智慧城市、智慧交通、智慧社区等大型安防监控系统扮演着至关重要的角色。这些系统广泛部署了多种品牌型号、数量众多的监控摄像机,以实现对关键区域的全面监控。然而,这些设备在复杂的室外环境中运行,面临着电力供应、环境因素、网络问题以及设备自身故障等多重挑战,这些都可能导致视频监控系统出现故障。
故障类型繁多,包括但不仅限于以下几种:
① 欠费、电源适配器损坏等原因导致电力供应中断、摄像机无法工作;
② 电压不稳或雷击等原因导致的监控设备损坏;
③ 线缆被挖断等原因导致的网络传输中断;
④ 高温导致的监控设备、网络设备死机。
尽管故障表象可能只是某一路图像异常或丢失,但是背后可能隐藏着复杂的故障原因。因此,如何高效地监测并定位这些故障,成为了亟待解决的问题。
下面我们以6万路规模的视频监控系统为例,探讨、比较一下大规模安防监控系统故障检测方法的演进与发展。
第一阶段:传统线下人工巡检
在早期安防监控系统运维中,传统线下人工巡检是主要的故障检测方法。这种方法依赖于人工步行或乘坐交通工具等方法到达监控点位进行人工实地检查。这种方法往往需要书写巡检记录、在固定点位进行打卡签到等工作流程。
以一个人全天工作8小时检查8个点位的16路监控图像进行计算,检查完全部6万路需要3750天。如果使用50人同时开展巡检工作需要75天;以每月22个工作日进行计算,50个人需要3.5个月才能够将整个系统巡查一遍。线下人工巡检的周期基本是以周、月为衡量单位的,效率十分低下。此外,人工巡检还容易受到天气、交通等因素的影响,可能导致巡检周期进一步延长。
人工巡检的方法在模拟监控时代比较盛行。当时的监控系统规模较小,使用的是同轴线缆近距离传输模拟图像,也没有进行大规模联网。随着视频监控系统数字化、联网化的升级,这种传统方式几近消失,逐渐退化成为了后备措施。
二、传统线上人工逐路巡查
随着视频监控系统的数字化、网络化发展,传统线上人工逐路巡查逐渐取代了线下人工巡检。这种方法通过网络将众多的监控图像集中到一个中心或一个机房,在监控中心点击打开监控图像进行逐路查看、检查。
考虑网络延时、图像调取、打开和关闭的时间等因素,以每人3分钟检查一路监控图像、每小时检查20路监控图像进行计算,全部检查完6万路监控图像需要3000小时。以15个人同时开展检查工作进行计算需要200小时;以全天工作8小时、周工作40小时进行计算,15个人将6万路监控图像检查一遍需要5周。线上人工巡查周期基本是以天、周为衡量单位的。
线上人工巡查的效率确实比线下人工巡检的效率提高了很多,在用工人数从50人下降到15人的基础上,时间周期也从3.5个月压缩到了5周,进步显著。使用加班、三班倒等方法,还可能将巡检周期进一步压缩。但无论怎么压缩,有些基本现象、规律并没有改变:
① 本质上还是使用人工进行逐路检查,只是联网的便利性减少了在途时间,因此而提高了效率。
② 检查需要一定的时间和周期。前一分钟检查正常,下一分钟发生损坏,只能等下一个检查周期到来才能被发现。
③ 人工目视检查的是图像质量这一表面结果,对于供电电压逐渐衰减、线缆虚接等潜在隐患无法进行检查、无法预警,只能等故障渐次发生才能够处理。
三、具有图像质量分析能力的监控系统管理平台
为了进一步提高故障检测效率,具有图像质量分析能力的监控系统管理平台应运而生。这种平台利用图像智能分析算法对接收到的监控图像进行检测和分析,通过一系列指标,如:峰值信噪比 Peak signal-to-noise ratio (PSNR)、均方误差 Mean squared error (MSE)、梯度幅度相似性偏差 Gradient Magnitude Similarity Deviation (GMSD)、盲/无参考图像空间质量评估器 Blind/Referenceless Image Spatial Quality Evaluation (BRISQUE)等来判断图像质量是否正常。
视频监控系统管理平台对单路监控图像质量的分析时间可以做到10秒以内。利用服务器处理器的多线程、并行处理能力和大内存等优势硬件配置,单路监控图像的分析时间有可能压缩到3秒。以此计算,视频监控系统管理平台对6万路监控图像质量的分析时间约为5.55小时。视频监控管理系统的图像分析周期是以小时、天为计算单位的。
这种以图像质量智能循环分析为主要手段的视频监控故障发现方法,相比于人工巡查的方式,效率再次提升。尤其适合于联网型、大规模的视频监控系统,基本为当下大系统主流的故障发现方法。但这种方法依然存在若干不尽人意的地方,主要有:
① 管理平台凭借软件程序的高效率战胜了人工方式,效率的进一步提升有赖于硬件性能的堆叠、提升;软件算法的优化、提高。但无论怎么提高,“一双眼睛盯着6万路监控图像”的逻辑框架没有根本改变。
② “逐路分析”的处理框架没有改变的情况下,注定检查分析需要一定的时间周期和间隔空挡。“前一分钟检查正常,下一分钟发生损坏,只能等下一个检查周期到来才能被发现”的现象无法避免,只是间隔、空档的时间缩减到了“天”以内。这种情况在安全防范等级不高的监控点位还是可以接受的,但在安全防范等级较高的场合就难以接受了,无法达到“全域覆盖、全网共享、全时可用、全程可控”的要求。
③ 管理平台分析的还是图像质量这一表面结果,对于供电电压逐渐衰减、线缆虚接等潜在隐患无法进行检查、无法预警,只能等故障渐次发生才能够跟随处理。“跟在故障后面跑”的运维逻辑没有改变。
四、前端配有智能运维设备的视频监控运维管理平台
为了克服上述方法的局限性,前端配有智能监控设备箱、监控运维智能终端设备的视频监控运维管理平台开始被广泛应用。这些设备一方面为所在监控点位的监控摄像机提供电力供应、网络传输等服务,同时采集周边环境、动力、网络和设备层面的信息数据上传至视频监控运维管理平台,从而使管理平台具备掌握前端设备工作状况、分析故障原因、做出修复尝试等管理能力、运维能力。前端监控点位都具有智能监控设备箱、监控运维智能终端设备,这相当于在视频监控系统中有几万双眼睛各自盯着各自点位的工作状况,发现异常当即上报,因此能够将故障发现的时间进一步缩短到秒、分钟的级别。
智能监控设备箱、监控运维智能终端设备因具备周边环境、动力、网络和设备层面信息的采集、分析能力,因此具备对电压衰减、高温等异常进行感知的能力。利用大数据的积累和利用,运维管理平台甚至可以作出预估、预判、预警。这相较于前端没有智能监控箱、监控运维智能终端设备的视频监控运维管理平台又前进了一步。
这种方案不仅大幅缩短了故障发现的时间,而且可以精准定位环境、动力、网络和设备等层面的故障类型、故障部位和故障原因,发现故障不再仅限于图像质量分析这一种方法。
智能监控设备箱、监控运维智能终端设备利用身处网络的优势,可以Ping上下行链路,以此判断下端监控摄像机与上端系统管理平台之间的网络链路是否存在异常。一般智能监控设备箱、监控运维智能终端设备不具备网络监控图像解码、分析、再编码的硬解或软解处理能力,所以智能监控箱虽然能够Ping通网络链路,这只能说明网络通讯链路是畅通的。对于监控摄像机输出的图像带有雪花、扭动变形、黑屏等异常现象,一般智能监控设备箱、监控运维智能终端设备是不具备分析、发现能力的,还必须由视频监控运维管理平台按照以前图像分析的方法进行发现。对于图像质量这一关键指标的发现、处置效率显然难以满足“全域覆盖、全网共享、全时可用、全程可控”的要求。
五、带有视频质量边缘计算分析能力的视频监控智能运维平台
为了进一步提升故障检测效率和处理能力,将智能监控设备箱、监控运维智能终端设备进一步升级,利用华为海思Hi3512、Hi3515、Hi3519等高性能视频编解码处理芯片、高性能媒体处理器,在维持智能监控设备箱、监控运维智能终端设备原有丰富功能的基础上,对监控点位本地监控图像质量进行编解码、抓取分析,综合得出各类监测数据的最终结果上报于系统管理平台。
高性能视频编解码处理芯片利用内置智能算法程序分析视频图像质量的时间可以进一步压缩毫秒的级别。这种方法不仅速度快、监测数据全面,而且从根本上将“一双眼睛盯着6万路监控图像”的故障发现逻辑改变为“6万双眼睛各自盯紧自己,有事就上报”。通过系统“边缘计算”的设计,使“循环巡查,周期发现故障”方法的低效率,改变为“各自紧盯、并行发现故障”方法的高效率。让“秒级发现故障、秒级知道原因、秒级上报、秒级处理”成为可能。真正让“全域覆盖、全网共享、全时可用、全程可控”的要求落到实处。
六、综述
随着科技的飞速发展,大规模安防监控系统的故障发现方法经历了从人工到智能、从低效到高效的深刻变革。从最初的传统线下人工巡检,到传统线上人工逐路巡查,再到具有图像质量分析能力的监控系统管理平台,每一步都见证了技术的进步与安防需求的提升。
然而,这些方法的进步虽然显著,但始终未能彻底摆脱“逐路检查、周期发现”的框架限制。直到前端配有智能运维设备的视频监控运维管理平台出现,才真正实现了故障发现时间的极大缩短和故障定位的精准化。而带有视频质量边缘计算分析能力的视频监控智能运维平台,更是将这一进程推向了新的高度。
在未来,随着技术的不断进步和创新,我们有理由相信,大规模安防监控系统的故障发现方法还将继续进化,发现效率将越来越及时有效,运维工作将更加智能化,为社会的安全和稳定提供更加坚实的保障。