基于深度学习的密集人群安全监测系统

来源:期刊VIP网所属分类:经济学发布时间:2019-12-27浏览:

  摘 要:近年来高密度人群聚集活动经常因为缺乏及时有效的管理而导致安全事故频频发生,人群活动的应急管理、风险评估、隐患识别越来越受到重视。鉴于系留无人机的自由灵活性,其可长时间、全方位监测密集人群,将监测数据传入深度学习的卷积模型中,计算人群密度等指标,并验证实验结果的可行性,将预警信息、风险点数据推送至相关管理单位,形成监测信息、预警信息、对应措施信息化安全管理系统,为安全管理部门提供帮助。

  关键词:城市安全;高密度人群;系留无人机;深度学习;场景分析;卷积模型

新疆财经大学学报

  《新疆财经大学学报》(季刊)2001年创刊。本刊为综合性学术期刊,坚持社会主义办刊方向,坚持质量及时的原则,立足新疆,面向全国,以“求实、创新、科学、民主”为办刊方针,注重文章选题的现实性、学术性、前瞻性和创造性,注重多学科多方位的综合研究和超前研究。荣获2004年获“编辑质量奖”、“主编(社长)奖;第四届”新疆社科期刊奖;;第五届“新疆社科奖”。

  0 引 言

  当今国民经济快速发展,人们的物质生活和精神生活大幅提升,节假日旅游、明星演唱会、城市各大广场商场、地铁站、火车站等大型人群活动越来越多,急剧发展的同时也带来了城市的安全问题。群众的聚集性活动具有秩序混乱、容易恐慌、拥挤度高、管理困难等特点,比较容易发生意外,比如踩踏性事件、重大伤亡事件、财产丢失事件等[1]。近年来,我国频频发生大型人群活动恶性事件,2004年2月5日在北京市密云县密虹公园举办的密云县第二届迎春灯展中,因为游人在公园桥上跌倒,引起身后游人拥挤,造成踩死、挤伤游人的特大恶性事故,事故造成37人死亡、37人受伤;2007年11月,重庆一家乐福超市因食用油打折促销引发踩踏事故,造成3人死亡,31人受伤;2014年12月31日上海外滩陈毅广场发生踩踏性事件,造成36人死亡,49人受伤[2]。若能实时监测每个场景中的人群密度、拥挤度、人群流向、人群异常行为等指标,然后根据实时监测指标采取相对应的安保措施和实行不同等级的紧急预案,就能及时避免或者减少此类事件的发生。

  传统的人群计数研究方法分为两种:第一种是基于检测的方法,使用一个滑动窗口检测器来检测场景中的人群,并统计对应人数;第二种是基于回归的方法,该方法通过提取一些低级特征学习一个人群计数的回归模型,但很难处理人群之间严重遮挡的问题[3]。随着深度学习计算机视觉技术的发展,卷积模型处理视频数据的效果显著,同样也被应用于人群计数的研究中。因为卷积神经网络具有强大的特征学习能力,可以解决遮挡、视角等问题,所以深度学习在人群计数数据集和卷积神经网络模型等方面表现良好。

  1 系留无人机监测系统

  系留无人机近年来已被广泛应用在应急抢险工作中,国内外很多公司对系留无人机的相关设备有了成熟的研究并不断完善,在起飞、悬停高度、载荷等方面也进行了不断探索[4]。系留无人机通过系留电缆连接系留控制箱,系留控制箱与地面电源连接,具有续航时间长、稳定性高、精度高、成本低、拍摄范围广、实时监测等特点。系留无人机可以搭载高清广角相机、红外相机、雷达传感器等监测工具,采集的高质量视频图像通过HDMI接口传入电脑,视频数据经计算处理得出监控场景中的人群数量等指标,传输到指挥中心进行判断,对人群疏导、安全事故、风险评估起预测作用,可节约人力,提高效率。系留无人机监测平台方案示意如图1所示。

  2 基于深度学习的监测数据处理方法

  深度学习的基本工作原理如图2所示。图像输入设计的卷积神经网络提取特征通过权重值输出预测值,一一对应的预测值与真实值利用损失函数判断之间的差异,作为反馈信号权重进行微调,在调节过程中使用优化器来完成,最终经过数次迭代使模型达到最小的损失值,训练结束,保存权重。

  数据来源于公开的shanghai-tech数据集(1 100张图片)和自己拍摄的大型活动场景图片(900张),所有图片数据均需经过标准化处理。将高密度人群图像和稀疏人群图像整合后,训练一个适用于普遍场景下的人群计数模型。数据标记过程是把每一张图像中的头部标注成稀疏矩阵,再通过高斯滤波转换成2D密度图,密度图中所有单元格的总和为图像中的实际人数,经数据预处理后生成一一对应的数据标签图像[5-6]。其中1 400张为训练图像,600张为测试和验证图像。

  2.1 网络结构

  本文通过两类卷积神经网络模型计算人群指标并验证深度学习的准确率。一类是基于卷积+空洞卷积的CNN模型,其前端利用预训练的VGG16网络前的十层卷积层和三层池化层,每次卷积采用补0操作,保持输出的图像大小不变,最大池化步幅为2,图像输入网络中,经过4次卷积和3次池化后,输出图像尺寸变为之前的1/8,图像变小后生成密度图比较困难,所以后端加上六层空洞卷积(Dilated Convolution),设置膨胀率为2[7-8],其网络结构如图3所示。

  另一类是基于多尺度的编码-解码(Encoder-Decoder)网络结构,网络的编码部分使用多尺度卷积结构,通过不同大小的卷积核可以很好地学习不同尺度的人群特征,使模型的泛化能力更强。本次研究设计了4种不同尺度的卷积核,串联输出,采用最大池化,每次池化图像变为之前的

  1/2[9-10]。网络解码部分使用卷积和三层转置卷积得到最终的人群密度图,网络结构如圖4所示。

  2.2 损失函数

  (1)基于CSRNet的损失函数采用欧式距离来计算标签图像的真值和预测密度图之间的差异[11],计算过程如下:

  式中:N为训练样本的数量;Z(Xi; θ)为输入第i个样本的预测密度;ZiGT为第i个样本的真实密度;L(θ)代表密度损失。

  (2)基于SANet的损失函数采用SSIM和欧氏距离的结合来计算密度图与真实值之间的相似性[9],计算过程如下:

  式中:N代表样本的数量;C1和C2代表常数;μF为样本F的均值;μY为样本Y的均值;σF为样本F的方差;σY为样本Y的方差;σFY为样本Y,F的协方差;SSIM衡量真实值与密度图之间的一致性;LC代表图片的一致性损失;Lθ代表欧式距离的密度损失;LOSS代表总的密度损失。

期刊VIP网,您身边的高端学术顾问

文章名称: 基于深度学习的密集人群安全监测系统

文章地址: http://www.qikanvip.com/jingjixue/49932.html