来源:期刊VIP网所属分类:综合论文发布时间:2021-10-12浏览:次
摘要:为解决内河航道中具有不同运动模式的船舶轨迹识别问题,提出一种基于宽度学习系统(broad learning system, BLS)的船舶轨迹分类算法。对通航区域进行划分并制定轨迹筛选规则以构建标签矩阵。利用分段三次Hermite插值法分别从轨迹点记录时间上等时距和轨迹点空间分布上等间距两个角度,从原轨迹数据中进行特征点坐标的提取以构建轨迹特征矩阵。将标签矩阵和轨迹特征矩阵代入BLS以实现分类算法的训练与测试。以京杭运河淮安段交叉航道AIS数据为实例,进行轨迹分类实验。结果表明,基于BLS的船舶轨迹分类算法在分类精度和训练耗时上均优于基于反向传播神经网络和支持向量机的轨迹分类算法。
关键词: 内河运输; 船舶轨迹; 轨迹分类; 宽度学习系统
作者:王颢程、左毅、李铁山
引 言
加快内河水运发展已经成为我国国家战略,建成畅通、高效、平安、绿色的现代化内河水运体系势在必行。而随着内河水运的不断发展,船舶交通量越来越大,通航饱和度逐渐升高,使得内河通航水域海事安全监管面临更大挑战[1]。船舶自动识别系统(automatic identification system,AIS)的普及使得航运安全监管的研究拥有了原始数据的支持[2],使得对于船舶异常行为识别、通航量预测、船舶轨迹追踪等方面的航迹数据分析成为可能[3],而对航迹数据进行分析的重要环节之一即是对船舶轨迹信息的分类。
船舶轨迹分类方法主要包括机器学习算法中无监督学习的聚类算法和有监督学习的分类算法。在无监督学习的聚类算法方面:MA等[4]通过利用轨迹单向距离构建轨迹间相似度矩阵[5],提出一种基于谱聚类的船舶运动模式识别算法。魏照坤[6]利用最小描述长度准则将原始轨迹划分为若干个子轨迹,通过简化的Hausdorff距离计算法度量了不同子轨迹段间的相似性,最后利用具有噪声的基于密度的聚类方法(density-based spatial clustering of applications with noise, DBSCAN)[7]完成了对具有不同运动模式的船舶轨迹的区分。SHENG等[8]在上述方法的基础上,提出一种利用综合距离函数计算轨迹结构相似性的DBSCAN,同样实现了对具有不同运动特征的船舶轨迹的分类。然而,上述基于密度的聚类方法需要设置的阈值较多,且尚不能分析单条完整轨迹的运动特点。在有监督学习的分类算法方面:刘磊等[9]提出一种轨迹间综合距离计算方法,并结合K近邻(K-nearest neighbor, KNN)算法完成了船舶轨迹的分类。综合距离的计算需综合考虑轨迹点坐标、航向、航速等多种因素,还需要人为设定各因素的权值,且对原始数据的完整性及准确度要求较高。CHEN等[10]将轨迹的原始数据用最小二乘三次样条曲线近似(least-squares cubic spline curves approximation, LCSCA)表示后构建稀疏表示分类法(sparse representation classification, SRC)的字典矩阵,根据残差最小化原则完成了轨迹类别的判断。LCSCA算法解决了分类算法的轨迹点特征矩阵维度统一问题,但各轨迹近似表示后的取点数量会受到算法限制,且在构建SRC的字典矩阵时每类轨迹的数量均需相同。
上述方法在实际操作中往往需要对原始数据进行多方面的信息统计,需要人为设置的阈值较多,对原始数据的完整性要求較高。针对以上问题,本文提出一种基于宽度学习系统(broad learning system,BLS)的内河航道船舶轨迹分类算法。首先,对研究区域进行子区域划分,从AIS数据库中筛选出可用的轨迹数据并作标记,以构造标签矩阵。然后,对轨迹数据进行特征提取。考虑到研究区域的地形、通航规则以及AIS数据上传频率对原始轨迹数据的影响,利用分段三次Hermite插值法分别从轨迹点记录时间上等时距和轨迹点空间分布上等间距这两个角度对原始轨迹数据进行特征点坐标提取并构建轨迹特征矩阵,供分类模型选择。为完善轨迹特征矩阵的构建,利用特征点坐标值之差定义并计算各特征点以圆周法表示的航迹向值。最后,切分轨迹特征矩阵及标签矩阵以构成多组训练集和测试集样本并代入BLS网络进行交叉验证,完成分类模型的训练与测试,从而实现对AIS轨迹数据的自动分类。以京杭运河淮安段交叉航道的AIS轨迹数据为例对所提分类算法进行验证。
1 基于BLS的船舶轨迹分类算法
1.1 轨迹特征矩阵的构建
AIS数据库中各轨迹的数据长度可能不同,因此不能直接利用原始数据构造轨迹特征矩阵进行分类。考虑到轨迹曲线无法用一条曲线直接表示,利用一种分段多项式插值法从各轨迹上提取相同数量的特征点以统一各轨迹特征向量的维度。常用的分段多项式插值法包括分段线性插值、三次样条插值和分段三次Hermite插值[11]。分段线性插值简单易行,但曲线不光滑且精度不高,故不适用于针对船舶轨迹数据的插值。三次样条插值获得的曲线光滑度较高,但求解代价较大,精确度受端点导数条件影响,且有时会出现插值越界现象。而分段三次Hermite插值通过构造适当的插值节点导数计算方法可以有效地解决上述问题[12],因此本文采用该插值法。为增加分类模型对于原始轨迹数据的鲁棒性,分别从轨迹点记录时间上等时距和轨迹点空间分布上等间距这两个角度对轨迹数据进行特征点提取,以构建轨迹特征矩阵。
1.1.1 等时距提取轨迹特征点
等时距提取轨迹特征点时,分段三次Hermite插值法以轨迹点的记录时间(协调世界时,UTC)为自变量,分别求解轨迹点经度和纬度在各时间段内的插值函数[13]。最后,将该轨迹记录时间段均分后取得的时间数列分别代入经度和纬度在对应时间段内的插值函数,即可求解该轨迹等时距提取特征点后的各点坐标值。下面以经度的插值为例,介绍分段三次Hermite插值法的具体实现过程。
设某条轨迹的轨迹点坐标向量为
R
=((x1,y1),(x2,y2),…,(xn,yn)),轨迹点记录时间向量为
T=(t1,t2,…,tn)。其中,xi和yi分别为第i个轨迹点的经度和纬度,ti为第i个轨迹点的记录时间。记该轨迹上某两个相邻轨迹点的记录时间段为[tj,tj+1],则tj、tj+1、xj、xj+1均为已知量,j=1,2,…,n-1。此外,记tj和tj+1时刻轨迹点的经度对记录时间的一阶导数分别为vxj和vxj+1。根据分段三次Hermite插值,该时间段上的三次插值函数可设为
Xj(t)=ajt3+bjt2+cjt+dj
式中:aj、bj、cj、dj均为未知量。由于该三次多项式一阶可导,则有vXj(t)=dXj(t)dt=3ajt2+2bjt+cj
通过求解线性方程组:
xj=ajt3j+bjt2j+cjtj+dj
xj+1=ajt3j+1+bjt2j+1+cjtj+1+djvxj=3ajt2j+2bjtj+cjvxj+1=3ajt2j+1+2bjtj+1+cj
即可得到待定系数aj、bj、cj、dj的值。然而,由于从原始轨迹数据中无法获得轨迹点经度对时间的导数vxj、vxj+1,这里使用一种利用经度数据在前后相邻的轨迹点记录时间段的一阶差商进行加权的方式对导数进行近似计算[12]。
如图1所示,对于三次插值函数的所有中间节点(xk,tk),k=2,3,…,n-1,记其在前后相邻两个轨迹点记录时间段的一阶差商分别为δk、δk+1,则有
δk=xk-xk-1tk-tk-1
δk+1=xk+1-xktk+1-tk
记该节点前后相邻两个时间段的权值分别为ωk、ωk+1,则有
ωk=131+tk-tk-1tk+1-tk-1
ωk+1=131+tk+1-tktk+1-tk-1
该节点处的一阶导数vxk可近似计算为
vxk=
δkδk+1ωkδk+ωk+1δk+1,δkδk+1>0
0,δkδk+1≤0
由于端点处只能获得一侧时间段的一阶差商,上述加权求解的方式不再适用,故特别令端点处的一阶导数与其相邻时间段的一阶差商相等,即
vx1=δ2
vxn=δn
经上述计算,该轨迹的经度值在各记录时间段的插值函数可表示为
X(t)=X1(t),t∈[t1,t2]
X2(t),t∈[t2,t3]
Xn-1(t),t∈[tn-1,tn]
同理可得纬度值在各记录时间段的插值函数:
Y(t)=Y1(t),t∈[t1,t2]
Y2(t),t∈[t2,t3]
Yn-1(t),t∈[tn-1,tn]
设该轨迹按等时距划分的分段数为p,则提取的各特征点的时间值可表示为
t′m=t1+(m-1)(tn-t1)/p
式中:m=1,2,…,p+1。该轨迹按等时距提取的特征点坐标向量可表示为:Rt=((X(t′1),Y(t′1)),(X(t′2), Y(t′2)),…,(X(t′p+1),Y(t′p+1)))。图2为某轨迹数据分段数p分别取10和20时的等时距提取特征点效果图。从图2可知,等时距提取该轨迹特征点时,分段三次Hermite插值法能够较好地描绘出该轨迹的特征。
推荐阅读:写船舶管理论文能看哪些文献
期刊VIP网,您身边的高端学术顾问
文章名称: 基于宽度学习系统的内河航道船舶轨迹分类算法
文章地址: http://www.qikanvip.com/lunwen/zonghelunwen/2021/1012/59899.html