基于SVR的船舶航行安全评估模型
时间:2021-02-08 08:02:39 来源:达达文档网 本文已影响 人
常婧 柳晓鸣 李梦蕊
摘要:为对船舶航行安全状况进行有效预测,利用支持向量回归(support vector regression, SVR)算法构建船舶航行安全评估模型。在分析影响船舶航行安全的因素的基础上,对船舶历史数据进行预处理后将其作为模型训练和测试的样本数据。实验结果表明:该模型评估准确度可达99.6%以上;在同一样本数据条件下,模型的评估准确度和稳定性均优于基于极限学习机(extreme learning machine,ELM)构建的模型。模型的评估结果为水上交通管理部门的监管提供参考。
关键词:
航行安全; 安全评估; 支持向量回归(SVR); 极限学习机(ELM)
中图分类号:
U676.1 文献标志码:
A
Ship navigation safety assessment model based on SVR
CHANG Jing, LIU Xiaoming, LI Mengrui
(Information Science and Technology College, Dalian Maritime University, Dalian 116026, Liaoning, China)
Abstract:
In order to effectively predict the ship navigation safety status, the ship navigation safety assessment model is constructed by the support vector regression (SVR) algorithm. Based on the analysis of the factors affecting ship navigation safety, the ship historical data are preprocessed and used as sample data for model training and testing. The experimental results show that:
the accuracy of the model evaluation can reach more than 99.6%; under the same sample data conditions, the accuracy and stability of the model are better than those constructed based on the extreme learning machine (ELM). The assessment results of the model provide reference for the supervision of the water traffic management department.
Key words:
navigation safety; safety assessment; support vector regression (SVR); extreme learning machine (ELM)
0 引 言
水上交通运输安全已成为制约我国航运业快速发展的重要因素。船舶在航行过程中受到人员、环境、船舶以及管理等多方面因素的影响,对船舶的航行安全状况进行评估需要全面考虑这些因素。结合与这些因素相关联的历史事故数据,构建一个航行安全评估模型,实现对航行安全状况的有效评估是当前急需解决的问题。
目前,评估船舶航行安全的方法主要有层次分析法(analytic hierarchy process,AHP)、主成分分析(principal component analysis,PCA)法、灰色理论、综合安全评估(formal safety assessment,FSA)、模糊综合评价(fuzzy comprehensive evaluation,FCE)以及人工神经网络(artificial neural network,ANN)等方法。张笛等[1]从静态信息、动态信息、通航环境和自然环境等方面对船舶数据信息进行了分析,利用AHP对内河船舶航行安全状态进行了评价。李款等[2]基于横倾角、舵角、艇速3个指标数据信息,分别利用PCA和BP神经网络方法对水面艇的航行状态进行评估。贾明明等[3]基于自然环境、航道环境和交通环境3类指标及其权重,利用灰色模糊综合评价方法量化评估通航安全等级。这些方法评价结果具有一定的参考价值,但在实际应用中存在前期准备过程较为复杂的缺陷。
支持向量回归(support vector regression,SVR)以统计学理论为基础,依照有限样本信息,在确保学习和泛化能力良好的条件下,将输入信息非线性转换到高维空间的决策函数实现线性回归,以达到最理想的学习效果。[4]SVR具有收敛速度快的优点,已被应用于市场需求预测、电力负荷预测、交通流预测等方面,但还未应用于航行安全状况预测。本文提出将SVR应用于船舶航行安全评估中,以期达到更好的效果。
本文基于SVR構建船舶航行安全评估模型,对船舶的航行安全状况进行量化评估。在利用船舶历史数据进行训练建模之前,对样本数据进行预处理。首先分析数据信息类型和数据来源,然后按照关联的影响指标对数据进行采集存储,再对存储的数据按照量化赋值原则进行量化赋值。随后,利用粒子群优化(particle swarm optimization,PSO)算法[5]进行SVR模型参数寻优,将优化后的参数值输入模型,并用历史数据进行仿真训练得出安全预测值。比较预测值与实际安全值,得到模型预测准确度达到99.6%以上。为验证模型的优越性,在相同样本数据条件下用神经网络算法中应用较多的极限学习机(extreme learning machine,ELM)[6]进行仿真训练,结果显示SVR模型的预测精确度和鲁棒性明显优于基于ELM理论构建的模型。该模型不仅能提升数据信息利用率,而且能使最终的预测结果具有较高的准确度和稳定性,实现对航行安全状况的有效预测,提高船舶交通服务系统(vessel traffic services, VTS)安全监管功能的可靠性。
1 船舶航行安全评估模型
首先构建较为全面的影响船舶航行安全的指标体系,在此基础上利用SVR同时结合船舶历史数据构建船舶航行安全评估模型。在利用船舶历史数据进行训练学习和测试之前,需要利用大数据处理技术对数据进行处理。先根据上述指标体系对船舶历史数据中的相关信息进行提取,然后对应船名存储与各指标相关的数据信息,最终按照一定的赋值量化规则对数据信息进行预处理。将预处理后的数据作为样本输入数据,样本输入数据对应的实际安全值作为样本输出数据。模型通过对样本数据的训练学习得到各指标与船舶航行安全值之间的关系后,输入与各指标关联的船舶数据就能得到对应的安全评估值和评估精度。
1.1 影响船舶航行安全的指标体系
航行安全是由多种因素决定的。通过分析文献[7-10]以及咨询专家确定影响船舶航行安全的主要因素,最终选取可量化的影响因素构建一个影响船舶航行安全的指标体系,见图1。
1.2 基于大数据处理技术的数据处理
图1中影响船舶航行安全的指标对应的数据信息类型、信息来源和传输方式均不同,因此需要利用大数据处理技术对数据信息进行采集存储和预处理。
数据的采集存储。分析研究各指标对应的数据信息类型和信息来源,将船舶数据信息与图1中的各指标相关联,利用大数据处理技术对数据信息进行采集存储。
数据的预处理。数据库中存储的数据是按与数据关联的影响指标分类存储的,因此对数据进行预处理首先要采用分级赋值的方法量化各指标的影响程度。根据文献[11-13]中相关影响指标对应危险程度具体的划分原则进行归纳整理,得到对各指标数据的量化赋值处理规则。进一步咨询相关航海人员或专家,确定该量化规则的有效性并完善量化处理规则,见表1。按照表1所示的量化规则,将各指标按照风险程度由高到低划分成高、一般和低3个等级(相应的赋值分别为3、2和1),并对关联数据信息进行量化赋值。
1.3 船舶航行安全评估模型
根据构建好的影响船舶航行安全的指标体系对历史事故数据信息进行处理,从而将预处理后的数据信息作为安全评估模型的样本输入数据,样本输入数据对应的船舶航行安全评估值作为样本输出数据。通过对数据集的训练学习得到各指标与船舶航行安全值之间的关系后,输入与各指标关联的船舶数据,模型能输出对应的安全评估值和评估精度。
1.3.1 SVR
SVR建立在统计学VC维理论和结构风险最小原理的基础上,可以解决线性回归和非线性回归问题[14],分为线性SVR和非线性SVR。
样本集{(x1,y1),(x2,y2),…,(xn,yn)},其中:xi=(xi1,xi2,…,xim)表示第i艘船的数据,i=1,2,…,n;yi表示第i艘船的预测评估值,i=1,2,…,n。xij代表第i艘船数据中与第j个指标相关联数据的量化值,j为影响指标的序号,j=1,2,…,m。
SVR主要用于求得样本输入数据x对应的预测值y,假设x与y之间的函数关系表达式为y=f(x)=ωTφ(x)+b
(1)式中:φ(x)=(φ1(x),φ2(x),…,φm(x))T为m维列向量,为非线性函数;ω=(ω1,ω2,…,ωm)T为m维权向量,表示进行线性回归时的权重向量;b为偏置值。输入数据x映射到m维的特征空间内变成φ(x),使得φ(x)与y的关系为线性关系,输入数据空间内的非线性拟合问题变为高维特征空间内的线性拟合问题。
SVR采取ε-不敏感函数作为损失函数。首先,针对具体问题定义一个常量ε>0,对于某一样本(xi,yi),如果yi-ωTφ(xi)-b≤ε则完全没有损失,否则对应的损失为yi-ωTφ(xi)-b>ε。即ε-不敏感函数可整理为
e(xi)=0, yi-ωTφ(xi)-b≤ε
yi-ωTφ(xi)+b-ε,
yi-ωTφ(xi)-b>ε
(2)
为使损失函数最小,基于结构风险最小化准则,确定ω和b的约束条件并对目标函数进行优化,构建最优化准则:
min JJ=12ωTω+12cni=1e2i
s.t. yi=ωTφ(xi)+b+ei, i=1,2,…,n
(3)
式中:J為目标函数;ei∈R为松弛变量;c为正则化函数。利用拉格朗日函数将式(3)转化为对偶形式:
L(ω,b,e,α)=
J-ni=1αi{ωTφ(xi)+b+ei-yi}
(4)
式中:αi为拉格朗日因子。
用式(3)求解最优解满足KTT(Karush-Kuhn-Tucker)条件的最优化问题。令式(3)对ω、b、αi和ei的偏导数均等于0,可解得ω=niαiφ(xi)
ni=1αi=0
yi=ωTφ(xi)+b+ei
ei=-αi/c整理可得y=f(x)=ni=1αiK(x,xi)+b
(5)式中:K(x,xi)=φ(x)Tφ(xi),称之为核函数。根据非线性函数φ(·)的表达形式为线性、多项式、高斯型,将核函数分为线性核函数、多项式核函数、径向基核函数。
线性核函数:Kl(x,xi)=〈x,xi〉
(6)
多项式核函数:Kp(x,xi) = (γ〈x,xi〉+c)n
(7)
径向基核函数:Kr(x,xi)=expx,xi22σ2
(8)
1.3.2 基于SVR的安全评估模型
基于SVR构建船舶航行安全评估模型,见图2。结合船舶历史数据可实现对船舶航行安全的评估。船舶历史数据需要利用大数据处理技术进行预处理。首先根据影响船舶航行安全的指标体系确定数据中的有效信息,然后对数据进行采集存储。将第i艘船的历史数据中与第j个指标关联数据的量化值xij(i=1,2,…,n;j=1,2,…,m)作为模型的输入数据,每艘船的数据对应的船舶实际航行安全值Yi(i=1,2,…,n)作为模型的输出数据。把处理后的船舶历史数据集划分为训练数据集和测试数据集,通过对训练数据集的训练学习得到各指标与船舶航行安全值之间的关系。输入与各指标关联的船舶数据,模型能输出对应的安全评估值。通过比较模型的输出数据和测试数据对应的安全评估值,得到模型的评估精度从而确定模型的有效性。
2 仿真实验分析
2.1 模型的有效性验证
对近十年大连港水域的船舶数据进行清洗,得到3 083条参数特征明显的船舶数据。将其作为进行仿真的样本数据集,样本数据结构见表2。将该数据集按照表1所示的量化规则进行预处理后,选取该数据集80%的船舶数据作为训练数据集,其余20%的船舶数据作为测试数据集。首先将训练数据集中与各指标相关联的船舶数据作为输入数据,对应的船舶航行安全值作为输出数据,通过训练学习得到船舶航行安全评估值与影响指标的函数关系。然后输入测试数据集中与各指标关联的船舶数据,模型就会输出对应船舶的安全评估值。最终将模型输出的安全评估值与实际评估值进行比较,得到预测误差和模型的评估精度,从而验证模型的有效性和准确性。
首先利用PSO算法对SVR模型进行参数优化[15],通过对训练数据集的学习得到最优参数值:g=0.1,w=0.05。然后根据式(5)~(8)得出安全评估模型在不同核函数条件下的评估值与实际安全值的误差大小,结果见图3。
a)基于线性核函数的误差值 b)基于多项式核函数的误差值 c)基于径向基核函数的误差值
由图3可知,评估模型的预测误差取值普遍在0.004~0.016范围内,其中基于径向基核函数的SVR构建的评估模型的评估误差值较小且分布相对集中。总体来说,模型的预测结果准确度较高,具有较强的稳定性。
平均绝对误差(mean absolute error,MAE)是所有单个观测值与算术平均值之差的绝对值的平均值。平均绝对误差可以避免误差相互抵消的问题,因而可以准确反映实际评估误差的大小。均方误差(mean square error, MSE)是反映估计量与被估计量之间差异程度的一种度量,可以用于表示评估安全值与实际安全值之间的差异程度。拟合优度(goodness of fit)是回归直线对观测值的拟合程度。度量拟合优度的统计量是可决系数(亦称确定系数)R2,其最大值为1。R2的值越接近1,说明回归直线对观测值的拟合程度越好。因此利用MAE、MSE和R2作为评估指标来度量模型的误差精度。各评估指标具体含义如下:
MAE是将每艘船的数据输入模型后得到的预测值与实际值的相差程度,公式如下:EMA=1nni=1yi-Yi
(9)式中:yi(i=1,2,…,n)表示由第i艘船的数据得到的预测安全值;Yi(i=1,2,…,n)表示第i艘船的数据的实际安全值。
MSE是将每艘船的数据输入模型后得到的风险预测值与实际值差的平方的期望值,公式如下:EMS=1nni=1(yi-Yi)2
(10)EMS的值越小,说明安全评估模型的预测精度越高。
R2表示模型对于实际值的拟合程度,公式如下:R2=1-ni=1(yi-Yi)2ni=1(yi-y -)2
(11)式中:y -=1nni=1yi表示对n艘船进行预测得到的预测值yi的平均值。
由式(9)~(11)得到的误差值见表3。由表3可知,该模型的误差精度达到0.001,并且模型的预测值与实际值的拟合程度达到99.6%以上。结合前面的实验结果可知,基于径向基核函数的模型不仅评估误差较小、分布相对集中,而且稳定性更好、均方误差较小。因此最终选取基于径向基核函数的SVR构建航行安全评估模型。
2.2 模型的优越性验证
基于模型的有效性验证所使用的3 083条样本数据,利用基于ELM理论[16]构建的评估模型对样本数据中的测试数据集进行船舶航行安全状况的预测。进一步与基于SVR的船舶航行安全评估模型从预测误差和精确度方面进行比较,从而验证模型的优越性。
ELM是一种改进后的单隐层前馈神经网络,由输入层、一层隐含层和输出层组成。样本数据集具体表达形式为{(xi,yi),i=1,2,…,n}
(12)式中:xi=(xi1,xi2,…,xim)為输入数据,i=1,2,…,n;yi为期望输出值,i=1,2,…,n。隐含层输出为
hj(xi)=mj=1g(wj·xi+bj), i=1,2,…,n
(13)
式中:wj=(w1j,w2j,…,wmj)T表示第j个隐含层节点的输入权值;bj表示第j个隐含层节点的偏置值;gj(wj·xi+bj)表示样本xi的第j个隐含层节点的输出值,其中gj(·)为激活函数,此处选取S型激活函数。则模型的输出结果为fj(xi)=mj=1βjhj(xi), i=1,2,…,n
(14)式中:βj=(βj1,βj2,…,βjn)表示第j个隐含层节点的输出权值。
由式(13)和(14)可得出基于ELM理论的评估模型对船舶航行安全状况进行预测的误差值,见图4。
由图4可知,基于ELM理论的船舶航行安全评估模型的评估误差取值范围相对集中在0.04以下。结合图3可知,基于SVR的船舶航行安全评估模型预测误差值相对较小。
式(9)从数值方面表明了模型的预测精度,因此用EMA来比较基于两种方法构建的模型的误差精度,具体见表4。基于SVR的模型评估精度为0.001,而基于ELM构建的模型评估精度为 0.01,显然基于SVR的模型的预测效果更优。
3 结束语
为对航行船舶的安全状况进行评估,构建一个航行安全评估模型。首先建立完善的评估指标体系,在此基础上利用大数据技术对数据进行预处理,将处理后的数据作为基于支持向量回归(SVR)的船舶安全评估模型的输入数据,得到船舶的安全评估值,然后与实际安全值进行比较。通过实验验证可知,模型的拟合程度达到99.6%以上,验证了该模型的稳定性以及拟合度。进一步实验验证表明,基于SVR的模型预测精确度、鲁棒性均高于基于极限学习机(ELM)的预测模型,说明该模型的优越性。该评估模型解决了当前评估指标单一、评估结果可靠性低的问题,有广泛的应用前景。
参考文献:
[1] 张笛, 姚厚杰, 万程鹏, 等. 基于模糊证据推理的内河船舶航行安全状态评价[J]. 安全与环境学报, 2018, 18(4):
1272-1277. DOI:
10.13637/j.issn.1009-6094.2018.04.006.
[2] 李款, 于寒. 基于数据驱动的水面艇航行状态检测与诊断[J]. 指挥与控制学报, 2016, 2(3):
188-193. DOI:
10.3969/j.issn.2096-0204.2016.03.0188.
[3] 贾明明, 熊锡龙, 黄立文, 等. 基于集值统计-灰色模糊的航道通航环境安全评价[J]. 安全与环境学报, 2017, 17(1):
41-45.
[4] 林毅. 一种基于SVR回归的机场航迹预测方法[J]. 信息通信, 2019(7):
58-59.
[5] LIANG Haibo, ZOU Jialing, LI Zhiling, et al. Dynamic evaluation of drilling leakage risk based on fuzzy theory and PSO-SVR algorithm[J]. Future Generation Computer Systems, 2019, 95:
454-466. DOI:
10.1016/j.future.2018.12.068.
[6] 谢新连, 陈紫薇, 魏照坤, 等. 基于极限学习机的船舶航行行为预测[J]. 重庆交通大学学报(自然科学版), 2019, 38(8):
7-12, 123. DOI:
10.3969/j.issn.1674-0696.2019.08.02.
[7] 赵洪帝, 刘敬贤, 刘奕, 等. 基于改进未确知测度模型的内河客船夜航风险评价[J]. 交通信息与安全, 2018, 36(1):
28-34. DOI:
10.3963/j.issn.1674-4864.2018.01.004.
[8] WANG Lei, LIU Qing, DONG Shiyu, et al. Effectiveness assessment of ship navigation safety countermeasures using fuzzy cognitive maps[J]. Safety Science, 2019, 117:
352-364. DOI:
10.1016/j.ssci. 2019.04.027.
[9] BANDA O A V, GOERLANDT F, MONTEWKA J, et al. A risk analysis of winter navigation in Finnish sea areas[J]. Accident Analysis and Prevention, 2015, 79:
100-116. DOI:
10.1016/ j.aap.2015.03.024.
[10] ELIOPOULOU E, PAPANIKOLAOU A, VOULGARELLIS M. Statistical analysis of ship accidents and review of safety level[J]. Safety Science, 2016, 85:
282-292. DOI:
10.1016/ j.ssci. 2016.02.001.
[11] EVEGREN F. Fire risk assessment of alternative ship design[J]. Ships and Offshore Structures, 2017, 12(6):
837-842. DOI:
10.1080/17445302.2016.1275474.
[12] VIDMAR P, PERKOVI C M. Methodological approach for safety assessment of cruise ship in port[J]. Safety Science, 2015, 80:
189-200. DOI:
10.1016/j.ssci.2015.07.013.
[13] 聶细亮, 刘强, 李国帅, 等. LNG船舶海上运输安全研究现状及进展[J]. 中国安全科学学报, 2017, 27(5):
87-92.
[14] LIU Jiao, SHI Guoyou, ZHU Kaige. Vessel trajectory prediction model based on AIS sensor data and adaptive chaos differential evolution support vector regression (ACDE-SVR)[J]. Applied Sciences, 2019, 9(15):
2983. DOI:
10.3390/app9152983.
[15] 孙文兵, 彭跃辉. 基于PSO-SVR动态模型的车辆排队长度预测[J]. 计算机工程与应用, 2016, 52(2):
239-243.
[16] 周馨, 王国胤, 于洪. 基于改进极限学习机的软测量建模[J]. 计算机应用, 2017, 37(3):
668-672. DOI:
10.11772/j.issn.1001-9081.2017.03.668.
(编辑 贾裙平)
收稿日期:
2019- 05- 23 修回日期:
2019- 11- 01
作者简介:
常婧(1995—),女,山西武乡人,硕士研究生,研究方向为水上交通,(E-mail)1500521143@qq.com;
柳晓鸣(1959—),男,山东栖霞人,教授,博导,博士,研究方向为交通电子信息系统理论与技术,(E-mail)lxmdmu@dlmu.edu.cn