摘要:海运是国际贸易和全球化的支柱。海运研究大致可以分为两个类别:航运方面和港口方面。大多数用于解决这些研究主题中实际问题的经典方法基于长期观察和专家知识,只有少数是基于从实践中积累的历史数据。近年来,机器学习和深度学习技术等新兴方法在解决实际问题方面受到越来越多的关注。作为一个相对保守的行业,海运领域也开始尝试将新兴方法应用于实际问题的解决。本文的目标是回顾新兴方法在海运研究中的应用。首先介绍海运研究的主要研究主题以及为解决这些问题而开发的经典方法。接下来,讨论新兴方法的引入及其在海运研究中应用的适用性。然后,根据问题设置、主要数据来源以及采用的新兴方法,回顾相关的现有研究。文章还从数据、模型、用户和目标的角度讨论了在此过程中遇到的挑战及解决方案。最后,指出了未来有前景的研究方向。这篇文章首次对现有的关于开发机器学习和深度学习模型及使用流行数据源来解决海运实际问题的研究进行了全面综述。
海运研究概述
海运承载了全球超过80%的货物贸易量,因此被视为全球化贸易和制造供应链的支柱。海运业也是一个国家经济体系的重要组成部分,扮演着进口、出口资源和提供就业机会的关键角色。鉴于海运在国际和地区层面的重要性,相关的学术研究得到了广泛关注。海运研究的主题可以分为“航运部分”和“港口部分”。在对1,292篇论文的回顾后,得出了航运部分的前五大研究主题:航运市场分析、船舶运营管理、绿色航运、航运安全与安保以及航运公司管理。同时,港口部分最受欢迎的研究主题包括港口管理、绩效评估与竞争力以及码头管理。从2000年至2014年,海运研究中采用的研究方法总共分为七类,分别是SIQO(调查、访谈、问卷和观察)、经济建模、MES(数学、计量经济学和统计分析)、案例研究、CCCQ(概念、内容、比较和定性分析)、文献综述以及仿真,我们在本文中称之为经典方法。这些经典方法的主要方面总结如下表。
| 方法 | 基本思想和内容 |
|---|---|
| SIQO | 调查:通过问题收集样本个体的信息,包括数据收集、汇总和分析; 访谈:一种收集信息的对话,通常包括一个协调整个过程并提问的访谈者和一个回答问题的受访者。 问卷:一种包含一组问题或其他提示的研究工具,旨在从受访者处收集信息。 观察:研究非实验情境下的行为,观察和记录结果,生成定性或定量数据。 |
| 经济建模 | 使用不同的理论以及定量或定性模型和技术,分析评估任何经济现象的因果关系。 |
| MES | 数学分析:将非数学情境、现象及其关系进行数学建模,如开发数学模型并提出适当的解决方案; 计量经济学分析:构建一组方程,定量解释经济变量的行为; 统计分析:基于统计假设和测试,收集和分析数据,从样本得出对总体的有意义推论。 |
| 案例研究 | 从各个全面的角度对研究对象进行深入研究,寻找其行为的模式和原因。 |
| CCCQ | 概念分析:分解和分析概念的组成部分,以更好地理解某一特定问题。 内容分析:量化和分析在给定的定性数据中某些词语、主题或概念的出现情况。 比较分析:比较两个或多个过程、文件、数据集等目标。 定性分析:使用主观判断,基于不可量化的信息分析研究对象 |
| 文献综述 | 对某一主题或领域现有文献的概述和评估。 |
| 仿真 | 对真实世界过程或系统的时间运行进行模拟。 |
新兴技术及其在海运研究中的应用
多数经典方法依赖于长期实践经验和专家知识,即便采用定量方法,如经济建模和MES,这些模型在假设和构建时也常带有主观判断。此外,经典模型通常不是基于数据驱动的(计量经济学分析和统计分析除外),无法动态从数据中学习以挖掘有用信息。近年来,机器学习(ML)和深度学习(DL)模型等新兴方法得到了迅速发展,逐渐被用于解决实际问题。这些方法基于数据驱动,属于人工智能(AI)的范畴,旨在使计算机模仿人类行为,完成复杂任务,且无需大量人工干预。机器学习问题通常分为三类:监督学习(SL)、无监督学习(UL)和强化学习(RL)。其中,SL依赖带有目标值的训练集,常见的模型有逻辑回归(LR)、支持向量机(SVM)等;UL利用不含目标值的数据集,常见任务包括聚类和关联规则挖掘;RL则通过最大化奖励,找到最优行动策略。
DL是 ML的子领域,基于深层神经网络(DNN),如卷积神经网络(CNN)和循环神经网络(RNN)。新兴方法的开发过程依赖于数据,模型性能与数据质量和数量密切相关。模型构建的基本流程包括明确问题,识别数据源,进行特征工程,开发和调整模型,最后通过多种指标评估模型性能。新兴方法的优势包括:其数据驱动特性能够避免主观判断导致的偏差,基于数据的决策更加准确,且模型随着新数据的引入可不断改进。然而,尽管这些方法已广泛应用于其他领域,海运业的应用仍有限。随着自动识别系统(AIS)、全球定位系统和实时数据传输设备的发展,海运业数据的数量和质量得到提升,数据驱动分析成为可能。同时,各种编程库的出现也促进了新兴方法在海运领域的应用。
| 问题类别 | 研究主题 | 问题设置 | 主要数据源 | 采用的ML模型 | 采用的DL模型 |
|---|---|---|---|---|---|
| 航运 | 船舶轨迹预测 | 基于历史轨迹预测未来轨迹 | AIS | SVM、ELM、k-NNs、自动编码器 | LSTM、GRU、GAN |
| 航运 | 风险预测与安全管理 | 预测船舶事故发生 | AIS、事故统计数据 | SVM、MLP、树模型、k-NN回归 | LSTM、CNN等 |
| 航运 | 检查计划 | 预测船舶风险 | PSC检查记录 | BN、SVM、树模型 | 无 |
| 航运 | 能效预测 | 预测燃油消耗 | 航行记录、天气预报 | ANN、LR等 | 混合LSTM等 |
| 航运 | 海运市场预测 | 预测BDI、运费率 | 市场指标 | ANN、SVR等 | RNN、LSTM |
| 港口 | 到港时间预测 | 预测船舶到港时间 | AIS、天气预报等 | DBSCAN、ANN等 | DNN |
| 港口 | 港口状态预测 | 预测货物流量等 | 港口统计数据 | ANN、SVM等 | 无 |
数据源
AIS(自动识别系统):用于收集船舶的动态航行信息,如实时位置、航速和航向,以及静态信息如船舶识别码和尺寸。AIS数据广泛用于船舶轨迹预测和航运管理。
船舶规格:商业数据库(如Lloyd's List Intelligence)提供全球商船的详细规格信息,包括船型、吨位、所有者及操作信息。
船舶航行记录:由船上传感器自动收集或通过船舶中午报告人工填写,记录船舶的地理位置、航速、燃油消耗等数据。
船舶事故数据:国际海事组织(IMO)和地方海事部门发布的全球船舶事故数据,包括事故详情和调查报告。
PSC检查记录:由区域PSC组织发布的船舶检查记录,包含船舶状态及检查结果。
海洋天气预报:提供风速、浪高等关键海洋条件,数据来源包括NOAA和ECMWF等机构。
港口统计数据:各港口发布的船舶到港、集装箱吞吐量和货物吞吐量等统计信息。
BDI(波罗的海干散货指数):反映干散货航运市场状况的经济指标,由波罗的海交易所发布。
新兴方法在海运领域的应用
航运领域
船舶轨迹预测:船舶轨迹预测是航行安全的关键,依赖于AIS数据。ML模型如SVM、ELM、k-NNs等被广泛用于该领域,DL模型如LSTM、GRU和GAN等也应用于此,特别适合处理庞大的动态AIS数据。
船舶风险预测和安全管理:航行安全是海运业的重中之重。ML模型如SVM被用于预测航行状态和碰撞风险,MLP与模糊逻辑和专家系统相结合用于碰撞避免。树模型和SVM则被用于碰撞风险预测。DL模型(如LSTM和CNN)也广泛应用于此类风险预测和避免中。
港口国控制(PSC)下的船舶选择与检查流程优化:港口国检查(PSC)是确保船舶符合海事法规的关键。ML模型如BN、SVM和树模型用于优化船舶检查流程,关联规则挖掘用于优化检查顺序。
船舶能源效率预测:随着排放规定和燃油价格的提升,船舶燃料消耗预测成为研究重点。ANN、树模型、LASSO回归和SVR等ML模型被用于燃料消耗预测,DL模型如LSTM和RNN则用于进一步优化航行效率。
海运市场预测:海运市场指标如BDI和运费预测已通过ANN、SVR等模型得到广泛研究,这些模型有效应对市场变化并优化定价策略。
港口领域
船舶目的地与到港时间预测:尽管AIS提供了目的地和预计到港时间,但其准确性较低。基于AIS数据的ML和DL模型正被用于提高目的地和到港时间预测的精度,帮助相关方优化运输和物流规划。
港口状况预测:新兴方法已被应用于港口运营中,ML和DL模型用于预测港口货物流量、日流量和交通状况,如ANN结合SARIMAX预测水泥运输需求,SVR、RF和LSTM则被用于液体散货量的预测。
应用新兴方法于实际问题的挑战
数据:数据是新兴方法应用的基础,但海运领域的数据往往分散且不易获取。合适的特征选择与数据预处理是关键步骤。数据缺失、噪声和异常值的处理也对模型性能有重要影响。
模型:ML和DL模型在不同场景中各有优劣。DL模型复杂度较高,适合处理非结构化数据,但需要大量数据进行训练,而ML模型则广泛应用于常见的预测任务。黑盒模型的可解释性是一个重要挑战,特别是在政策相关的海事应用中,透明性尤为重要。
用户:模型的开发者与用户通常是不同的群体,用户多为非技术背景的从业者。因此,界面设计应简化操作流程,确保模型易于使用,并减少用户的操作负担。此外,模型的通用性也是一个问题,不同地区和港口的差异性使得模型可能需要定制或重新训练。
目标:在应用新兴方法时,模型必须考虑行业规则和经验,确保决策的公平性。例如,在PSC检查中,模型应优先考虑船舶管理公司和旗国的表现,以符合行业惯例,避免不公平的检查选择。
未来研究方向
数据共享与协作:海运行业中缺乏统一的数据共享机制,未来研究应推动更多实时的数据协作与共享,特别是在船舶到港信息、港口运营数据等领域,促进数字化转型。
模型与领域知识结合:未来研究应将行业内的专业知识更好地融入数据驱动模型中,例如船舶燃料消耗与航速的关系,应符合行业经验法则而非纯粹的模型输出。
提高模型的可解释性:解决“黑盒”模型的可解释性问题是未来研究的重要方向。应开发更具解释性和透明度的模型,确保海事从业人员能理解并信任模型输出。
拓展应用领域:当前新兴方法的应用集中在预测任务上,未来研究应扩展至船舶调度、港口拥堵管理等更复杂的领域,以进一步提升海运效率和安全性。


摘要:海运是国际贸易和全球化的支柱。海运研究大致可以分为两个类别:航运方面和港口方面。大多数用于解决这些研究主题中实际问题的经典方法基于长期观察和专家知识,只有少数是基于从实践中积累的历史数据。近年来,机器学习和深度学习技术等新兴方法在解决实际问题方面受到越来越多的关注。作为一个相对保守的行业,海运领域也开始尝试将新兴方法应用于实际问题的解决。本文的目标是回顾新兴方法在海运研究中的应用。首先介绍海运研究的主要研究主题以及为解决这些问题而开发的经典方法。接下来,讨论新兴方法的引入及其在海运研究中应用的适用性。然后,根据问题设置、主要数据来源以及采用的新兴方法,回顾相关的现有研究。文章还从数据、模型、用户和目标的角度讨论了在此过程中遇到的挑战及解决方案。最后,指出了未来有前景的研究方向。这篇文章首次对现有的关于开发机器学习和深度学习模型及使用流行数据源来解决海运实际问题的研究进行了全面综述。