唐丹玲团队在利用可解释的机器学习框架模拟热带气旋风泵引起的海表降温方面研究取得进展
发布时间:2024-2-18 发布人:U团队
近日,广州海洋实验室唐丹玲团队在利用可解释的机器学习框架模拟热带气旋风泵引起的海表降温方面研究取得进展,相关成果以“Modeling Ocean Cooling Induced by Tropical Cyclone Wind Pump Using Explainable Machine Learning Framework”为题发表在SCI期刊IEEE Transactions on Geoscience and Remote Sensing(中科院1区,影响因子:8.2)上。广州海洋实验室-香港科技大学联培博士研究生崔红星(导师:唐丹玲)为论文第一作者,唐丹玲教授为唯一通讯作者。合作单位包括深圳大学、加拿大达尔豪斯大学、香港浸会大学与英国萨里大学等。
热带气旋(TC)具有强烈的风泵效应,会诱发海洋上层海面温度降低(SSTC)。SSTC是揭示热带气旋演变和海洋状况的一个重要指标。然而,目前很少有有效的方法能准确近似地估算 TC 诱导的 SSTC 的空间结构振幅。本研究提出了一种可解释的机器学习框架,用于模拟和解释西北太平洋(NWP)上空 SSTC 空间结构的振幅。该研究特别考虑了与热带气旋特征和风暴前海洋状态相关的 12 个预测因子作为输入。合成分析技术用于描述TC轨迹上 SSTC 空间结构的振幅。利用一种高效的集成机器学习算法XGBoost和 12 个预测因子来模拟 SSTC 的空间振幅。为了更好地解释TC强迫下的海气相互作用,进一步采用了SHAP方法来识别预测因子在决定TC引起的SSTC振幅中的贡献,从而为所提出的方法带来了面向属性的可解释性。结果表明,所提出的方法可以准确模拟不同 TC 强度组的 SSTC 空间结构振幅,其效果优于一些主流的机器学习方法和一种数值模式。所提出的方法也可以作为重建 SSTC 空间结构年际和季节演变合成图的有效工具。
唐丹玲团队长期研究海洋风泵的生态环境效应,该研究为应用机器学习来模拟和解释极端天气条件(如热带气旋)引发的海洋风泵响应下提供了新的视角。
研究由广东省特支计划U团队项目(2019BT02H594)、广州海洋实验室人才科研启动项目(GML2021GD0810)和2022年度南沙区重点领域科技项目(2022ZD003)等资助。
论文全文:Cui Hongxing, Tang Danling*, Liu Huizeng, Liu Hongbin, Sui Yi, Lai Yangchen and Gu Xiaowei, Modeling Ocean Cooling Induced by Tropical Cyclone Wind Pump Using Explainable Machine Learning Framework, IEEE Transactions on Geoscience and Remote Sensing, vol. 62, pp. 1-17, 2024, Art no. 4202317, doi: 10.1109/TGRS.2024.3358374. https://doi.org/10.1109/TGRS.2024.3358374
论文PDF下载请点击#198: http://www.lingzis.com/journal article.htm
图 1.(a)1998-2018 年间每6小时记录的热带气旋个数密度图,颜色代表热带气旋中心个数,网格空间分辨率为 0.1°×0.1°;(b)热带气旋个数的月分布;(c)热带气旋个数的年分布。
图 2. 本研究提出的模拟 TC 诱发SSTC的技术框架。蓝色方框表示数据处理步骤,包括季节周期去除、预测因子提取、合成分析和后处理;橙色方框表示 XGBoost 模型的实现;紫色方框表示使用 SHAP 方法对 XGBoost 进行解释;绿色方框指合成分析图重建以模拟 SSTC 的步骤。
图 3. (a) 根据测试集的观测数据,TC诱发的 SSTC与TC 轨迹距离的函数关系。图中只显示了TS 和 H3-H5 的标准误差(分别为垂直绿线和红色阴影的宽度);其他三个强度组的标准误差大小介于两者之间。绿色、蓝色、红色、青色和黑色曲线代表不同强度组的热带气旋,即TS、H1-H2、H3-H5 和所有风暴。(b) 与 (a) 相同,但为 XGBoost 模式的预测值。缩写:TS,热带风暴;H1-H2,1-2 级飓风;H3-H5,3-5 级飓风;H1-H5,1-5 级飓风。
图 4. (a)-(d) 图 3b 对 XGBoost 模型性能评估,即不同 TC 强度组的 (a) r、(b) RMSE (℃)、(c) MAE (℃)和 MSE (℃)。绿色、蓝色、红色、青色和黑色曲线代表不同强度组的热带气旋,即TS、H1-H2、H3-H5 和所有风暴。
图 5. (a) 基于 SHAP 平均绝对值的 XGBoost 模型预测因子。(b) 按 SHAP 平均绝对值排序的预测因子 SHAP 汇总图。
图6. (a) 基于观测值的TC引起的SSTC 年际演变。黑色等值线表示 SSTC(℃)。(b)、(c) 与(a)相同,但分别为XGBoost和数值模式的预测值。
图 7. 用于量化模型性能的指标,即 r、RMSE (℃)、MAE (℃)和MSE (℃)的年际演变。 (a)-(d) XGBoost;(e)-(h) 数值模型。黑色等值线分别表示相关系数、RMSE、MAE 和 MSE 的值。
图 8. (a) 基于观测值的 TC 诱导的SSTC季节性演变。黑色等值线表示SSTC (℃)。(b), (c) 同 (a),但分别为 XGBoost 和数值模式的预测值。
图 9. 用于量化模型性能的指标,即 r、RMSE (℃)、MAE (℃)和MSE (℃)的季节性演变。(a)-(d) XGBoost;(e)-(h) 数值模型。黑色等值线分别表示r、RMSE 和 MAE 值。