English 联系我们
中国气象数据网APP
微信
中国气象数据网
微信号
扫一扫,立刻关注
我的数据筐 
站内信
开通PLUS会员
PLUS会员是为用户打造的增值服务,满足用户高需求。开通PLUS会员后,用户可享有如下功能和特权,如想了解更多PLUS会员服务内容,请点击PLUS会员首页(http://data.cma.cn/plus/index.html
注册登录
DeepSeek赋能气象应用的“AI”时刻 丨全流程赋能气象数据信息应用

1月20日,Deep-Seek-R1模型正式发布,并同步开源模型权重。凭借远低于行业平均成本的研发投入,多模态交互、低能耗运算、多语言适配等关键技术的突破,以及模型推理能力的极大提升,DeepSeek进一步加速人工智能应用的普及,迅速成为全球科技界关注的焦点。

激活人工智能在气象监测、预报和服务中作用,也是近年来中国气象局持续发力探索的重要领域。气象专家发现,借助深度学习算法以及多头潜在注意力(MLA)机制、混合专家模型(MoE)架构、强化学习(RL)、知识蒸馏等关键技术,DeepSeek能在高效处理卫星图像、雷达数据和地面观测数据,快速分析并提炼复杂关键气象信息,压减人工处理时间和降低成本,加速气象预报智能化步伐,全流程赋能气象数据信息应用。

点击进入气象大数据云平台“天擎”,2500余种气象服务数据、2000余个数据要素、1000余个数据接口相继呈现。


3777184592b389e3981887f24169b303.jpg

气象大数据云平台迭代升级  供图:国家气象信息中心

“用户要找到自己所需要的数据或要素,选择合适的接口调用服务等,往往要在网站上花时间熟悉说明文档,所以我们开发了智能‘小助手’——ChatMUSIC。”何文春介绍,用户只需通过自然语言对话,说出自己想要的数据,例如“获取昨日全国范围降水量最大的前10个站点数据”,ChatMUSIC便能马上识别其需求,生成数据获取代码,同时提供数据样例及可视化图形。

ChatMUSIC是国家气象信息中心(以下简称“信息中心”)探索人工智能气象应用的一个缩影。而气象信息领域有关大语言模型的部署,则可追溯至2023年7月。为支持国家气象中心(中央气象台)等单位的生成式人工智能应用,信息中心陆续部署了智谱GLM、通义千问、书生浦语等大语言模型。2月8日,DeepSeek-R1 671B模型在中国气象局气象超算中心(和林格尔)完成本地化部署,将ChatMUSIC与DeepSeek对接,开始测试网页对话交互应用。

“从目前的测试来看,DeepSeek具有较强的计算分析和模型优化能力,其在推理逻辑、自我反思以及对中文语言的语义理解和生成等方面质量更优。”何文春介绍,这样的强推理模型对气象数据全流程赋能具有重要意义,例如结合当前地球系统大数据平台建设发展,DeepSeek可根据不同业务需求,通过互联网在全球范围内主动识别发现有价值的地球系统科学数据,并进行清洗处理。在数据存储与服务方面,DeepSeek等大语言模型则能根据用户访问需求,合理规划和动态调整各层级数据布局,以更简洁、自然的方式优化用户交互体验,“大家可以使用自然语言代替界面操作和程序开发等方式使用数据资源。”何文春说。此外,DeepSeek在业务运维、政务办公、安全风险研判等方面也具有很好的应用前景。

在地球系统科学研究中,代码编写和审查是关键环节之一,涉及复杂的技术学习和语法分析任务。以往,科研人员需耗费大量时间和精力编写代码,且人工审查代码时难免出现疏漏。如今,DeepSeek等大语言模型可在其中发挥关键作用。

近日,中国气象局地球系统数值预报中心(以下简称“数值预报中心”)通过DeepSeek-R1大模型辅助科研工作。“通过对海量代码数据的学习,它能够根据科研人员的自然语言描述,快速生成高质量代码框架,涵盖Python、Fortran等多种常用于地球科学研究的编程语言。”肖华东说,对于通常的数据处理和产品绘制代码开发,只需通过交互方式依次输入代码的要求,DeepSeek-R1大模型就能迅速生成结构清晰的基础代码,科研人员在此基础上进行微调即可,缩短了开发周期;在代码审查方面,它能依据行业标准和常见错误模式,检测出代码中的语法错误、逻辑漏洞以及潜在的性能问题,并给出修改建议,提供详尽和规范的代码标注。

面对海量气象数据的处理和加工,DeepSeek可促进天气雷达、地基遥感等各类异构、多模态遥感观测数据的高质量融合,帮助解决当前气象监测数据获取和处理中存在多源异构性、时空不一致性以及精度不足等问题。“我们还可以考虑通过智能算法优化观测站点的选址和布局,如运用遗传算法、模拟退火算法综合考虑地形、人口密度、历史灾害记录、城市功能区分布等因素。伴随算法的完善改进,蒸馏专有的观测站网布局模型,为科学规划观测站网提供支撑,进而提升探测效益。”雷勇介绍,通过构建面向装备保障的自然语言模型,发展人工智能会话式远程故障技术支持系统等,还将有效提升气象观测数据的运维保障效率。

除了在气象数据各环节有应用价值外,DeepSeek在模型架构和优化、跨学科协作以及实际场景落地等方面的经验也值得借鉴。

针对计算机系统各组成部件特性,DeepSeek开展了诸多精细的优化软件设计开发。“这对于我们下一代数值预报模式的计算效率优化具有很好的参考借鉴意义,后续模式代码的计算优化需更多考虑软硬件协同,针对机器特性展开精巧设计。”陆其峰介绍,此外,还可在数值预报模式开发及各流程中应用DeepSeek模型的特色技术,如在观测资料预处理、同化极小化算法、四维变分切线性伴随方程求解、模式动力计算等环节精巧利用人工智能技术实现改进及融合,进而提高精度及计算效率。


来源:中国气象报
专家顾问:国家气象信息中心副主任 邓鑫  
国家气象信息中心系统发展室主任 何文春 
中国气象局地球系统数值预报中心副主任 陆其峰 
中国气象局地球系统数值预报中心计算技术室主任 肖华东 
中国气象局气象探测中心总工程师 雷勇
作者:王婉 刘丹
编辑:颜昕
审核:胡亚 闫泓


 

Copyright 2005-2017 国家气象信息中心(中国气象局气象数据中心)
地址:北京海淀区中关村南大街46号 邮编:100081  E_mail : datacenter@cma.gov.cn
扫码登录
账户登录
二维码失效
点击刷新
登录手机中国气象数据网扫描二维码
立即注册 更快 更安全
第三方登录
我的订单
我的数据筐
我的收藏
用户反馈
在线客服
返回顶部