天气真的很复杂,前一秒还是晴空万里,后一秒就突降暴风雨了。
为了更加准确地预测天气这个“小机灵鬼”,我国从很早以前就开始研究天气数值预报。而数值预报的发展,背后离不开高性能计算机。
计算机有“服役期限”,这个周期大约为6-8年,也正因如此,全球主要气象机构高性能计算机更新换代的新闻频频见诸报端。
下面,就让小据带你走进我国气象高性能计算机发展的40年。
1、改革开放初期
改革开放初期,中国气象局引进了M-160Ⅱ和M-170两台大型计算机。在当时来说,它们的性能非常的先进,主要用于国际气象通信业务,也被拿来研发数值预报模式,有时还会对外开放 。
2、20世纪90年代
我国数值模式预报业务蓬勃发展。
在超级计算机的基础上,中国气象局自主研发了新一代全球/区域通用数值天气预报系统(GRAPES)。
之后,我国气象信息化工作深入开展,国产数值预报模式GRAPES的能力和水平不断改善,已成为支撑智能化网格预报的核心力量。
3、2018年
2018年,国产高性能计算机系统“派-曙光”登场。有了国产“最强大脑”,我们的天气预报会更准吗?数据和案例来告诉你。
首先,它足够硬核!
峰值运算速度达到每秒8189.5万亿次,约为此前中国气象局使用的进口高性能计算机系统的8倍;内存总容量达到690,432GB;在线存储物理容量为23,088TB;全系统可用度超过99%;操作系统为Linux,配套基础软件,并行语言及集成开发环境。
其次,它足够可靠!
它有两套子系统互相备份,计算资源相对独立,共享存储资源。假使其中的一套出现故障,另一套依然可以支持正常的工作。
更重要的是软件方面特别给力!
在这套高性能计算机系统上,运行着众多的气象业务系统。就像车间一样,由每道工序上的工人和车间总指挥共同运作,总指挥利用高效率指挥工具,从大局出发,从而使得车间高效运转。
这套高性能计算机系统的Gridview作业调度软件就是这样一个合格的指挥工具,它能够提供灵活的调度策略、完整的业务流程监控。
国家气象信息中心针对气象部门超算使用的特点,为这个车间设定了独具特色的计算资源管理策略。
首先,将计算需求划分为多个队列,满足不同性质作业的运行需求。如常规业务、业务研发、普通科研、特殊保障所需要的计算资源各不相同,常规业务需要的计算资源和占用时间都比较稳定,而科研占用的计算资源就有很大的不确定性。这套高性能计算机系统的计算资源管理策略通过抢占、优先级等方式,优先确保业务和特殊保障的计算资源需要。
此外,管理系统可以通过综合用户一段时间内的CPU使用情况,确定作业的优先级,以便最大限度实现公平共享。
尽管“派-曙光”的测试与运行时间较短,但它已经做出了许多贡献。
例如2018年汛期,这套国产高性能计算机系统已经默默参与到预报重任中,在“玛丽亚”“安比”“山竹”等台风预报中为全国会商提供了参考。
计算能力的差异,带来了模式运行效率的显著提升,但它仍有提升空间。未来,我们期待新系统更为优良的表现。
参考资料:中国气象报、光明日报