6月20日,国家超级计算无锡中心迎来了2周岁生日。连续四次蝉联世界高性能计算机榜首、两度获得高性能计算机应用领域最高奖“戈登·贝尔”奖……“神威·太湖之光”超算这两年所取得的成绩,是中国超算发展史的一个缩影。从核心装备受制于人,到经历跟跑、并跑,最终实现领跑,中国超算可以说,是一部“逆袭”史。国家超算无锡中心主任杨广文向现代快报记者透露,国家3台百亿亿次的超级计算机正在研发当中,2020-2021年,中国超算将率先迈入百亿亿次行列。
现代快报/ZAKER南京记者 徐红艳/文 马晶晶/摄
关键技术是买不来的
国产超算“逆袭”
在前不久召开的两院院士大会上,连续四次蝉联世界之冠的“神威·太湖之光”超级计算机,作为我国着力推进的战略高技术研究典范,被习近平总书记“点名”表扬。总书记说,“实践反复告诉我们,关键核心技术是要不来、买不来、讨不来的。”
对于这句话的理解,杨广文感受很深。他告诉现代快报记者,虽然近几年才迎来爆发式增长,但中国在超算领域蓄力已久。“我们能有今天的成就,是站在几代超算人的肩膀上发展起来的。”杨广文说,超算的发展伴随着改革开放的进程。
早在上世纪80年代,随着“863计划”的启动,国家高度重视发展超级计算机,但是由于国内基础薄弱,再加上起步晚,核心处理器等关键部件与技术的短板只能受制于人。
“原来美国卖给中国超算的门槛是很高的,不仅价位高、性能还低。机器到了中国以后,还有美方工作人员监督。”杨广文清晰地记得,曾有气象部门从美国买来超算,来了以后,被放在一个玻璃房子里,每次使用的时候,门口都有外国人监督,一旦工作完成必须马上离开。伴随国内超算计算性能的不断提升,美国2015年开始对中国实施芯片禁售。
“这也是促使我们必须自主研发。”自1987年“863计划”开始,中国超算至今已走过30个年头。用杨广文的话说,30年来,中国超算取得了长足的进步,从看着美国跑,到奋力追赶,再最终实现超越。在此期间,超算也引领了一大批企业的发展,包括大家熟知的联想、曙光、浪潮等。
巅峰速度令人惊叹,这颗中国芯很关键
超算究竟是什么?它代表了最强计算力,反映了一个国家的科技实力。在超级计算机历史上,中国进步的速度和广度前所未有。
震撼世界的成绩背后,是巅峰速度在支撑。“神威·太湖之光”到底有多快?它1分钟的计算能力相当于全球72亿人同时用计算器不间断计算32年。
而巅峰速度的底气,则来自4万多颗“中国芯”。“这台机器在世界上最叫得响的,是它的全自主国产‘申威26010’芯片。”杨广文说。
要想在计算机上跑软件,核心是处理器。而在这台超级计算机上,总共有40960颗芯片,一个芯片是260个核,总共是将近1000万个核。2016年刚问世时,不论是结构还是性能,这个芯片都是世界领先的。国家超算无锡中心应用支持部门主管刘钊说,超算浮点计算密集,需要极其强大的计算能力。普通PC机主要是英特尔的芯片,是多核结构。“申威”则是众核结构,一个芯片有260个核。
作为国家自主创新领域的一个响亮品牌,国家超算无锡中心还在谋划,要将这个品牌打造成“金字招牌”。比如,中心正在致力推广的小型化超算平台。小型机与超算使用同一款CPU,去年底已研制成功。“根据企业的需求,我们还在小型机上部署了一些应用,使软硬件搭配运行。”刘钊说。
也就是说,有中高端高性能应用的企业,可以定制“神威·太湖之光”超算同款了,而且想要几颗芯就有几颗。
上天入地都能模拟,它能干的事儿超乎想象
模拟C919大飞机多种飞行状态、让“天宫一号”顺利回家、对唐山大地震的精确模拟……基于强大的运算能力,近两年,神威·太湖之光成了高性能应用界的“明星”。如今,“神威·太湖之光”每天的平均使用率在70%-80%,同时服务于几百个客户。
“以前有人说中国能把机器做好但应用并不好。而我们连续两次拿这个戈登·贝尔奖,特别是有25个全机应用,这些是对上述说法的一种反驳。”杨广文说,“神威·太湖之光”是我们国家自主研发的世界上首台浮点运算峰值超过10亿亿次的机器,把它用好是这一代超算人的使命和责任。
去年,由国家超算无锡中心副主任付昊桓等科研人员共同领导的团队所完成的“非线性地震模拟”,获得国际高性能计算应用领域最高奖“戈登·贝尔”奖。该项目对1976年唐山大地震的高分辨率精确模拟,使科学家能更好地理解唐山大地震所造成的影响。
除了支持尖端研究,超算也可以转化为服务,比如气候变化、地震预防预测等。付昊桓此前曾表示,目前中心正在和江苏以及国内不少制造单位合作,提升大国重器的“中国速度”,“大家知道的制造蛟龙号的中船重工,还有制造发动机的上海商发,都是我们的合作单位。超算可以成为它的设计平台,去模拟这些设备在各种各样的工况下的运行情况,从而大大加快设计过程。”