扫一扫  加微信
走自主可控的超算发展之路
2023-08-15 10:07:00  来源:新华日报  作者:杨广文

超级计算机是衡量一个国家综合国力的重要标志,更是国家信息化建设的根本保证。自主可控是指依靠自身研发设计,全面掌握核心技术,实现信息系统从硬件到软件的自主研发、生产、升级、维护的全程可控。推进算力产业自主可控,对于实现经济高质量发展、提升国家核心竞争力具有重要意义。

从“受制于人”到“自主可控”

回首上世纪50年代,由于技术限制,我国向美国采购的超级计算机被放在一间玻璃房内,机器由美方人员看管,中国科学家的计算工作在美方监视下上机操作。超级计算机的运算内容、监控日志都要受到美方的审查。也就是说,虽然自己花了钱购置了超级计算机,但使用权不在自己的手中。

为此,国家十分重视超级计算机的自主研发。中国国家层面的超级计算机自研事业始于1978年,那一年,邓小平同志在全国科学技术大会上的一句“中国要搞四个现代化,不能没有巨型机”,开启了自研超级计算机的历史进程。1983年,中国第一台每秒钟运算一亿次以上的“银河”巨型计算机研制成功,中国超级计算行业开始走上了一条赶超之路。

超级计算机的研制一直受到发达国家的限制,自主研发是中国发展超级计算机的必由之路。国家“863计划”自1987年实施以来,一直重视超级计算机的研制,一直持续支持到现在,使我国超级计算机的研制与应用进入国际领先行列。

然而,超算发展的道路并不是一帆风顺的。2015年,美国商务部发布了一份公告:决定禁止向中国4家国家超级计算机中心出售超算芯片,这一禁令严重影响了我国超级计算机的研制。

实践反复告诉我们,关键核心技术是要不来、买不来、讨不来的。只有把关键核心技术掌握在自己手中,才能从根本上保障国家经济安全、国防安全和其他安全。要努力实现关键核心技术自主可控,把创新主动权、发展主动权牢牢掌握在自己手中。

2016年,一台具有完全自主知识产权的“神威·太湖之光”超级计算机问世。“自主可控”是“神威·太湖之光”最大的亮点。机器采用了由中国自主技术研制的高效能“申威26010”众核处理器,突破了全系统高密度集成及高速互联技术,是世界首台峰值运算速度超过十亿亿次、并行规模超千万核的划时代的新型超级计算机。自系统发布以来,已连续四次荣获世界超级计算机 TOP500榜单第一;基于“神威·太湖之光”系统,两项应用分别于2016年、2017年荣获高性能计算应用领域最高奖——“戈登·贝尔”奖,是中国超级计算应用领域近30年来的重大突破。2021年11月,神威超算团队再次凭借“量子计算模拟器”课题斩获该奖项;2019年9月,国家超级计算无锡中心荣获“全国爱国主义教育示范基地”称号。

40多年来,我国超级计算机经历了从无到有、从跟跑到局部领先、从关键核心技术引进到实现自主可控的艰难发展历程。

从“造好机器”到“用好机器”

气候气象。气候预测一直被认为是世界上最复杂的问题之一。气象学的要素千变万化,涉及到气象学、热力学、流体力学等极其复杂的方程组,而数据则是来自于卫星、雷达、观测站的实时监测,且不断更新。海量数据,对计算的速度和精度要求特别高。高分辨率的气候气象精细化预报,超级计算机功不可没。国家超级计算无锡中心的气候气象团队与国家气候中心和国家数值预报中心合作,开展区域高分辨率地球系统模式技术研究与应用研究,支持国际气候与灾害预报业务,支持环太湖空气污染溯源、长三角“双碳”数据分析、太湖蓝藻治理等业务;继续完善我国新能源数据集的更新与完善,为我国新能源的利用、长三角及江苏省和无锡市节能减排和新旧动能转化等提供科学依据。

先进制造。数字仿真模拟是推进先进制造的核心基石。受空间、成本等限制,通过传统实验风洞开展飞行器设计已难以满足需求,而借助“神威·太湖之光”的超强运算能力,则能在超算上开展研发设计,即在模拟的虚拟空间中试飞,这种模拟可以极大地节省成本,提高研发效率。国家超级计算无锡中心先进制造团队与国内核心研发团队合作,开展数字飞机发动机的研制和飞机发动机的模拟工作;与中国船舶科学研究中心合作,开展数字水池、数字船舶等模拟与验证工作,支持太湖实验室的建设等。除了高大上的尖端科技,“神威·太湖之光”还以接地气的姿态为产业赋能,服务实体经济,助力制造业转型升级。国家超级计算无锡中心推出了“神工坊”高性能仿真平台。面向工业制造领域,提供高保真、高性能的工业仿真解决方案,并于2022年6月实现更新升级,新版本具有高效并行、图形交互、在线协同、应用推广在内的7大优势,自升级以来吸引注册用户100余个,累计注册用户达到600余个。

政务服务。国家超级计算无锡中心积极支持地方政府推进城市精细化管理等工作,利用资源与人才优势,提供高水平的信息服务。受无锡市相关部门委托,承接关于无锡市特种设备集成管理平台的硬件架设、软件开发、核心数据库建立等信息化工作。特别是基于人工智能与大数据分析的电梯物联网平台,对电梯的维护、人员的应急等提供支持,对大规模电梯可进行监控、管理、分析与故障预测。

超算互联网。也要看到,超算面临着算力设施发布不均衡、超算水平参差不齐、应用软件自主研发和推广应用不足、持续运营困难等问题和挑战。借鉴互联网的发展经验和成功做法,加快建设国家超算互联网,国家超级计算无锡中心从追求性能驱动向追求应用实效驱动转变,推动超算迈进新阶段。超算互联网不仅将超级计算机连接起来,而且将连接超算生态圈,在超算中心、应用软件商、软件开发者、科研机构、各类超算服务商、超算用户之间建立连接,连接超算的供需方,打造超算应用商城,拓展用户和应用。以互联网思维运营超算,构建互联网化的算力运营和服务体系。形成互联互通、异构融合、应用引领、产业升级、开放合作的超算互联网。

运维输出。国家超级计算无锡中心利用自身运维技术的优势,将积累多年的运维经验转化成服务能力,帮助其他地方政府新建超算中心(或智算中心)进行运维支持,助力实现可持续发展。在盐城设立了国家超级计算无锡中心的首个分中心——盐城超级计算中心。响应国家“东数西算”工程号召,在2023年初与青海大学合作共建智能超算中心,建设“东数西算”超算互联网示范与应用平台,合作开展“东数西算”计算技术研究。

夯实“算力底座”,赋能数字经济

超算是科技与企业创新设计的必备基础,是数字经济发展的核心驱动。未来,国家超级计算无锡中心将继续基于神威系列超级计算机系统,践行“攀高峰、越高地、沃平原”理念,构建全栈式国产高性能计算应用生态。“攀高峰”:基于自主超级计算系统,积极开展超级计算生态建设工作,特别开发大型并行应用软件,研究解决并行应用软件卡脖子问题,实现大型并行应用软件的国产化替代,支持解决气象气候、生命科学、海洋科学、材料科学、天体物理等重大科学问题。“越高地”:针对国家在装备研发方面的战略布局,建立超级计算应用支撑环境,支持深海空间站、飞机发动机、燃气轮机、地球模拟器等重大装备研发。“沃平原”:以无锡太湖湾科创带“头号工程”建设为契机,面向地方产业需求,充分发挥超算资源对产业创新设计的支持,研发汽车设计、电机设计、新药研发、芯片设计、材料设计、城市精细化管理、智能交通、电梯物联网产业创新设计服务平台等,为企业提供创新动能,为我国基础研究和地方产业发展提供超算力量。

(作者为国家超级计算无锡中心主任、清华大学计算机系长聘教授)

(转载需注明来源:江苏智库网)
  编辑:蔡阳艳