中国的超级计算机有多强?
2023-04-17 11:50

中国的超级计算机有多强?

工业化,或许是文明史上最激动人心的奇迹,工业化进程展开后的澎湃力量,足以在短时间里改写一个社会的经济活动景观,决定一个国家、一个民族的命运轨迹。而中国,是人类工业化历程的最新典范。本文为科工力量《中国工业化》专题系列第一部分《峥嵘岁月:从两弹一星到星辰大海》的第二篇。


本文来自微信公众号:科工力量 (ID:guanchacaijing),原标题《打破玻璃房—超级计算机登顶之路》,作者:青岚,头图来源:视觉中国


新中国计算机事业的起步,与核工业有着密切联系。


早在1953年,赴苏联考察访问的钱三强,就感受到核物理研究对计算能力的需求,回国后,在他的力主下,中科院电子学研究所的筹备队伍,被整体并入物理所,即物理所第五大组,夏培肃等中国计算机工业的奠基者,与邓稼先、赵忠尧等核物理学家密切配合,共同推进着中国原子能技术的发展。


可以说,原子弹理论模型与型号工程中反应、爆炸过程的计算需求,是中国计算机事业早期最大的牵引因素。


正如上节所述,两弹一星大科学工程,深刻影响了中国科技发展战略传统的形成,而这一战略传统,又在改革开放后实现了更新,进而有力反哺了进入世界市场后中国工业化的再加速,实现了极富成效的技术汲取和产业发育。


与核技术研究相伴相生的中国高性能计算机发展,同样是这一后发赶超“中国模式”的代表性案例。


一、艰难的起步


以中国原子弹研制为主题的电影《横空出世》中,有这样一个片段,为了完成原子弹理论模型试算验证,数百位知识分子齐聚一堂,一边啃着馒头咸菜,一边聚精会神拨打算盘,在霍斯特《行星组曲》的伴奏下,形成一幅隽永而又雄浑的历史画面。


图/电影《横空出世》画面


手工珠算突破原子弹,无疑是一种艺术表现,取材于1960年前后持续一年多的原子弹攻关“九次计算”阶段,在真实历史中,原子弹研制集中了当时全国最好的保障条件,除了手摇计算机、计算尺等近代化的辅助计算工具,电子计算机也已经开始发挥核心作用,影片设置这一强烈的对比,更多用意在于表现中国人无惧困难的民族性格。


但也必须承认,此时中国的高性能计算机研制能力,也确实相比国外存在巨大差距。


1959年,中国第一台大型电子计算机,仿制苏联БЭСМ-Ⅱ的104机试制成功,并立即应用于原子弹相关研制工作,这台计算机每秒可完成一万次浮点运算,作为对比,同期被公认的计算机性能之王,IBM公司为美国原子弹研发机构—劳伦斯利弗莫尔国家实验室开发的7030机,浮点运算性能约为每秒60万次,以至于开辟出了“超级计算机”这一细分产品门类。


超级计算机,即Supercomputer,自此专指通过采用特殊设计、工艺、部件与架构,实现运算性能显著超越同时期商用设备的计算机,通常产量稀少、体积庞大、需要专门的运营与维护,被用于执行各种普通计算机无法完成的工商业计算需求。


今天,人们已经习惯于把小小的中央处理器(CPU)芯片视为一国计算机产业能力的代表,然而在距今三分之一世纪前,计算机产业的生态是极为不同的,集成电路的“集成”和互联网的发展,还没有颠覆产品形态和商用大型机主导的终端需求,八十年代,只有不到10%的美国家庭拥有一台“电脑”,普及率甚至不及任天堂游戏主机,个人计算机仍然是一个媒体聚光灯之外的利基(Niche)市场。比拼系统架构与封装能力的大型计算机(Mainframe),仍然是产业发展的主要标杆,站在终端产品性能顶点的超级计算机,也普遍被视为一个国家计算机产业能力的标志,荣誉与声望的象征。


对于IBM 7030这台横空出世的超级计算机,中国人也曾经进行过购买的尝试,据当时的外媒报道,在60年代中法正式建交后,中方曾经透过法国代理公司,寻求购置这台当时定价700多万美元,仅仅生产了9台的“国之重器”,但在巴统的限制下最终夭折。


值得一提的是,104机尽管模仿苏联原型机,但在项目规划论证阶段,中方选择了由苏联方面培训人员,再由中国团队独立开展设计制造工作,而非苏联提议的,由苏方直接协助设计这一效率更高的选项。从104机这一看似“折腾”的发展路径选择上,可以看到中国科技战略中“以我为主”这一特色的体现。


随着原子弹研制从理论向工程、从裂变向聚变的发展,对计算能力的需求也日益强烈,而超级计算机,对于此时的中国人而言,还是遥不可及的梦想。


原子弹的攻关不等人,怎么办,拼命硬干。


1965年9月,第九研究院理论部副主任于敏带领几十位研究人员赶赴上海,利用当时华东计算所刚刚研制成功的J501电子计算机,开展突破氢弹原理的会战,这台设备运算速度约为每秒5万次,已经是当时国内性能最强的计算机。


在“独享”这台“高性能”设备的条件下,于敏团队废寝忘食,日以继夜地开展工作,一边推敲氢弹理论模型,一边通过计算机同步试算验证,通过持续三个多月的高强度攻关,在华东计算所成功完成了氢弹“于敏构型”的理论方案,此即中国两弹研制中另一个里程碑:“百日会战”。


得知氢弹原理突破的喜讯,理论部部长邓稼先第二天就飞到上海,自己掏钱请大家吃了一顿螃蟹宴。


氢弹原理突破17个月之后,1967年6月17日,中国成功进行了氢弹试验,标志着中国人完全掌握了第一代核武器技术,这个年轻的共和国为自己建立了基本的安全保障。


但是精神动员对物质条件的克服也已经发扬到了极限,进入70年代,核武器研究团队得出了严酷的结论:“没有运算速度达每秒一亿次以上的计算机系统,就搞不出第二代核武器”,中国人不缺少拼命硬干的精神,然而技术发展的新要求与现实保障条件的差距,已经到了非弥补不可的程度。


而“运算速度达每秒一亿次以上的计算机系统”,正是超级计算机的性能领域。


在尖端国防科研的急迫需求下,中方曾寻求直接采购超级计算机成品。


1976年末,即将卸任的美国总统福特意外签发了两台CDC公司Cyber172型入门级超算对华出口许可,用于中国石油地质勘探部门的数据处理,以此向毛泽东之后的新一代中国领导人表达善意,中国也第一次获得了接近世界水平的高速计算设备,然而为了平衡五角大楼等机构的疑虑,防止中方将超算用于国防等敏感领域,美方对这两台设备的性能做了降级处理,并对使用设置了严苛的条件,机房钥匙由美方人员掌管,上机需要美方人员审核监督,这就是在中国超级计算机发展史上令人胸中酸楚的“玻璃房”故事。


在引进Cyber172的尝试后,中方又转向另一个计算机强国日本,与日立公司达成协议,购入三台日立M系列大型计算机用于气象预报工作,1978年2月,卡特政府批准这一出口申请,但是仍然比照Cyber172的做法,要求日方在对华出口版本上大幅降低性能,在出口的前三年安排日方人员值守机房,中方的上机操作内容必须向日立公司总部提交汇总报告。


超级计算机早期的外购尝试,正是改革开放后中国工业化赶超战略“再学习”过程的预演,引进技术的“快”与以我为主的“慢”如何协调对接,还需要在无数微观案例的实践中试错寻优,在计算机这一案例中,一而再的羞辱性待遇下,中国人深刻意识到买现成的,一步到位是不切实际的幻想,想要解决国防急需,自力更生是唯一出路。


事实上,即便是在美国同盟体系中地位高得多的国家,想要获得超算这样的“国之重器”也并非易事,1987年,印度总理拉吉夫甘地试图向“好友”里根求购Cray X-MP超级计算机,被直截了当地以可被军用为由谢绝


中国人自己的超算之路就此起步了。


1978年3月,中央军委主席邓小平亲自主持了巨型计算机研制工作会议,形成了研制中国人自己的超算这一战略决心,以解决国防建设等领域紧迫的大型科学计算问题。他对参会人员表示:“中国要搞四个现代化,不能没有巨型机”,邓小平还直接点将时任国防科委主任张爱萍:“现在巨型机就断给你了,你要立军令状”。


1978年5月,国防科委在北京召开巨型机方案论证和协作会议,决定由脱胎自哈军工的国防科技大学承担巨型机研制任务,中国超级计算机的研发正式展开。


超级计算机(巨型机)规划性能为每秒1亿次浮点运算,比中国此前研制过的最先进计算机还要快一百倍,技术跨度如此之大的研制任务在计算机发展史上是极为罕见的。


要完成这样艰巨的任务,需要刻苦拼命,更需要高超的项目管理方法,在工程总指挥,曾赴美考察,实地了解过美国计算机工业的慈云桂教授带领下,研发团队选择了当时世界第一超算,美国的Cray-1作为总体架构参考,确定顶层架构后,再自上而下拆解部件、材料和设备需求,国内有的就国内配套,国内目前无法配套的,也不盲目攻关拉长战线,而是果断利用零部件进口的较宽松环境直接引进。


据项目参与人员回忆:“以前的存储器是磁芯的,做起来很难,弄起来也很慢,国际上已经有半导体的东西了,做到集成电路里面,一小块集成电路就有很大的容量,我们采取引进的思路,用了半导体存储器,这是利用了改革开放的优势。”


这一首先聚焦总体,依靠集成创新快速突破总体平台的风格,正是中国科技战略传统中“任务牵引”与“拿来主义”的具体体现,并在新世纪后,进一步凝练为集成创新“跳起”、自主创新“下蹲”的中国式科研方法论。


得益于正确的战略和得力的执行,巨型机项目仅仅历时五年就完成研制任务,较原定规划提前了整整一年,性能则完全达到设计要求,研制费用也大大低于按照进口超算报价所估计的预算,不到原先预计的五分之一,为国家节省了大量经费。


1983年12月26日,中国第一台亿次超级计算机通过国家技术鉴定,张爱萍上将将其命名为“银河一号”,这标志着中国成为继美国、日本之后,第三个能独立设计和制造超级计算机的国家,张爱萍亲自为银河巨型机工程题诗:“亿万星辰汇银河,世人难知有几多。神机妙算巧安排,笑向繁星任高歌。”


1987年,银河一号超算获得国家科技进步特等奖,同时获奖的,还有氢弹小型化工程。


中国人在巨型机项目中交出了完美的答卷,银河一号也成为八十年代科学的春天主要象征,在八十年代与两弹、人工合成胰岛素、杂交水稻、同步轨道卫星共同被列为新中国五大科技成就。


在银河一号之后,国防科大又相继完成银河二号、三号、四号、五号超算的研制,实现了运算性能从每秒亿次到十亿次,百亿次、万亿次、十万亿次的突破,特别是鲜为人知的银河五号(银河-V),计算性能与当时美国最强的超级计算机,用于完整仿真核试验的ASCI White机组已经处于同一数量级,保障了中国核心国防科学计算任务的实现,银河系列超算的迭代和打磨,也为新世纪后即将到来的“跳跃”积蓄了足够的力量。


二、来自东方的挑战者


在中国超级计算机发展渐入佳境的同一时期,曾经超级计算机领域的亚洲霸主日本,则走向了完全不同的发展轨道。


八十年代之前,美国人在超级计算机领域处于独孤求败的领跑地位,日本厂商在中低端商用计算机领域逐步站稳脚跟后,开始发力冲击这一产业高端市场。


1983年4月,日本电气(NEC)公司正式发布了SX系列超级计算机,其中的高端型号SX-2成为世界上第一台每秒运算速度超过10亿次的超算,打破了超级计算机这一产品门类诞生二十年来美国人习以为常的“老子天下第一”认知,其后,SX-2更是成功出口美国,被祖师爷的地盘上打败了本土厂商,直到1985年Cray-2超算的上市,才使美国人重新拿回“最强计算机”的荣誉。


日本超算在80年代突飞猛进的发展,代表着日本半导体高科技产业的崛起,刺激着美国人最敏感的神经,那就是对自身超凡科技能力的信念。


经过两次世界大战的荣誉浸染和盎格鲁-撒克逊民族历史神话的洗脑,普通美国人下意识地将美国的科技优势视为理所当然,是西方文明内在优越性的自发体现,也是不容下等民族玷污的英语民族荣誉象征,80年代日本在半导体领域的技术能力,强力冲击着普通美国公众的自豪感与自信心,也被视为对美国人的一种主动侵略和冒犯。


面对高科技产业的东方竞争者,美国朝野一方面加强了对相关领域的投资,在新技术与新应用上确立领导地位,另一方面则使出令人眼熟的“盘外招”操作,利用话语权优势对日本高技术产业发展进行形象的涂抹和丑化,将其竞争力解构为商业间谍、政府保护与补贴倾销的组合,从而为美国的任何回应都镀上了一层“正义性”。


1982年6月22日,美国联邦调查局特工突袭了日立公司在加利福尼亚的办公室,逮捕了6名职员,并对另外12名在日本境内的嫌疑人发布通缉令。


FBI宣称,通过其与IBM公司将近一年的密切配合,钓鱼执法,已经掌握了两家日本公司(日立、三菱)窃取IBM先进计算机技术的证据,这起轰动一时的IBM商业间谍案由此拉开了美日半导体高科技产业之争的序幕。


三天后的6月25日,暑期档星期五,一部名叫《银翼杀手》的科幻电影在全美上映,导演雷德利·斯科特描绘的未来(2019年)超级都市洛杉矶,已经深深打上了日本资本、日本技术、日本文化,乃至日本移民的烙印,这部电影缔造了赛博朋克这一全新的科幻亚文化门类,也反映出美国主流社会对日本科技与产业影响力日益增长的关注。


如果说这种关注在80年代初期还有一些超然和好奇,呈现出一种文化交流互鉴的良性势头,那么随着日本威胁论的话语塑造,这种势头很快转为对日本的警惕和敌视。


以超级计算机为代表的日本高科技产业被视为关乎美国国运的巨大威胁,1984年的总统大选中,美日贸易成为焦点议题之一,民主党候选人蒙代尔大打“贸易”牌,提出了著名的蒙代尔之问,“我们想让自己的孩子们做什么,给日本电脑擦灰么?”(“What do we want our kids to do? Sweep up around the Japanese computers?”)


美国著名经济学家李·布兰斯泰特(Lee Branstetter)曾经一针见血地指出,美日贸易冲突的根源并非经济因素,而是科学技术与工业能力:“在1980年代,美国人真的担心美国不再是科技上的领导者......我们不再拥有最好的技术,这伤害了我们的民族自豪感。”


在联邦政府的“劝告”下,包括麻省理工在内的多家美国用户取消了对日本超算的购买意向,同时,通过连续十余年、前后三次美日半导体协议的签署,直接为日本规定了越来越苛刻的半导体市场指令性计划,日本厂商不得逾越划定的范围发展,并确保美国厂商享有指定的日本国内市场份额。


通过这一系列“内外兼修”的操作,特别是得益于在美国率先实现的家用电脑和互联网技术产业化,最终成功瓦解了日本半导体产业的上升势头,重新获得了在这一领域的领导力。随着产业基础的缩水,日本超算在全球范围内的超级计算机排行榜上,也出现了明显下滑,不再具有威胁性。


日本计算机产业的折戟,一如我们上节的分析,折射出战后东亚“第二波”后发赶超范式的深刻局限性,那就是职业官僚主导的官产学共同体,难以抵御来自势能更高的政治层面压力,从而在发展到某一政治宗主国所能接受的“极限”后,面临官产学共同体的解耦,进而是发展动力的“突然休克”。


不过在历时十余年,终于“制服”了咄咄逼人的日本计算机产业后,美国人的“安全感”并没有持续多久,另一个来自东方的挑战者很快出现了。


2009年,国防科大正式对外公开了新一代千万亿次级超级计算机,由于引入了天津地方政府投资,将面向民用领域开放服务,这台原有规划中的第六代银河超算,在“天津”与“银河”中各取一字,演变为全新的“天河”系列主机。


新的天河超算甫一公布就令世界震动,天河一号的峰值性能达到每秒1206万亿次浮点运算,使中国成为美国之后,全球第二个能够制造千万亿次超算的国家,也是中国第一台进入世界超算排行榜TOP500前十位的平台。


一年之后,天河一号再次创造了历史,在天津国家超级计算中心完成安装的天河一号改进型天河-1A,或者说天河一号的“完全版”,以峰值性能每秒4700万亿次、持续性能每秒2507万亿次的数据超越美国橡树岭国家实验室的美洲豹(Jaguar)超级计算机,第一次登顶世界超算TOP500排行榜。


尽管天河一号世界第一的位置仅仅维持了半年,但已经打开了中国人的眼界与自信。2011年,在科技部的支持下,天河二号超算工程正式上马,国防科大团队这次还与商用服务器领域卓有建树的浪潮集团强强联合,将天河二号性能指标直接钉在了超算技术前沿的“无人区”。


巨大的算力往往伴随着巨大的能耗,天河二号的满负荷运转功率近24兆瓦,相当于一个两万人规模的大型居民小区高峰用电负荷。在研发天河二号的两年时间里,国防科技大学的师生们习惯了校园经常性的停电,哪怕在四大火炉之一长沙的盛夏,一旦天河二号开机高速运转,全校其他线路就会临时停电,保障天河二号供电安全,从校长到学生,都已经习惯了用电风扇代替空调。


2013年6月,天河二号超级计算机正式亮相,其峰值性能每秒5.49亿亿次、持续性能每秒3.38亿亿次的表现,甩开第二名,美国橡树岭国家实验室的“泰坦”超级计算机接近一倍,毫无争议地成为世界超算TOP500排行榜王者,由于性能太过领先,成为过去12年里,占据TOP500榜首位置时间最长的一台超级计算机。


天河二号的“破防”式表现,也吹响了中国超算产业大干快上的号角。


三、超算的未来


面对中国计算机整机领域的突破,美国人的反应非常直接,祭出了屡试不爽的干预施压动作,2015年4月,就在天河二号“改进版”试图将计算性能再次翻番的前夕,美国商务部发布公告,决定禁止向中国4家超算机构(国家超级计算长沙中心、广州中心、天津中心和国防科技大学)出售英特尔科学运算芯片,这恰好是当时国内天河计算机的四个使用单位,在美国商务部公告中,这一禁运决定理由是国防科大超算被用在了模拟核试验领域,对美国国家安全构成威胁。


然而这次对天河超算研制力量看似周密的“定点清除”式打击,并没有起到美国人预想的作用,2016年6月,天河二号超算失去了超算排行榜王座,接替它的却仍然是一台来自中国的超算:神威·太湖之光。


这台新机的持续运算性能达到每秒9.3亿亿次,是天河二号的三倍,性能提升的同时,太湖之光的峰值功率较天河二号则低了将近10兆瓦,使这台超算的能效也进入全球前列。


更重要的是,神威·太湖之光没有使用美国CPU、GPU部件,而是使用自主知识产权的SW26010处理器,美国的制裁长臂已经“鞭长莫及”。


除了性能极限的刷新,超级计算机系统架构与工程实现的技术知识与诀窍,在中国计算机产业界持续扩散,带动了这一产品门类的“大干快上”,也在很短时间内改变了TOP500超算榜单的整体面貌,神威·太湖之光接力天河二号的同时,TOP500超算榜单上榜的中国超算一共达到了167台,超过了美国的165台,这是此前没有任何一个国家实现过的成就,即便在日本计算机产业的巅峰时期,超算版图上美国依然占据着绝对份额。


上榜的这167台中国超算,已经几乎是清一色的国产品牌,而仅仅在10年前,中国市售高性能计算机的大部分份额还属于惠普、IBM等国外厂商。


榜单上标注的中国超算还不是产业影响力的全部,在媒体聚光灯之外,中国厂商在国际超算市场上,也已经不经意间建立了绝对竞争力,以2020年6月TOP500榜单为例,安装地在中国的超算达到226套,美国以114套的悬殊差距排名第二,如果进一步统计各国超算的生产地,则仅仅三家中国厂商(联想、浪潮、曙光)就制造了榜单上超过60%的超算设备,中国超算产业在全球市场已经建立起了统治性份额,这种产业版图翻天覆地的变化,比榜首位置的争夺影响更为深远。


中国人一旦突破了关键技术的制约,艰苦岁月形成的“算力不足恐惧症”就好像要在一代人里找补回来,不把超算“白菜化”不罢休。


从更宽广的视野上看,超级计算机乃至更广泛的中国终端计算设备产业后发赶超历程,与其他本系列文章中已经或将要切入的案例有着许多鲜明的共性,普遍经历了“前30年”科研生产体系在任务牵引下的成型期;八九十年代接入世界市场后,发展战略、产业格局与具体技术的“再学习”期;以及其后新世纪以来,中国特色发展战略与巨大产业体量相互促进,突飞猛进的崛起期。


遍地开花的超级计算中心,使“算力”在中国实现了低成本与可及性。这一新经济“生产要素”上中国构建的优势,已经显示出在传统工业的数字化转型和新型产业崛起上的重大价值。


传统工程发展流程里,试制与试验往往成为创新的“死亡之谷”,高风险、高难度、高成本的验证测试环节,往往一两次失败就会打断一个技术领域的发展步调,而通过在计算机数字环境中的大量模拟和仿真,可以极大压缩真实物理环境下的试验开发周期,提高科研与工程效率,而传感器、网络与算力的融合,也正形成“数字孪生”这一制造业与公共管理的热门演进方向。


本节最后,还有一个超算领域的问题值得探讨,那就是,超算的性能是否已经随着摩尔定律减速,逼近极限?


在《三体》第二部《黑暗森林》中,刘慈欣借面壁人希恩斯的剧情,推演了超级计算机的未来发展,他对当红的量子计算、生物计算概念表达了悲观看法,反而设想通过用一千亿个微处理器一对一模拟人类大脑的神经元,再将如此大规模的模拟神经元联网,实现不可思议的性能跨越,在智子锁死了基本物理知识,摩尔定律又接近失效的情况下,强行压榨出传统计算机的最后一些潜力,创造出一个可以模拟人类大脑宏观活动,性能超越现有超算一万倍的超级计算机。


在创造这一奇迹的同时,研制者希恩斯的伴侣山杉惠子一边感慨“能从摩尔定律这个柠檬里又榨出这么多汁来”,一边哀叹电子计算机已经发展到了进无可进的绝处,“亲爱的,这次真的到头了。”


超算的未来真的会是这样一幅图景么?


今天,TOP500超算排行的榜首位置是日本制造的富岳(Fugaku),通过采用ARM架构处理器的低功耗优势,实现更高密度CPU布置,其运算性能达到了每秒浮点运算44亿亿次,超算竞赛的下一个目标是EFlops/E级机,即每秒百亿亿次运算性能的超算,目前中国同时有至少三台E级超算原型机进入测试,美国人同样想要争夺这一桂冠,在美国能源部主导下,也有三台E级超算处于不同研制阶段,TOP500榜首的争夺在2020年代显然并未沉寂,而是正在进一步加速。


向更远的未来展望,不能不说,尽管各种悲观的预期不绝于耳,例如硅基半导体是否发展到了物理极限,可怜的摩尔定律年关难过年年过......但作为集成平台的超级计算机,仍然还有着巨大的性能增长空间,刘慈欣所设想的“一万倍”性能增长完全有可能实现,除了CPU本身的制程和架构进步,先进封装技术、并行计算算法、电源制冷技术,乃至低延时网络的发展,都会为超算总体性能释放出新的增长余地。


在这个新的渐进创新竞赛中,中国企业已经展现出了令人眼前一亮的创新能力。正如煤炭成本得天独厚的优势,帮助英国占据了第一次工业革命的制高点,以超算为代表的中国计算机产业,已经并在继续构建的“算力”要素比较优势,在新的工业变革中,也值得观察者报以乐观的预期。


本文来自微信公众号:科工力量 (ID:guanchacaijing),作者:青岚

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定