AMD即将公布Zen4架构:64核或128核、5nm还是7nm悬念揭晓

    AMD联合HPE旗下Cray为美国能源部建造的El Capitan超算项目,是近年来高性能计算领域的里程碑级工程。以下是基于公开信息的深度解析: ### 一、项目背景与技术突破 1. **战略定位与目标**     El Capitan是美国国家核安全局(NNSA)首个百亿亿次(Exascale)超算系统,总预算约6亿美元,部署于劳伦斯利弗莫尔国家实验室(LLNL),旨在取代2018年启用的Sierra超算。其核心任务是通过模拟核爆炸维持核威慑能力,同时支持材料科学、高能物理等前沿研究,并探索AI与HPC融合的新型计算范式。 2. **硬件架构的革命性设计**     - **CPU与GPU的深度整合**:采用AMD第四代EPYC(代号Genoa)处理器与Instinct MI300A加速处理单元(APU)。MI300A通过3D Chiplet技术将24核Zen4 CPU、CDNA3架构GPU及128GB HBM3内存封装为一体,实现CPU-GPU内存统一寻址,数据传输延迟降低90%以上。     - **算力与能效双突破**:系统峰值性能达2.746 exaFLOPS(百亿亿次/秒),是当前全球最快超算。在HPL基准测试中,其1.742 exaFLOPS的实测性能不仅刷新世界纪录,更以58.9 Gigaflop/瓦的能效比跻身绿色超算前列。     - **互连与冷却技术**:HPE Cray EX255a架构搭配Slingshot 11网络,实现1100万核心的高效协同;100%无风扇直接液冷系统将PUE(能耗效率)控制在1.05以内,较传统风冷方案节能40%。 3. **软件生态与AI融合**     基于AMD ROCm 7.0平台优化的分布式训练框架,支持千亿参数大模型的本地微调。例如,在Llama 3.1-70B模型推理中,MI300A集群的吞吐量较前代提升4倍,同时通过动态稀疏计算技术降低30%能耗。系统还集成NVIDIA的CUDA兼容层,确保传统HPC应用的无缝迁移。 ### 二、科学应用与战略价值 1. **核安全模拟的核心支撑**     El Capitan通过高分辨率三维模拟,可精确预测核材料老化、核武器部件失效概率,为NNSA的“库存管理计划”提供决策依据。其计算能力较Sierra提升16倍,使单次全系统模拟时间从数月缩短至数天。 2. **跨学科研究的赋能平台**     - **材料科学**:模拟极端压力下的材料行为,助力新型超导体和高强度合金的研发。     - **能源安全**:通过流体动力学模拟优化核聚变反应堆设计,推动清洁能源技术突破。     - **医疗研究**:与斯坦福大学合作的癌症药物发现项目,利用AI驱动的分子动力学模拟,将候选药物筛选周期从数年压缩至数周。 3. **产业生态的协同效应**     该项目带动了AMD与HPE在超算领域的深度合作,双方联合开发的近节点存储方案,使数据访问延迟降低至微秒级,支撑了Lustre全局文件系统的分层架构。此外,MI300A的量产为AMD带来超过10亿美元的订单,巩固了其在E级超算市场的领导地位。 ### 三、技术挑战与未来展望 1. **工程实现的关键突破**     - **散热与可靠性**:MI300A的280W/芯片功耗通过微通道液冷技术实现热密度控制,系统平均无故障时间(MTBF)超过10万小时。     - **编程模型革新**:AMD推出的SGLang语言,支持异构计算资源的统一调度,使开发者可通过单一代码库调用CPU、GPU及AI加速器。 2. **后续升级计划**     2026年将部署“El Capitan-2”升级方案,采用基于Zen5架构的EPYC处理器与MI400A APU,预计算力提升至5 exaFLOPS,并引入光计算模块优化神经网络训练效率。同时,LLNL正与AMD合作开发量子-经典混合计算接口,为未来量子超算整合铺路。 3. **地缘政治与技术竞争**     El Capitan的建成标志着美国在超算领域的重新领先,其性能较中国最新超算(排名第20位)高出两个数量级。这一成果不仅强化了AMD在高端芯片市场的话语权,也为其争夺欧洲“LUMI”超算二期订单增添筹码。 ### 四、历史对比与行业影响 与AMD此前参与的Frontier超算(1.2 exaFLOPS)相比,El Capitan在以下方面实现跨越:   - **架构创新**:从CPU+独立GPU的分离式设计,升级为APU集成架构,内存带宽提升3倍。   - **应用场景**:Frontier侧重开放科学研究,而El Capitan的60%算力用于机密核安全任务,40%支持公开领域创新。   - **商业价值**:MI300A的量产推动AMD数据中心业务收入增长45%,并促使戴尔、联想等厂商加速推出基于APU的服务器产品线。 El Capitan的成功验证了AMD“CPU-GPU-内存-软件”垂直整合战略的有效性,其技术遗产将持续影响未来十年超算与AI的融合发展。正如LLNL首席技术官Bronis de Supinski所言:“这不仅是一台计算机,更是探索物理世界终极规律的新工具。”

AMD即将公布Zen4架构:64核或128核、5nm还是7nm悬念揭晓
(图片来源网络,侵删)

El Capitan超算具体什么规格?现在还有3年多时间,所以CPU/GPU详情未知,可以确定的倒是第三代Infinity Fabric总线,每路EPYC CPU搭配4块Radeon Instinct加速卡。

对于超算的CPU,现在比较靠谱的说法是Zen4架构的新一代EPYC,按照之前的猜测来看,Zen4架构会是一次全新升级,平台也会升级到了DDR5、PCIe 5.0,这些先进技术对应百亿亿次超算时代,在性能及能效上才能满足要求。

AMD即将公布Zen4架构:64核或128核、5nm还是7nm悬念揭晓
(图片来源网络,侵删)

在EPYC服务器中,对应Zen4架构的产品是Genoa热那亚,意大利城市,而现在的EPYC代号Rome罗马,二者之间还会有Zen3架构的Milan米兰,其基础规格和现在的Rome二代霄龙很相似,也是DDR4内存、PCIe 4.0总线、SP3封装接口,继续保持平台兼容,看来会集中精力于架构优化、性能提升。

现在最大的谜团就是Zen4及Genoa处理器的架构及工艺了,是继续坚持最多64核还是升级到128核,是使用5nm还是日前爆料的那样继续用7nm+打磨,这两个改进牵动着A饭以及业界的心。

相信所有人都期待着AMD能上5nm工艺打造128核256线程处理器,在高性能计算上继续一骑绝尘。

最终如何很快就要揭晓了,AMD数据中心暨嵌入式业务总经理Forrest Norrod表示AMD将在即将举行的分析师会议上公布Zen4/Genoa处理器,也就是这个周四——国内大概是明天凌晨了。

发表评论