AMD即将公布Zen4架构：64核或128核、5nm还是7nm悬念揭晓

AMD联合HPE旗下Cray为美国能源部建造的El Capitan超算项目，是近年来高性能计算领域的里程碑级工程。以下是基于公开信息的深度解析： ### 一、项目背景与技术突破 1. **战略定位与目标** El Capitan是美国国家核安全局（NNSA）首个百亿亿次（Exascale）超算系统，总预算约6亿美元，部署于劳伦斯利弗莫尔国家实验室（LLNL），旨在取代2018年启用的Sierra超算。其核心任务是通过模拟核爆炸维持核威慑能力，同时支持材料科学、高能物理等前沿研究，并探索AI与HPC融合的新型计算范式。 2. **硬件架构的革命性设计** - **CPU与GPU的深度整合**：采用AMD第四代EPYC（代号Genoa）处理器与Instinct MI300A加速处理单元（APU）。MI300A通过3D Chiplet技术将24核Zen4 CPU、CDNA3架构GPU及128GB HBM3内存封装为一体，实现CPU-GPU内存统一寻址，数据传输延迟降低90%以上。 - **算力与能效双突破**：系统峰值性能达2.746 exaFLOPS（百亿亿次/秒），是当前全球最快超算。在HPL基准测试中，其1.742 exaFLOPS的实测性能不仅刷新世界纪录，更以58.9 Gigaflop/瓦的能效比跻身绿色超算前列。 - **互连与冷却技术**：HPE Cray EX255a架构搭配Slingshot 11网络，实现1100万核心的高效协同；100%无风扇直接液冷系统将PUE（能耗效率）控制在1.05以内，较传统风冷方案节能40%。 3. **软件生态与AI融合** 基于AMD ROCm 7.0平台优化的分布式训练框架，支持千亿参数大模型的本地微调。例如，在Llama 3.1-70B模型推理中，MI300A集群的吞吐量较前代提升4倍，同时通过动态稀疏计算技术降低30%能耗。系统还集成NVIDIA的CUDA兼容层，确保传统HPC应用的无缝迁移。 ### 二、科学应用与战略价值 1. **核安全模拟的核心支撑** El Capitan通过高分辨率三维模拟，可精确预测核材料老化、核武器部件失效概率，为NNSA的“库存管理计划”提供决策依据。其计算能力较Sierra提升16倍，使单次全系统模拟时间从数月缩短至数天。 2. **跨学科研究的赋能平台** - **材料科学**：模拟极端压力下的材料行为，助力新型超导体和高强度合金的研发。 - **能源安全**：通过流体动力学模拟优化核聚变反应堆设计，推动清洁能源技术突破。 - **医疗研究**：与斯坦福大学合作的癌症药物发现项目，利用AI驱动的分子动力学模拟，将候选药物筛选周期从数年压缩至数周。 3. **产业生态的协同效应** 该项目带动了AMD与HPE在超算领域的深度合作，双方联合开发的近节点存储方案，使数据访问延迟降低至微秒级，支撑了Lustre全局文件系统的分层架构。此外，MI300A的量产为AMD带来超过10亿美元的订单，巩固了其在E级超算市场的领导地位。 ### 三、技术挑战与未来展望 1. **工程实现的关键突破** - **散热与可靠性**：MI300A的280W/芯片功耗通过微通道液冷技术实现热密度控制，系统平均无故障时间（MTBF）超过10万小时。 - **编程模型革新**：AMD推出的SGLang语言，支持异构计算资源的统一调度，使开发者可通过单一代码库调用CPU、GPU及AI加速器。 2. **后续升级计划** 2026年将部署“El Capitan-2”升级方案，采用基于Zen5架构的EPYC处理器与MI400A APU，预计算力提升至5 exaFLOPS，并引入光计算模块优化神经网络训练效率。同时，LLNL正与AMD合作开发量子-经典混合计算接口，为未来量子超算整合铺路。 3. **地缘政治与技术竞争** El Capitan的建成标志着美国在超算领域的重新领先，其性能较中国最新超算（排名第20位）高出两个数量级。这一成果不仅强化了AMD在高端芯片市场的话语权，也为其争夺欧洲“LUMI”超算二期订单增添筹码。 ### 四、历史对比与行业影响与AMD此前参与的Frontier超算（1.2 exaFLOPS）相比，El Capitan在以下方面实现跨越： - **架构创新**：从CPU+独立GPU的分离式设计，升级为APU集成架构，内存带宽提升3倍。 - **应用场景**：Frontier侧重开放科学研究，而El Capitan的60%算力用于机密核安全任务，40%支持公开领域创新。 - **商业价值**：MI300A的量产推动AMD数据中心业务收入增长45%，并促使戴尔、联想等厂商加速推出基于APU的服务器产品线。 El Capitan的成功验证了AMD“CPU-GPU-内存-软件”垂直整合战略的有效性，其技术遗产将持续影响未来十年超算与AI的融合发展。正如LLNL首席技术官Bronis de Supinski所言：“这不仅是一台计算机，更是探索物理世界终极规律的新工具。”

（图片来源网络，侵删）

El Capitan超算具体什么规格？现在还有3年多时间，所以CPU/GPU详情未知，可以确定的倒是第三代Infinity Fabric总线，每路EPYC CPU搭配4块Radeon Instinct加速卡。

对于超算的CPU，现在比较靠谱的说法是Zen4架构的新一代EPYC，按照之前的猜测来看，Zen4架构会是一次全新升级，平台也会升级到了DDR5、PCIe 5.0，这些先进技术对应百亿亿次超算时代，在性能及能效上才能满足要求。

（图片来源网络，侵删）

在EPYC服务器中，对应Zen4架构的产品是Genoa热那亚，意大利城市，而现在的EPYC代号Rome罗马，二者之间还会有Zen3架构的Milan米兰，其基础规格和现在的Rome二代霄龙很相似，也是DDR4内存、PCIe 4.0总线、SP3封装接口，继续保持平台兼容，看来会集中精力于架构优化、性能提升。

现在最大的谜团就是Zen4及Genoa处理器的架构及工艺了，是继续坚持最多64核还是升级到128核，是使用5nm还是日前爆料的那样继续用7nm+打磨，这两个改进牵动着A饭以及业界的心。

相信所有人都期待着AMD能上5nm工艺打造128核256线程处理器，在高性能计算上继续一骑绝尘。

最终如何很快就要揭晓了，AMD数据中心暨嵌入式业务总经理Forrest Norrod表示AMD将在即将举行的分析师会议上公布Zen4/Genoa处理器，也就是这个周四——国内大概是明天凌晨了。