IBM下一代Z系列处理器''Telum'':或展示了CPU缓存的未来
认证:电脑优质原创作者
本文有1000个文字,大小约为5KB,预计阅读时间3分钟
在上个月举行的HotChips 33上,IBM公布了其下一代Z系列处理器“Telum”。这款处理器采用了全新的内核架构,针对AI加速做了优化。其配置了8核16线程,频率超过5GHz,采用了三星7nm工艺制造,核心面积为530平方毫米,集成了225亿个晶体管,拥有全新的分支预测、缓存和多芯片一致性互连。
IBM的Z系列处理器以拥有大型L3缓存而出名,并有单独的全局L4缓存,可作为多个处理器之间的缓存。不过在Telum上,不但没有了L4缓存,而且L3缓存也没有了。要知道无论英特尔还是AMD,现在都尽可能增大L3缓存容量或增加L4缓存以提高性能,比如在AMD采用3D垂直缓存(3D V-Cache)技术的Zen 3架构桌面处理器,为每个CCD带来额外的64MB 7nm SRAM缓存。
近日,Anandtech发表了一篇文章,讨论了Telum的缓存架构。
现代的处理器普遍都有多级缓存,至于为什么会这样,可以看我们《超能课堂(133):为什么CPU缓存会分为L1、L2、L3?》大概了解一下。简单来说,越靠近执行端口的缓存越小但越快(比如L1),缓存越多且越大那么访问所需的周期就越长(比如L3)。缓存除了大小,延迟也很重要,通常缓存越大延迟越大,缓存命中率也会更低。
为了更有效利用缓存,芯片设计公司需要分析这款处理器将用于哪方面的工作负载,以提高设计的效率。IBM的产品一般都是大型主机使用,大多是政府或银行这样的客户,对安全性和稳定性极高,这些产品都有故障安全和故障转移功能。
IBM在上一代Z15产品上,基本单元是一个由五个模块构成的系统,其中四个是计算模块(CP),一个是控制模块(SC)。四个计算模块每个有12个内核和256MB共享的L3缓存,核心频率为5.2 GHz,面积为696平方毫米。四个计算模块两两配对,各自与控制模块相连。控制模块拥有960MB的L4缓存,并与四个计算模块共享。Z15采用了IBM和GlobalFoundries联合研发的14nm FinFET SOI特殊工艺制造,L1和L2缓存与核心频率一样都是5.2 GHz,L3和L4缓存则是半速的2.6 GHz。
这意味着单个IBM Z15系统是25块696平方毫米的芯片组成,共有20 x 256MB的L3 缓存,还有5 x 960MB的L4缓存,以全对全拓扑连接。
IBM没有将新一代产品称为Z16,而且称为Telum,可能是因为对缓存的采用了不同的处理方法。Telum采用三星7nm工艺制造,单芯片拥有8个核心。IBM将两个芯片封装在一起,将四个同样封装的处理器组成一个单元,然后将四个同样的单元组成一个系统,整个系统共有32个芯片和256个核心。
IBM为每个核心配置了32MB的L2缓存,这比一般的处理器大得多,而且取消了核心之间共享的L3和L4缓存。一般来说,这样的设计会使得缓存有很高的访问延迟。IBM采取的方法是,通过私有物理缓存里打造共享虚拟缓存的方法解决,意思是将平时需要放置在L3缓存里的部分标记为L3缓存线存在不同核心空余的L2缓存里。
L2和L3缓存在物理上是一致的,可以根据工作负载的需要,包含来自不同核心的L2和L3缓存线的混合数据。这意味着一个芯片8个核心里,8 x 32MB共256MB的L2缓存也可以视为“虚拟”L3缓存,采用双向环形互连拓扑结构。
相似的方法IBM也用在了原来的L4缓存上,L2缓存里也可以容纳L4缓存线。从单个核心的角度来看,在一个基于Telum打造标准的系统,可以访问32MB的L2缓存,256MB的共享虚拟L3缓存,以及8GB的共享L4缓存。IBM表示,使用这种虚拟缓存的系统,每个核心的缓存相当于Z15的1.5倍,而且还改善了数据访问的平均延迟,性能提高了40%以上。
在具体运行中如何降低延迟和保证命中率是一个非常复杂的操作,加上功耗、缓存在断电和空闲等状态下如何保证单核心工作负载的一致性,这都是IBM需要考虑的问题。可以思考一下,如果AMD使用3D V-Cache技术堆叠的不是L3缓存,而是L2缓存,同样采取虚拟L3缓存线的方式,这样的微架构对性能会有怎样的影响?
其他人还看了
华硕推出新一代ROGRyuoIII240/360ARGB“龙王”水冷散热器1799元起
IBM推出AI处理器AIU:采用5nm工艺,包含230亿个晶体管
降温降功耗,性能还涨了?手把手教你简单优化Ryzen锐龙7000CPU!
郑重声明:本文“IBM下一代Z系列处理器''Telum'':或展示了CPU缓存的未来”,https://nmgjrty.com/diannao_405202.html内容,由吕嘉俭提供发布,请自行判断内容优劣。
- 全部评论(0)
- 千元级小钢炮,畅爽游戏兼顾生产力,华硕VG249Q1A
- 男朋友说用这个显示器打游戏好爽!
- 小米显示器,性价比还是挺高的
- 自媒体最佳拍档,这块飞利浦高清显示器我不信你不心动!
- 告别平庸的硬盘底座!OIRCO这款“集装箱”,速度快玩法超多
- W4K显示器
- 朗科(Netac)NV70001TPCIe40SSD固态硬盘测试
- Linus考虑让Linux内核放弃支持英特尔80486处理器
- 13代i7暴打12代i9!憋屈太久了,牙膏厂疯起来真的挺吓人
- 超高性价比的选择,锐可余音“夏至”三件套之CX5电竞声卡体验
- 印度电信运营商推出首款笔记本JioBook,运行基于安卓的JioOS
- 225元的105寸一线通便携屏SurfaceGO2同款屏幕
- 矿难确定不当回开扎古的真男人么
- 爆料称英特尔13代酷睿移动处理器将有i7-13620H和i5-13420H
- 闲置固态硬盘的完美解决方案!奥睿科USB40固态硬盘盒实测分享
- 华硕推出新一代ROGRyuoIII240/360ARGB“龙王”水冷散热器1799元起
最新更新
- 千元级小钢炮,畅爽游戏兼顾生产力,华
- 男朋友说用这个显示器打游戏好爽!
- 小米显示器,性价比还是挺高的
- 自媒体最佳拍档,这块飞利浦高清显示器
- 告别平庸的硬盘底座!OIRCO这款“集装箱
- W4K显示器
- 朗科(Netac)NV70001TPCIe40SSD固态硬盘测试
- Linus考虑让Linux内核放弃支持英特尔80486处
- 13代i7暴打12代i9!憋屈太久了,牙膏厂疯
- 超高性价比的选择,锐可余音“夏至”三
- 印度电信运营商推出首款笔记本JioBook,运
- 225元的105寸一线通便携屏SurfaceGO2同款屏幕
- 矿难确定不当回开扎古的真男人么
- 爆料称英特尔13代酷睿移动处理器将有i
- 闲置固态硬盘的完美解决方案!奥睿科
推荐阅读
- IBM推出AI处理器AIU:采用5nm工艺,包含230亿个晶体管
- 电脑CPU占用率过高的原因
- 电脑CPU超频之后蓝屏了要怎么办
- CPU的常见故障要怎么处理
- CPU故障的几种解决方法
- CPU与主板如何合理搭配?intel九代CPU/AMD三代CPU与主板搭配对照表
- CPU或显卡的供电为什么都选择2-4根12v甚至更多?
- DIY硬件知识:CPU和显卡哪个更重要?CPU和显卡怎么搭配才算合理?
- ES版、QS版与正式版是什么意思 散装CPU ES版、QS版和正式版的区别
- 台式机cpu什么牌子好?台式电脑CPU品牌排行榜
- 电脑CPU如何选购?台式机CPU知识扫盲和选购建议
- 怎么看CPU是几代的?intel和AMD怎么区分CPU是第几代的方法
猜你喜欢
- [其他电脑外设]真不是凡尔赛,花了大几千更新的摄影配件才算是专业级别的刚
- [键盘]码字成乐趣真香键盘还是樱桃CHERRYMX10机械键盘
- [无线键盘]精致主义者的必备良品,IKBCS300“奶糖”系列无线键盘体验
- [服务器]联想服务器份额升至全球第三,一季度营收增长349%
- [iPad]是买iPadPro2021还是等iPadPro2022?
- [机箱]ITX装机初体验
- [机箱]机箱界的铝厂,支持240水冷与长显卡的乔思伯V8ITX机箱装机点评
- [机箱]安钛克驱逐者DF600FLUX
- [机箱]Thermaltake发布Divider300TG机箱
- [机箱]Zen3架构基础款单核锤爆10900K?AMD锐龙55600X评测
- [机箱]也许是最小MATX主机的完美走线
- [机箱]30系列已到,机电有升级的必要吗?
- [机箱]女王的ITX新电脑上篇之复刻lousuITX机箱
- [机箱]最小ATX乔思伯RM2及风道改造
- [机箱]bequiet!德商必酷发布PureBase500DX机箱