打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
苹果M1 Ultra真的能超越酷睿i9和RTX 3090吗?

在苹果春季发布会展示性能的环节,苹果没有让人失望,展示了M1的最后一个版本,也是一个让人有些意外的版本,M1 Ultra。如果说异构系统在业内其实不足为奇,那么在消费端大规模批量生产多芯片互联产品确实罕见。特别是当我们认为台积电N5工艺在苹果M1芯片发挥下接近极限的时候,苹果通过扩大芯片面积让我们看到了一个新可能性。

毫无疑问的是,M1 Ultra将会成为近段时间最有意思的消费级SoC之一,它不仅仅与市售的消费级SoC都不一样,同时也展示出了在CPU、GPU多线程性能的另外一场豪赌。在这场赌注中M1 Ultra应该被报以什么样的期望?现在不妨让我们来讨论一番。

M1 Max乘以2

M1 Ultra本质上就是2个M1 Max的管芯连接,从而实现1140亿个晶体管,要知道曾经最大消费芯片的NVIDIA GeForce RTX 3090的GA102也仅包含283亿个晶体管,不得不感叹技术的极速进步。

由于M1 Max基本架构其实相当明了,在M1 Ultra的宣传上其实也没有增加任何新功能描述,苹果只强调了M1 Ultra能够允许程序员将其当成1个芯片来对待,从而避免了多芯片在程序上调用的麻烦。

双M1 Max叠加似的M1 Ultra的纸面参数几乎完全翻了一倍,包括两倍的CPU内核,两倍的GPU内核,两倍的神经网络以及两倍的LPDDR5通道,I/O外围也直接乘以2。

以CPU为例,M1 Ultra拥有20个CPU内核,包括16个性能核心Firestorm和4个效率核心Icestorm。考虑到目前M1 Ultra只运用在台式机中,效能核心在Mac Studio上发挥的作用并不大,但仍然能在一定程度上帮助CPU增加吞吐量。

M1 Ultra的发布事实上也按照了苹果一如既往的风格,它没有披露时钟频率,但鉴于在台式机的使用,以及足够的空间散热,M1 Ultra完全有能力将频率再提升一档。但需要注意的是多个Firestorm内核的吞吐量虽然在某些领域名列前茅,但被证明并不擅长单线程工作负载。在架构上,Firestorm也要落后于英特尔的Golden Cove,因此苹果会一如既往的强调在多线程领域,特别是视频编辑领域优与对手。

由于芯片数量乘以2,也意味着M1 Ultra的内存通道数量翻倍,以及内存带宽翻倍。M1 Max拥有16个LPDDR5-6400内存,通过与M1 Ultra封装在一起实现,并最终带来了128GB的内充容量。相对于定位高端工作站Mac Pro而言,这样的容量其实还远远不够,但对于非好莱坞专业型内容创作群体而言,能满足绝大部分情况需求了。

由于M1 Max已经提供了足够大的带宽,双倍带宽可能并不会对CPU实际性能产生太大的影响,相反,对数量翻倍达到64个GPU内核而言,会有不少提升。

在工作站数十年的发展历史中,我们经常能看到多GPU配置糖厂会消耗大量的内部带宽,反倒使得1+1的表现通常只有1.5,其中主要原因是每个GPU都会被当成一个独立的硬件来对待,软件团队需要自行寻找同时使用2个GPU的方法,无异于增加了软件的开发成本。而如果让多个GPU以统一的方式与软件对接,效率自然会提升很多,这也正是苹果在软硬件上同时把控所带来的优势。

事实上,在M1 Ultra之前,已经有很多种方案尝试解决多GPU之间的沟通和调用问题,但从目前看来,苹果M1 Ultra是第一个量产这个想法的公司。

UltraFusion连接技术:并不先进,但有效

苹果在发布M1 Ultra时候强调了2个M1 Max通过自家一个名为UltraFusion的封装架构连接在一起,在事实上属于2.5D芯片封装范畴。实现的方式是,2个M1 Max芯片下方通过一个硅介质作为中介层,以提供超精细的连接线路,在M1 Ultra中,这样的连接超过了1万条,以确保两个M1 Max的超带宽连接性能。

从视频展示的模型来看,苹果在使用某种小型的硅桥接技术,在实践上与英特尔EMIB或者EFB技术方式,后两者已经在市场中运用多年,只不过在消费级产品中比较罕见。

借助UltraFusion,苹果能够在2个M1 Max之间获得2.5TB/s的带宽,这意味着单向将拥有1.25TB/s带宽,并超过了所宣称的DRAM 800GB/s带宽。

在前面我们已经强调了苹果是第一家将2个GPU捆绑在1个SoC并拥有超高带宽的厂商,只要macOS能够与之配合,2个GPU之间的性能分配将会得到妥善的解决。但必须要清楚,两个GPU和CPU之间还是有距离的,如何实现不同内核之间的沟通响应速度,需要在实际发售后进行验证。

M1 Ultra真的超过GeForce RTX 3090了吗?

在发布会中,苹果甚至宣称了M1 Ultra的GPU性能超越了NVIDIA GeForce RTX 3090,100W的功耗表现优于RTX 3090的200W。这个说法看起来是合理的,事实上M1 Ultra投入的1140亿个晶体管也比3090的283亿个多上数倍,即便中间包含了CPU和其他元件的晶体管数量。

台积电N5工艺表现注定超过定价相对低廉的三星8nm定制工艺无疑,因此在同功耗前提下优于RTX 3090的GA102也顺理成章。但必须弄清楚一点,GeForce RTX 3090的诉求是在成本可控的前提下追求性能,并且也没有计划放在笔记本中,这也是苹果宣传手段中讨巧的地方。

对于M1 Ultra GPU的实际性能,我们至少要保留观望的态度,视觉图形计算本身也并非单一的硬件、系统能够实现,中间注定涉及整个行业链的磨合。

写在最后

自从M1发布开始,芯片的接口开始让人愈发的耳目一新。特别是当M1 Ultra不加掩饰的使用1+1=2的方式构建一个全新的产品,并且给予大多数消费者无法接受的价格的时候,不得不感叹,这样的做事风格确实很苹果。

事实上苹果成功让企业端和消费端之间原本相互隔阂的体系,制造出了一场别开生面的错位竞争,主要原因还是得益于苹果对现有市场的自信力和掌控力。

举个例子,UltraFusion的2.5D芯片封装技术实际上落后于行业的尖端水平,但这么做的好处是能在最短的时间内弥补成本和时间的空缺,在大胆想法和实际量产中间找到了一个平衡点,并让潜在人群买单,能端平这碗水并不容易。

在没有任何工艺改进的前提下,苹果在半年内用2个M1 Max构成的M1 Ultra实现了对M1 Max的超越,听起来有点粗糙,但至少从现在来看,是行之有效的。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
全球最强芯!苹果M1 Ultra横空出世:1千亿晶体管、20核击败x86 64核、GPU超越最强显卡NV 3090!
从苹果M1 Ultra的组合设计推测Apple Silicon未来处理器
芯片才是苹果的最强壁垒
选游戏本,显卡和CPU哪个才是关键?
Nvidia RTX GPU 现身 Adobe MAX,8K 视频渲染碾压 CPU
微星绝影2 GS66轻薄游戏本评测
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服