打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
带你了解CPU、GPU、TPU和DPU

“不同的芯片适用于不同的计算任务”

1930年,第一台计算机

第一台真正的可编程计算机是康拉德·宙斯于1930年在他母亲的地下室里制造的,但它在1943年轰炸柏林期间被炸毁了。它完全是机械的,有20000多个零件。用滑动金属片表示二进制数据,它可以做一些事情 比如计算代数和浮点数,并且有1赫兹的时钟频率,这意味着它可以每秒执行一条指令。

现代计算机的基础:冯诺依曼结构

在1945年,我们得到了冯·诺依曼结构。今天,它仍然在现代芯片上使用。它是设计的基础,描述了数据和指令如何存储在同一内存空间中,然后由处理单元处理。

1947年发明晶体管

几年后,晶体管的发明带来了巨大的突破。这是一种可以放大或切换电信号的半导体。晶体管可通过电流的通断来代表1和0。这对于计算机来说,是一个巨大的进步。

1971年,英特尔推出第一个处理器

然后在1958年,集成电路被开发出来,允许在单个硅芯片上放置多个晶体管。最后,在1971年,英特尔发布了第一个商用微处理器。它具有现代cpu的所有功能。这是一个4位处理器,这意味着它可以一次处理4位数据。计算速度为740KHz,内部集成了大约2300个晶体管。这在当时是非常快的。

CPU适合逻辑相关的计算

CPU中央处理器就像是计算机的大脑。它运行操作系统、执行程序、并管理硬件。它能访问系统ram,并包括芯片本身的缓存层次结构,以便更快地检索数据。CPU针对需要大量分支和逻辑的顺序计算进行了优化。例如,一些导航软件需要运行算法来计算两点之间的最短可能路线。该算法可能有许多条件逻辑 例如,if else语句,这些只能逐个或按顺序计算。CPU非常适合这种类型的工作。

多核CPU的上限:24核

现代的CPU有多个内核,允许它们并行工作。允许同时在pc上使用多个应用程序。随着规模的扩大 CPU内核的成本越来越高,功耗和散热要求也是如此。24核通常是现在高端芯片的上限,如苹果的M2 Ultra和英特尔i9。但也有像128核AMD Epyc这样专为数据中心设计的大型芯片。

CPU的架构

CPU有多种不同的架构,但现在应用最多的是ARM和X 86。64位的X86在大多数现代台式电脑都会应用。而ARM更多的用到移动设备上,因为它有更简化的指令集和更好的能效,这意味着更长的电池寿命。

ARM架构越来越受欢迎

在过去几年中,苹果已经证明了arm架构也可以在笔记本电脑和台式机上进行高性能计算,甚至微软也在投资用ARM运行Windows。此外,ARM在云提供商中越来越受欢迎,比如Neoverse芯片或亚马逊的Graviton 3。它可以让云以更低的功耗计算更多的东西,而能耗是数据中心最大的开支之一 。

GPU专精图像处理

即使是多核CPU也很难计算游戏中所有灯光和阴影的外观,这就是 GPU 的用武之地。
图形处理单元(显卡)针对并行计算进行了高度优化。与只有24个核的CPU不同,英伟达的RTX4080拥有近10000个核心.这些内核中的每一个都可以在每个周期处理浮点或整数计算。这使得每次按下控制器上的按钮时,游戏可以并行执行大量线性代数,来立即渲染图形。

GPU对AI模型至关重要

GPU 对于训练在大型数据集上执行大量矩阵乘法的深度学习模型也至关重要。这导致了GPU市场的巨大需求,英伟达的股价最近也一飞冲天。

GPU无法取代CPU

尽管GPU有很多内核,但它无法全面取代CPU。单个CPU核心比单个GPU核心快得多。CPU的架构可以处理复杂的逻辑和分支,而GPU仅设计用于简单计算。世界上的大多数代码都可以利用并行计算,并且需要使用单个线程按顺序运行。

2016,谷歌推出TPU

谷歌专门为AI训练设计了硬件,称为TPU或张量处理单元。这些芯片与 GPU 非常相似,但专为张量运算(例如深度学习所需的矩阵乘法)而设计。他们由谷歌在2016年推出,直接与其Tensor Flow软件架构集成 。

TPU使用乘法累加器,加速AI训练

TPU包含数千个称为乘法累加器的东西,它允许硬件执行矩阵乘法,而不需要像GPU那样充当寄存器或共享存储器。如果你有一个需要几周或几个月来训练的神经网络,TPU可以为你节省数百万美元。

未来计算的第三大支柱:DPU

最新类型的芯片是DPU,即数据处理单元。英伟达的首席执行官将其描述为未来计算的第三大支柱。但你可能永远不会在自己的计算机中使用它,因为它们是专门为大数据中心设计的。

DPU专为移动数据处理而设计

它们架构接近CPU,通常基于arm架构,但针对移动数据进行了高度优化。它们处理数据包处理路由和安全等网络功能,还处理压缩和加密等数据存储。主要目标是将CPU从任何数据处理任务中解放出来,从而专注于处理通用计算任务。

不同架构适用不同任务

不同的芯片架构适用于不同的计算任务,未来计算将依赖这几个架构的充分组合。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
越来越卷的AI,“X”PU的各有所长
浅谈CPU,GPU,TPU,DPU,NPU,BPU
大人,时代变了!英伟达推出ARM架构CPU,性能10倍领先
GPU高功耗软肋已成最大危机?“AI 硅脑”迎来战国时代,GPU十年霸业将遭“围剿” | 独家观点
大芯片面临的共同挑战
陈根:DPU蔚然成风,搅动传统计算体系
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服