一文看懂麒麟950的技术和工艺，国产最强芯名副其实？

昨天最热闹的新闻，应该就是华为发布了最新的处理器麒麟950，这款基于ARM的4A72+4A53大小核架构、ARM Mali T880设计，基于台积电16nm FF plus（16nm FF+）生产的，搭配了自身设计的ISP，还有自身上一代基带balong 720（为什么不是最新的balong 750？）。然后媒体们又疯狂了，什么秒掉三星7420，鞭打高通820，国产希望，华为永垂不朽。基本就像我们小的时候仰慕班里考第一的那个小伙子。
当然，作为一个特立独行的小编，我不会很肤浅的像大家一样罗列一批大家看不懂的参数，然后高呼牛逼、顶、赞、威武、有希望。不如我们来看看这颗芯片所涉及的各种技术究竟如何？然后是非曲直，牛逼与否，就让大家评论吧！

CPU：A72+A53大小核架构

这是ARM最新的架构（应该还是最新吧），华为采用的也是ARM的Big.little（这个大小核不用解释了吧？）搭配，根据华为的介绍，全新Arm Cortex A72核心相比于A57性能提升11%的同时，功耗降低20%，能效比综合提升30%。

好，华为的介绍，我们就看到这里，正所谓听其言，观其行，我们现在暂时不能观其行，就看看ARM官方的介绍：

根据ARM介绍，Cortex-A72新架构预计在2016年发布，华为这就用上了。它也是ARM酝酿已久的第二代ARMv8 64位架构，据说其性能、功耗相比之前的Cortex-A57都有极大改善。ARM在路线图中甚至指出，用上最新16nm半导体工艺这颗春药后（华为就是吃了这颗春药），频率提升的Cortex-A72性能上足以媲美英特尔低频的Core M移动处理器。

来看关于A72的干货：

首先是基础架构，Cortex-A72强调的不再是堆执行单元数量，而是全面增强。从指令拾取开始，到仲裁机构、分支预测，乃至缓存和Load/Store单元，Cortex-A72的各个部件都被大大增强，提升最多的是内存子系统，幅度达50%。

ARM表示，在同频率下，Cortex-A72单个周期指令吞吐能力比Cortex-A52提升20%-60%；而如果是相同性能，则电力消费可以减少40%-60%。另外，Cortex-A72同样可以和Cortex-A53搭配，组成big.little大小核结构。

至于在效能方面，据官方介绍，在相同的智能手机电池寿命限制下，Cortex-A72 处理器相较于2014年发布基于Cortex-A15处理器、28纳米工艺节点的设备，性能可提升3.5倍；并且具备多项基于ARMv8-A架构的微架构改善，在浮点、整数和内存性能等方面提升后，可改进每一项主要工作负载的执行效率。

Cortex-A72已为16纳米FinFET工艺节点优化，在移动设备的电耗范围内可以运行达2.5GHz频率，甚至更高的效能表现。

除了效能的提高，Cortex-A72处理器在功耗上也展现了优异的成果。在代表性的高端移动工作负载条件下，结合Cortex-A72在16nm FinFET+ 工艺技术下，能够使能耗显著下降 75%。

至于小核A53，这个东西我觉得不需要详细介绍，你跑分的时候，肯定是性能要多强就来多强，没理由田忌赛马吧。但还是需要简单说明一下：

Cortex-A53 可以看做是支持 64-bit 的 Cortex-A7 调优版，具体的细节并不多，但是可以告诉大家的是，它采用的顺序架构，流水线深度为 8 级。由于 ISA 和 A57 都是一样的，所以 A53 自然也能应用于服务器环境。

在采用同样 32nmm 节点制程的时候，Cortex-A53 整数性能和浮点性能与 A9 相当，但是面积小 60%，ARM 表示面积缩小的原因只是减少了大量的缓存和数据结构尺寸同时在效率上作出改进，类似的例子见苹果的 A6X APL5598（Swift），后者只是改进了 A9 的内存界面。

这里有种缝缝补补又三年的感觉。

完全没有了当年arm11到a8，a8到a9双核的那种快感了。

评价：

华为宣称麒麟950是首个商用的A72架构产品，事实上这么说的不准确的，联发科此前推出的MT8173已经率先用上了A72架构，而且已经有产品面世了，比如亚马逊的Fire TV。如果华为能在“首个商用”前边加上定语“手机”就完美了。

这次麒麟950用上A72架构可以说是让人眼前一亮，毕竟之前麒麟920和930时代一直都是八核A53，虽然跑分尚可，但实际使用体验真的比较一般。

但越过了A57，直接上更适合于移动端的A72，这是高通和联发科都没能绕过的，值得赞一下。

GPU：ARM Mali T880 GPU

这是个有趣的选择，在K3V2上，被人诟病最多的就是GPU，各种游戏不兼容，那是哪家的来着？现在华为学聪明了，在最新的SoC上搭配了ARM的CPU和GPU。毕竟，除了苹果和高通这些业界翘楚可以把这两个架构用自己的团队玩转以外，其他厂商智能用ARM的设计，水平摆在那里。

高端移动GPU有一个重要特性，那就是在不增加电池消耗或超过设备的散热预算上，提供所需的额外计算性能。Mali-T880专为“以最低能耗提供最佳性能”而设计。除了许多微架构的优化外，这款GPU还融入了带宽缩减技术，如ARM 帧缓冲压缩（ARM Frame Buffer Compression, AFBC）、智能合成（Smart Composition）和智能消除（Transaction Elimination）。与基于Mali-T760 GPU的2014款设备相比，Mali-T880性能提高1.8倍、能效提升40%。

Mali-T880图形处理器是Mali-DP550显示处理器（DPU）和 Mali-V550 视频处理器（VPU）的理想搭档，能够满足日益成长的4K数字电视和机顶盒市场的要求。原生10位色差支持高保真4K显示，无需在软件中执行转换。这项支持确保了多媒体系统能以更低的带宽水平提供更优质的高分辨率图像。在高端设备配置中，Mali-V550 VPU完全支持高效视频编码，以更低的比特率提供压缩的高清视频。此外，借助其八核的配置，可将性能扩展至4K120帧分辨率。为了最大限度地延长电池寿命，Mali-DP550 DPU提供增强的功能，以便从GPU卸载诸如组合、缩放、旋转以及图像后期处理等任务。Mali多媒体IP套件支持高端设备配置中的 TrustZone? 安全技术，可以保护多媒体内容，为高端4K内容提供安全视频路径。

Mali-T880 GPU通过AMBA?4 Ace-Lite接口支持提供I/O一致性。硬件一致性的优点包括减少带宽、降低功耗、简化软件驱动程序、以及缩减共享数据访问延迟等。

ARM Mali-T880 GPU 完全支持当前和下一代API，实现了高级3D图形加速和GPU计算功能。这包括对OpenGL? ES 3.1/2.0/1.1的支持，如Android?扩展包、DirectX?11 FL11_2、OpenCL? 1.1/1.2 Full Profile和Android RenderScript(TM)等。它也进一步取得成熟的Mali GPU DDK支持，后者通过标准ARM商用许可，提供给所有Mali GPU客户，确保从前几代Midgard GPU轻松过渡到Mali-T880。

另外，在设计搭载ARM Cortex? 处理器和ARM Mali GPU、视频和显示处理器的系统级芯片（SoC）时，各个处理器的Android驱动程序设计能够在一起高效协作。这种优化的Android多媒体堆栈解决了处理器来自不同供应商时所带来整合与优化的难题，并且简化了Android的定期更新支持任务。通过利用ARM的预优化软件，合作伙伴可以集中精力在其解决方案的差异化上，从而让产品更快推向市场。

为Mali-T880配套的ARM POP? IP，可以进一步协助缩短产品的上市时间。ARM POP IP 是内核硬化加速技术，可以实现在最短的时间内完成最佳的ARM处理器实现，并能够灵活地针对最高性能、最低功耗或两者的任意组合进行优化。

评价：

麒麟950的GPU性能也将是跟骁龙808的Adreno 418差不多水平，比骁龙810以及Exynos 7420还相去甚远，更别提苹果的A9处理器了。

从理论上来看，之前麒麟920/930用的是Mali-T628 MP4理论浮点性能76.8GFLOPS，不过那是600MHz下的，麒麟处理器的GPU频率提升到了680MHz，如果按照官方说的浮点性能提升一倍，那么Mali-T880 MP4的浮点性能至少应该是160GFLOPS，华为将麒麟950的GPU频率提升到了900MHz，理论上会更高。

不过Mali-T880在850MHz官方建议频率下浮点性能是28.9GFLOPS，MP4的话也不过115.6GFLOPS，并没有达到华为所说的浮点性能提升100%的水平，相差很远。

制程：台积电16nm FF +

其实16FF+ 是标准 16nm FinFET 的增强版本，同样有立体晶体管技术在内，号称可比 20nm SoC 平面工艺性能提升最多 40%，或者同频功耗降低最多 50%。台积电表示，20nm 系统单芯片制程的成功经验，为下一代 16nm 与 16nm 强效版技术奠定了有利的基础，将可帮助客户在新产品的效能与成本考量上取得平衡。根据华为的介绍，在16nm FF+上，性能提升了40%，功耗降低了60%。

要了解这些工艺的提升来源，我们就有必要去了解一下FinFet工艺了（然而我是看不懂）：

FinFET技术是电子业界的新一代先进技术，是一种新型的多重闸极3D电晶体，提供更显着的功耗和效能优势，远胜过传统平面型电晶体。Intel已经在22nm上使用了称为「三闸极（tri-gate）」的FinFET技术，同时许多晶圆厂也正在准备16纳米或14纳米的FinFET制程。虽然这项技术具有巨大的优势，但也带来了一些新的设计挑战，需要整个半导体设计生态系统的广泛研发和深层协作，才能够成功。

FinFET就是场效应电晶体（FET），名字的由来是因为电晶体的闸极环绕包裹着电晶体的高架通道，或称为「鳍」。与平面电晶体相比，这种方法能够更妥善地控制电流，并同时降低漏电和动态功耗。与28纳米制程相比，16纳米/14纳米 FinFET制程可以提高40-50％效能，或减少50％功耗。有些晶圆厂会直接在16纳米/14纳米上采用FinFET技术，有些晶圆厂为了更容易转移到FinFET技术，会让高层金属维持在20nm。

FinFET设计挑战

和其他新技术一样，FinFET也引起了一些设计挑战，对客制/模拟设计人员而言尤其显着。其中之一称为「宽度量化」，因为FinFET元件最好是作为常规结构放置在一个网格上。标准单元设计人员可以更改平面电晶体的宽度，但是不能改变鳍的高度或宽度，所以提高驱动器强度的最佳做法就是增加鳍的数量。增加个数必须为整数 - 你不能添加四分之三的鳍。

另一个挑战来自3D技术本身，因为3D意味着必须萃取和建模更多的电阻（R）和电容（C）寄生。设计人员不能再只是为电晶体的长度和宽度建模，电晶体内的Rs和Cs，包括本地互连，鳍和闸极，对于预测电晶体的行为都是至关重要的。还有一个问题是层电阻。

20纳米制程在第一层金属（M1）下增加了一个局部互连层，其电阻分布是不均匀的，并且取决于通道所放置的位置。另外，上金属层和下金属层的电阻率差异可能会达到百倍以上。

还有一些挑战不是来自于FinFET本身，而是来自16nm及14nm上更小的几何尺寸。一个是双重曝光（double patterning），这是20nm及以下制程继续沿用既有的193nm曝光设备，而必须采用的技术。需要额外的光罩，搭配标色分解的制程，在不同的光罩上实现布局特性。布局依赖效应（LDE）的发生是因为布局物件放置在靠近其他单元或装置时，会影响其时序和功耗。而且随着几何尺寸的缩小，电迁移（Electromigration）变得更显着。

16FF+相比于16FF工艺，性能提高了15%。但这并不是16FF的替代工艺，两种工艺都将受理量产订单。关于16FF+的性能，台积电介绍称，与平面型最终工艺20nm工艺(20SoC)相比，速度提高40%，相同速度下的功耗降低50%。采用16FF+工艺后，“ARM Cortex-A57”处理器的工作频率可达到2.3GHz，“ARM Cortex-A53”处理器的功耗降到了75mW。这样便可实现达到平衡状态的big LITTLE构成。支持16FF+的EDA工具及知识产权核(IP core)目前已有很多，设计环境完备。其中，通过硅验证的知识产权核有百种以上。

而在A72上的表现，前面华为已经说了。可以说这是跟三星14nm工艺对抗的大杀器。事实证明好像也卓有成效。

重新设计的ISP

这是一个有趣的部分，首先我要上一张图，这是国外网站anandtech放出来的一张海思路线图：

大家看到上面红框内的字了么，Bad One（Needs Improvement），我蹩脚的英文都能看出很坦白，国外的网友也看到这里的时候笑了：

其实我没用过华为的手机，我也不知道华为的拍照，图像处理如何，反正我对那个渣系统是无语的。

然后根据介绍，麒麟950重设Camera系统，支持14bit双ISP，吞吐率性能提升4倍，高达960MPixel/s；支持混合对焦技术，可根据拍照场景自适应选择最佳对焦方式，实现快速准确的对焦；提供更多的滤镜效果，给用户带来更有趣拍照体验。

其实我对这块不是很懂，但海思声称已经在ISP和DSP性能方面取得了很大的提升。事实上，麒麟950是使用其新开发的PrimISP和IVP32 DSP。这个新IP来源于2013年在法国招了一批在德州仪器OMAP团队工作过的人？在华为的图像技术研发中心成立后，这样就使公司具有了设计资源，打造适合其需求的产品。因此，华为终于能在自身的SOC中集成有竞争力的ISP / DSP。而不像荣耀六、P8和Mate S那样外挂ISP。

而在多媒体处理方面，华为并没有过多谈论它的编码和解码能力。虽然新的SoC现在可以以30fps的速度解码4K视频，但由于编码能力还没有从上一代的进化，这就将其限制为1080p30的H.264。这也意味着，虽然ISP能够处理4K视频，但编码器实际将使得不可能真正实现不降低帧率的前提下，在设备上录制4K视频。

为什么基带不是Balong 750

这里是一个更加有趣的部分，我们知道，基带是手机与基站通讯的保证，而更高的带宽和能力，对于用户来说，是很重要的，特别是到了LTE时代，对于网络和带宽的关注，使用户对基带的关注更加敏感。

这里我要先普及一下基带的相关知识：

基带：

基带(Baseband)是手机中的一块电路，负责完成移动网络中无线信号的解调、解扰、解扩和解码工作，并将最终解码完成的数字信号传递给上层处理系统进行处理，基带即为俗称的BB，Baseband可以理解为通信模块。以iPhone为例，基带中包含了一个通信系统，是用来控制iPhone通讯的程序，控制电话通讯、WiFi无线通讯、还有蓝牙通讯。iPhone的无线信号是和基带直接相关连的，在“设置”里点击“通用”，再点击“关于本机”，在关于本机界面中的调制解调器固件的内容即为基带版本号。

在我们的手机中通常由两大部分电路组成，一部分是高层处理部分，相当于我们使用的电脑;另一部分就是基带，这部分相当于我们使用的Modem，手机支持什么样的网络制式(GSM、CDMA、WCDMA、TD-SCDMA等)都是由它来决定的，就像ADSL Modem和普通窄带Modem的区别一样。

我们用手机打电话、上网、发短信等等，都是通过上层处理系统下发指令(通常是标准AT指令)给基带部分，并由基带部分处理执行，基带部分完成处理后就会在手机和无线网络间建立起一条逻辑通道，我们的话音、短信或上网数据包都是通过这个逻辑通道传送出去的。

关于CA：

CA（Carrier Aggregation）载波聚合的主要概念在于：将既有的非连续分散频谱整合，提高传输效率、网速，与稳定性。若把不同频段比喻为两条塬本互不相通的道路，在没有 CA 的情况下，有可能其中一边大塞车、另一边的车道却十分通畅，但由于塞车道路（载波）的车辆没办法切换至通畅道路行驶，造成整体车道（频宽）的利用效率太低，纵使有剩余车道（频宽）也无法有效疏散车流。而 CA 载波聚合就是把不同道路（载波）的所有车道（频宽）合併成一条大马路，虽然马路宽度（总频宽）和以前一样，但由于壅塞车道的车辆可以切换至顺畅的车道行驶，使得整体的行车速度（网路速度）能够更加顺畅快速，同时服务品质也会更稳定。

继续下面的讨论：

但是对于没有升级基带，华为手机产品线PDT经理李小龙在微博上的解释是，LTE Cat.9需要整合3个20MHz的频段聚合才能实现450MHz的下载速率，运营商哪有那么多空闲频段呢？

然后高通就迫不及待出来打脸了，等的就是你。

高通官方微博公开表示，技术首先永远领先于现实，现实会马上跟上。跟上时，它才能用成熟的技术。比如现在国内几家运营商都已经开始跟我们联调Cat.9了。

高通强调，Cat.6已经远远不能满足运营商的需求，大家伙儿也希望越快越好。

而其实华为在早两天刚公布了其最新的基带Balong750。至于为什么没用上，是没赶上还是生产问题就不得而知。

Balong 750在全球范围内第一个支持了LTE Cat.12、Cat.13 UL网络标准，理论下载速率高达600Mbps，而上传也达到了150Mbps。

相比之下，高通最新的MDM9x45也仅支持到Cat.10，下载450Mbps、上传100Mbps，而联发科预计年底才会有Cat.10基带。

事实上，LTE Cat.12的下行速度就已经提升到600Mbps，不过上行只有100Mbps，而华为没有满足于此，Balong 750突破达到了150Mbps，从而符合LTE Cat.13 UL上行标准。

据华为介绍，Balong 750能够根据运营商的频谱资源和网络覆盖，通过2CC(双载波)数据聚合、4x4 MIMO多入多出技术(一个无线信道中堆叠4个空间流)，或者4CCA(四载波聚合)技术，提供高达600Mbps的下载速度。

一般来说，运营商都会有至少两个频段区间，但每个频段带宽资源有限。频谱较少的运营商，需要通过载波聚合技术，提升LTE网络容量，达到更高的下载速度；即使是频谱较多的运营商，也需要通过载波聚合技术，提升网络覆盖，实现真正的网络无缝联接。

针对频谱资源较少的运营商，Balong 750会采用2CC＋4x4 MIMO技术，使下行速度达到600Mbps；针对频谱资源较多的运营商，则会采用4CCA技术，扩大网络的覆盖范围和带宽能力。Balong 750也是目前唯一一款支持4CCA的基带芯片。

总的来说，华为也的确做了一个很牛逼的产品，我相信干掉三星7420是没有什么问题的，但跟骁龙820比，相信还是有点难度，毕竟高通这个专业选手在这方面的领先优势真的太强大了。但是也不能否认，华为国产芯片方面的领先，是无可厚非的。无论从工艺制程，还是从自主专利上面，都不是其他厂商可以比拟的，即使有差距，也希望大家多给华为一点时间，毕竟也就那么些年而已。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。