打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
麒麟810到底是一个什么水平的SoC (6800字) 来自 林下优选

如你所愿,这并不是一篇假大空/吊打/沸腾/牛逼/跑分对比的软文,也并不是一个直接能得出的简单结论:

“麒麟810能干死骁龙730G”

这不用我告诉你,你早就知道。

我会告诉你,为什么?麒麟810能干死骁龙730G。然后,再深挖一层!从硬件基础讲起。

如果你已明晰,请帮助我纠错。
如果你仍懵懂,务必坐下来学习。

但无论怎么样:
点赞,收藏,转发 素质三连是对我最大的支持。

----
正文部分
----
第一个问题:SoC是什么(多次讲过,已知请跳过)
SoC全称:System on a Chip
这里的System指代的是硬件系统,Chip很形象,是薄片。
连起来就是:在一个薄片上集成的硬件系统。

按照目前的地球科技树加点,SoC的集成度超乎想象。
它并不是简单的CPU+GPU,然后顶上贴个DRAM,边上摆个Flash芯片的简单事情。
我们拿麒麟810来讲,它一共包含九大分区:
--------这部分是每个人都知道的
CPU:Central(中央)Processing(处理)Unit(单元/器)

GPU:Graphics(图形)Processing(处理)Unit(单元/器)

--------这部分是大部分人都知道的
ISP:Image(图像)Signal(信号)Processor(处理器)
ISP是一种专门用于处理图像的DSP...
DSP:Digital(数字)Signal(信号)Processor(处理器)
Cellular Modem:蜂窝网络 调制解调器
WiFi/Bluetooth Modem:无线/蓝牙 调制解调器

--------这部分是大部分人都不知道的
IVP:Image(图像)Video(视频) Processor(处理器)(麒麟810刚加上的)
IVP也是一种DSP,它和ISP分工合作,专注于动态图像处理,强化视讯信号处理、杂讯滤波能力和画面稳定性。
Nand Flash Controller:用于对接Flash闪存,控制闪存读写和工作。

--------这是你们最感兴趣但并不了解的NPU:
我个人认为全称应该是NNPU,即Neural(神经)Networks(网络) Processing(处理)Unit(单元/器)

NPU相关下面会有一个巨大的篇幅进行讲解,毕竟...不能愧对我花了几十美金下载的论文。

--------就是这些东西构成了一个高度集成的SoC,方便也捆绑了我们的日常生活

--------------
第二个问题:麒麟810的SoC这九大区块做得怎么样?
你们最关心的肯定是CPU和GPU...
毕竟按照常理来说:吃鸡爽不爽主要靠这俩货给不给力,就算Turbo算法再强,这俩货不给力,也是巧妇难为无米之炊。

OK,直奔(bèn)主题:一个老生常谈的话题:TSMC(台积电) 7nm DUV工艺是什么?

首先7nm并不是一根晶体管7nm粗,而是光刻的最小单位精度是7nm。

这件事我得先泼一盆凉水:7nm DUV工艺相比与台积电10nm Fin-FET DUV而言提升并不大,我是说认真的!萌新一定想问DUV是什么?别着急,隔一段告诉你。

台积电公布的10nm FF DUV特征尺寸是
Metal Pitch*:44nm*Gate Pitch*:66nm
台积电公布的7nm FF DUV特征尺寸是
Metal Pitch:40nm*Gate Pitch:62nm

特征尺寸结构示意图(原创)

Metal Pitch:金属间距,Gate Pitch:栅极间距

Pitch指代的是一个物体的中心到相邻物体中心的距离,可称之为间距,也可称之为节距。

上图是简略的晶体管结构

如果你对此毫无兴趣,不妨把Metal Pitch和Gate Pitch当成长度和宽度然后做一个简单的乘除:
44*66/40/62≈117%

7nm DUV和10nm DUV相比,晶体管密度从10*10/7/7的理想数值上看起来,似乎提高至了200%,实际上按照台积电公布的数据,仅提升了17%的晶体管密度。

WHY????

两大原因
1. DUV实在是太古老了
2. 晶体管并不是一根管子7nm宽(上文已经提到了)

所以我来告诉你DUV是什么。我们先来说说UV,毕竟你们也知道我还有一个工作就是卖UV钢化膜。
UV指的是紫外线,紫外线是个好东西,波长短,能量大。

我们知道可见光的波长是400nm-700nm而根据波长不同,不同光刻机采用的不同光源发出的光,目前划分的有四类

DUV:193nm波长 深紫外线
VUV:103.3nm波长
EUV:13.5nm波长 极紫外线
BEUV:6.7nm 波长

而TSMC制造麒麟810采用的是DUV光源,也就是193nm的深紫外线
那么7nm的芯片是如何用193nm的光刻波制造出来的呢?
这需要一个复杂的装置来实现!
下图是这个复杂装置的简单工作原理图。

我们主要要讲物镜

抓重点!物镜!
物镜是由若干个透镜组合而成的一个透镜组。
能将一个巨大的图像缩小成一个微小的图像,缩小倍数越高,成本越高。
如图是物镜的结构的简单示意图

这真的已经简化了很多了

而目前的光刻机物镜,要达到拿193nm光刻波刻录单位精度7nm的效果,物镜并没有上图看到的那么简单。

它包含多层偏振片,光阑,以及多层凹/凸透镜。一共加起来怎么也得有四五十层,非常精细,非常复杂,也非常昂贵。

有一瞬间,这束光,从物镜里穿了出来,它的使命是什么?
刻芯片!
BUT!怎么刻?
以下是具体步骤:

1.我们将晶圆放置好
2.在其表面喷涂一层金属或者氧化绝缘层
3.在金属或者氧化绝缘层表面旋转喷涂一层光阻材料(光刻胶)
4.用透过物镜的光束光刻光阻材料(光刻胶)使之变质
5.用化学药剂洗掉变质的部分

到这里,光刻的步骤完成了,但芯片依然没有制造出来
美羊羊:那现在怎么办?

6.用等离子束轰击,没有光刻胶的部位就会被等离子束轰击成气体,这些气体与环境中气体结合并挥发,完成一次刻蚀。(下图是鄙人画的示意图,非常容易理解)
7.洗去所有的剩余残渣

光刻工艺简略图(原创)

8.重复上述步骤几十次,完成多层电路的刻蚀,就制成了一堆芯片的雏形。

我觉得这件事看起来很简单并且非常好理解,芯片工艺的神秘大门已经为你打开,而延展的细节,如果你是即将步入大学的电子信息工程专业的朋友,恭喜你将会学到秃顶。

特别需要注意的是:概念图始终只是概念图,真实效果不尽人意。图像在被缩小的过程中,因为种种原因,总会出现畸变,例如物镜背锅。

理想光刻效果和现实的差异(原创)

J.Wong:又不是不能用

当然可以用,但不代表造出来的每一个晶体管都是能工作的。

J.Wong:不喜欢就…..不,你直接滚!

所以,7nm FF DUV制成相比于10nm FF DUV 并没有太大的提升。主要原因是

1. 图像缩的越小误差越大
2. 栅极壁越薄漏电率越高,而栅极壁越厚主频越难提升(材料不变的情况下)然而精度再高也解决不了物理问题。

然后就是:
有一个论调说7nm DUV并不是7nm,这个论调是错误的。
但凡是光刻的最小单位精度是7nm,都算7nm工艺。
而Exynos9820的8nm EUV本质上还是10nm,只不过晶体管密度/精度 比10nm DUV有所长进,8nm只能说是个噱头。
就像在AMOLED前面加上Super一样。
夸张的说法,常规的操作。

另外今年年底的EUV光刻波生产的7nm芯片
因为EUV自身波长只有13.5nm
不需要复杂的物镜,所以图形畸变会变得很小,晶体管与晶体管之间的预留位可以设计的小一些,另外,按照你们的说法,芯片体质也会好一点。

工艺方面的事情我说完了!记牢!考试要考!

关于海思麒麟810的CPU部分:
2×Cortex A76 2.27GHz
6×Cortex A55 1.88GHz
A76架构是有很大操作空间的。

单个核芯的L2缓存,按照ARM给出的方案来看,可以是256KB也可以是512KB...不过你们不需要关心这个,毕竟最大主频只有2.27GHz的A76 用512KB的二级缓存意义不大。

所以一定是256KB的L2,以及2MB的L3,当然骁龙730只有128KB L2+1MB L3,只能说阿蒙刀法精湛不输老黄啊!

另外,上文提到了一件事:栅极壁越薄漏电率越高,而栅极壁越厚主频越难提升。

我相信麒麟810在设计的时候肯定不会照搬麒麟980,会重新设计栅极壁厚度,让它稍微加厚一点点

这样它的漏电率会相比麒麟980上的A76显著下降,带来的好处就是功耗在同频率会进一步的降低,不过也就限制了能达到的最大频率。

题外话:买华为你又不能解锁,超频的事情本身也不现实,这个缺点就完全不算缺点了。

关于A76架构我还是说几句:它最大的优势不在于所能达到的极限性能,而是在于相比前几代公版架构提升的能效比。

虽然说性能在未来几十年内都不会过剩,但是电池技术没有巨大发展之前,能效比的提升具有非常重大的意义。

A76相比之前几代能效比提升的主要原因是:

OS Kernel Mode(EL1):系统内核模式

Hypervisor Mode(EL2):管理程序模式

不再支持32bit代码,言下之意是只支持64bit代码。

这使得它能够专注的做好一件事,当然能做到这一点也离不开Google 和 Microsoft 对于Android 9和 Windows on Arm的积极优化,A76是典型的多方合作的结果,如果只是ARM奥斯汀团队自己,也不敢如此激进。

另外,A76架构的预测引用效率相比之上一代提升了85%(最保守估计)
为此,设计团队进行了一个赌博:他们赌不会再有第二个Spectre漏洞出现。

他们将分支预测单元和取指单元分离,然后重新设计了一个全新的机制来保证它们能在单独运行/合作运行的状态下都保持非常高的效率。

按照Arm官方介绍:A76的预测单元能够在连续预测错误8次的情况下仍然不会出现停歇。这里就不展开讲是个什么机制了,避免你们晕头转向。

当然,因为加大了很多方面的带宽,以及拥有更多队列/执行流水线,最重要的还有4个乱序发射器。整数/浮点/向量 同频性能和效率均有所提升。

6*A55是非常不错的方案,这意味着在日常使用下,后台应用的切换会非常流畅,而待机功耗也很低。

总结:夸爆A76,麒麟810的CPU部分做的很好,要性能有性能要续航有续航。
---------------
关于麒麟810 GPU部分 Mail G52MP6 820MHz

这部分比较简单,当然也是你们非常关心的,毕竟流畅已经变成千元机的标配,而吃鸡爽不爽才是最让人期待的部分。

强不强?极限性能干不过835,但比较接近。如果玩10分钟以上游戏就可能是麒麟810表现更好了。

怎么说?这个定制的Mail G52到底是何方神圣?首先每个核芯拥有24个ALU,从这方面说起它的极限性能应该是和公版Mail G76非常接近的。不过有所不同。

注:ALU:Arithmetic(算术)& Logic(逻辑)unit(单元)

ALU的数量几乎直接意味着性能

我个人理解是这样的(两个版本):

版本1.因为加了个IVP和一个达芬奇架构的NPU,为了尽可能加强GPU部分的性能,塞了一个G76MP6进去,然后SoC的设计空间可能不太够,把G76上的Advanced Titing Unit(分配优化器)和Memory Management Unit(内存管理器)删掉了,就变成了G52MP6

版本2.因为有了一个达芬奇架构的NPU,NPU超级能干的,所以不需要Advanced Titing Unit(分配优化器)和Memory Management Unit(内存管理器),这俩破东西结构又复杂又占空间,删了还能提高芯片良品率,就大刀阔斧砍掉了。

所以你们可以理解为高频Mail G76MP6,它拥有144个ALU...
骁龙845能开启的ALU一共有256个,至于不能开启的部分(用来进行Ai计算的)...老实说我怀疑还有256个。
说到高频我想到了麒麟960那四个超冒烟的GPU核芯...当然麒麟810不可能这么高的,总不会在一个坑里栽倒两次吧?

至于 骁龙730和730G,完全不需要对比了。秒掉!当然毋庸置疑,GPU能效依然是Adreno高,但这是历史遗留问题。

接下来就是

Modern部分
WiFi协议:802.11 a/b/g/n/ac
最大带宽:867Mbps
频段支持:2.4GHz和5GHz
蓝牙 5.0当然也是支持的,然后这部分就没啥了

说说Cellular Modem部分
从运营商定义的角度:
支持移动/联通/电信 4G+/4G/3G/2G
从频段定义的角度:
TD-LTE:B34/B38/B39/B40/B41
LTE FDD: B1/B3/B4/B5/B8/B19
TD-SCDMA:B34/B39
WCDMA:B1/B4/B5/B6/B8/B19
CDMA :BC0 GSM:B2/B3/B5/B8

另外支持双卡双4G同时在线,一个号码用VOLTE的同时,另一个号码4G不会掉,玩游戏就非常舒适了,不用担心一个电话打完就只能Good Game了。

然后从你们都很关心的角度:Cat.18

补充一下刚刚查到的内存信息:
支持LPDDR4X Dual-Channel 1866MHz
也就是说最大内存带宽可达29.8Gbps
但是!
目前搭载麒麟810芯片的手机
都是LPDDR4X Dual-Channel 1600MHz 最大带宽25.6Gbps

Emmm,即便是这样,内存性能依然比骁龙730好一点

内存说完,如你所愿
NAND Flash Controller(储存控制器): Support UFS2.1 Dual-Channel 1TB/Support 512GB TF Card

当然荣耀9X搭载的就是双通道UFS2.1 TLC闪存,这个你们可以放心大胆的说,Good!

--------
IVP和ISP有什么区别?
我从文章的开头复制了一段内容下来继续拓展

IVP也是一种DSP,它和ISP分工合作,专注于动态图像处理,强化视讯信号处理、杂讯滤波能力和画面稳定性。

摘录一段Tensilica公司的IVP芯片宣传介绍:

With its unique architecture tuned for imaging and video pixel processing that gives it peak performance of 10 to 20x most host CPUs.

我简单翻译一下:

IVP凭借着针对画面成像和视频限速处理的独特架构,在处理视频和图像的时候,能效比是CPU的10至20倍。是ISP的2至4倍

拥有很高的能效比,很省电。可惜的是并没有找到麒麟810的IVP参数数据。

不过可以参考Tensilica公司的IVP芯片数据:
Quad-Channel VLIW(超长指令集)
32路矢量SIMD(单指令,多数据架构)
集成DMA(直接内存访问)传输引擎
对具有32bit和16bit像素数据,每秒可以处理100万个8x8图形

我对于IVP芯片也非常不了解,因为之前甚至没有听说过,以上数据也仅作参考。

总结并拓展一下:IVP还拥有一个巨大优势--相比ISP更容易编写和修改算法。
猜测华为所谓的DE模块/RAW域降噪处理/深度信息处理/畸变矫正模块/白平衡算法 都和加了这颗IVP有所联系。

我的推测是
华为目前的方案:IVP负责降噪/处理细节/HDR增强

ISP则负责更多更广泛的事情,它能对前端图像传感器输出的信号进行有线性纠正、噪点去除、坏点去除、内插、白平衡、自动曝光控制。

IVP和ISP是分工合作的关系,部分功能重叠并相互增强,大部分功能由ISP完成,这样说起来,ISP更像是DPU中的CPU,IVP则是DPU中的GPU。

来了来了来了来了~!NPU NPU

麒麟810的官方介绍里并没有提到集成了DSP这个东西。。。

但是一部手机里不能没有DSP,因此它实际上是存在的,而且非常显眼。

它包含了一个DSP的所有功能,并且更加强大。没错!它就是所谓Da.Vinci架构的NPU。当然,就目前的科技来说,这样的NPU依然属于DSP的分类里面。

严格意义上来说,麒麟810里的这颗NPU并不完全是NPU。NPU的标准定义是Neural(神经)Networks(网络) Processing(处理)Unit(单元/器)

标准意义上的NPU结构是模仿生物的大脑。

大脑拥有大脑皮层,大脑神经元是多极神经元,胞体呈多边形,有一个轴突和许多树突,信息以
1.电位差
2.神经元相互建立联系
的方式被碎片化储存在神经元中。学过高中生物的朋友们对此应该都不陌生,下图是单个多极神经元的结构示意图

Via:百度百科,画这东西是我高中时代的噩梦

你仔细看这个神经元,树突又广又长!它说明什么?

说明神经元之间的联系是非线性的!

什么?你不知道什么是树突!

哎呀!就是Dendrite!!!这个考试真的要考的!没错,就是高考!

什么?你考完了?那好吧你当我没说。

抓重点,非线性!

这意味着:
咱爱跟谁建立联系就跟谁建立联系,咱自由自在,咱交友广泛!有没有觉得这个描述有点像某些格斗类游戏里的组合技?需要大量的连续操作才能放出一个非常炫酷并且强大的技能。

事实上人类的每一个技能都是组合技,你可以把一个神经元想象成一个键位。
大概几千万到几亿个这样的键位相互联系(也可能更多),就形成了你的一个简单的生活技能,例如:恰饭!

Good,我突然觉得看到这篇文章的诸位都是超凡的存在,毕竟你们在一瞬间就能完成几亿次操作。我是说认真的,每一件平凡的事物背后都有不容忽视的不平凡的存在。

这话同样是说给我自己听的,虽然我也就是个野鸡大学大学生,挥霍青春,业余爱好也就给诸位推销一下自家产的手机壳,钢化膜,充电器这样,但我同样也可以做更多,我相信我自己。你们也一定要相信你们自己。

突然很感性,但事实上,感性几乎构成了一个人的全部,因为你的每一项你觉得有变化的变化,你的思考,你的直觉,都是你的感性,你的感觉。
而这些感觉全部产生于你的大脑皮层,这也是为什么只有大脑皮层才能被称之为神经中枢。
它控制着你感觉的传入和传出,以电信号的形式。

其实一点都没有扯远,这也是我要说的:标准意义上的NPU就是模仿人类大脑的一种芯片。它的硬件是非线性的,且不同于冯.诺曼依架构的。

我们来看看一个人工神经网络的简略结构是什么样的。

Via:百度百科(抄上瘾了?没有,只是不想画这么麻烦的东西)

人工神经网络是由大量处理单元互联组成的非线性、自适应信息处理系统。

它是在现代神经科学研究成果的基础上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理。

主流的人工神经网络结构包含一共三大主要层次:输入层,隐含层,输出层。

输入层和输出层相当于你的大脑皮层,而隐含层则是你的大量脑细胞。

人工神经网络视概念和应用不同又有几十种不同的结构。

神经网络的学习会使:
人造神经元的突触的相互联系构建训练形成权值不同的算法,这些算法将输入的值转化成模糊化,最后得出一个特征值 输出,反复学习和训练会提升算法的准确性和精度。

当然谁也没有办法确保机器人学习出来的不是一个怪异并且人类无法理解的东西。

而理论上硬件被称为Neural(神经)Networks(网络) Processing(处理)Unit(单元/器)的芯片。

它之所以不同于冯.诺曼依架构的原因是多了一个叫做忆阻的元器件。

什么是忆阻?忆阻全称:记忆电阻器。
忆阻的阻值由流经它的电荷量确定。
简单的说,就是一个代表着电荷和磁通量之间关系的组件。
这种组件的效果就是:
电阻随着通过的电流量而改变,就算电流停止,电阻任然会停留在之前的值,直到受到反向电流才会被推回。

有了忆阻,芯片才真正意义上能做到记忆/控制/计算三位一体,就像是人类的神经元一样,如果没有忆阻,NPU这个东西其实有点名不副实。因为它不具有记忆的能力。

为什么?因为忆阻能实现的功能类似人类神经元的电位差。

回到海思麒麟810身上,它的NPU当然不是上述这么理想且飘渺的东西,本质上依然是DSP芯片,也就是俗称的DPU,当然也没有集成忆阻。

不过也许这颗DSP芯片已经集成了部分人工神经网络的学习算法,也可能可以执行云服务器上已经训练好的算法。虽然硬件上不具有这样的结构,但是它具有NPU的功能,将其称之为NPU也是完全没有问题的。

那么达芬奇架构的这颗NPU具有什么样的特点?

发布会的时候,有九个字是我记的非常清楚的:

能效好,精度高,算子多。

这颗NPU所谓的立体结构,我觉得应该是指不同的逻辑区都能够调用所谓的算子,也就是ALU吧,ALU数量庞大,以至于能同时响应并计算多方需求。

当然也不全是这么简单,达芬奇架构的张量(Tensor)运算性能非常强大,而张量性能确实就是神经网络计算最需要的部分。

OK问题来了,什么是张量?

几何代数中定义的张量是基于向量和矩阵的推广,简言之:我们将标量视为零阶张量,向量视为一阶张量,矩阵视为二阶张量,给矩阵加上了时间轴就是三阶张量。

你是不是绕晕了?

其实我想说的是:张量=容器。
装在张量/容器水桶中的每个数字称为“标量”。
标量是一个数字。
我们将庞大的数据用算法转化成一个代表数据的数组,这个数组就能表达这庞大的数据,而这个过程其实就是张量运算。

华为的达芬奇架构NPU最擅长的就是这个。

目前Ai算法应用在了EMUI的角角落落,方方面面。
并且提升着SoC的运行效率以及人们的使用体验。
有些人可能会觉得所谓的麒麟810所谓的Ai芯片是噱头,但我觉得不是,它代表着一个方向,一个很好的起点,以及一个非常美好的未来。

是的,我觉得Ai就是未来。

全文完.

另外回答一下酷友们非常关心的问题:23W跑分有没有造假?我可以负责任的告诉你,A76+G76MP6(精简版)+LPDDR4X Dual-Channel+UFS2.1 Dual-Channel+NPU就是铁证,它没有造假,甚至,实际体验远远不止这个不高不下的23W分。

最后当然要恰饭!恰饭!
Google PD3.0 45W充电器 已经上架 交友价86.5

超好看!

信仰LOGO!

港标 大三角

赠送一个国标转接器
如需购买Google USB-C线
1米 全新原装+11.5 1.8米 全新原装+14.5

另外 荣耀 9X 酷安版 Alcantara 手机壳
现已交付工厂生产,已上架林下优选
预售模式,一周内发货,28.8包邮,无LOGO版同价

LOGO会有一些色差

最后本文点赞的朋友里随机抽取2位赠送(包邮)

耐尔金无线充电器1套

不要无线充不可折现,视为放弃奖品,顺延下一位。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
“芯”希望来自新工艺!EUV和GAAFET技术是个什么鬼?
华为Mate 30 5G版素皮配色受欢迎,其实是你没发现黑色的美
euv和duv区别
【虎扑数码wiki】第14期——手机soc基础知识科普
移动芯片如何走出“高水平均衡陷阱”?
华为M6畅玩“和平精英”高画质3D大作,还需有这颗强“芯”
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服