打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
如何用圈外人士能理解的文字解释「量子退火」?

【windroid的回答(68票)】:

我觉得@summer clover答的很好了,但是圈外人士可能还是难以理解,所以我举个比较直观但是不太正确也不太全面的例子补充一下。

假设我们需要计算一枚炮弹的轨迹求出能否命中目标,我们有两种办法,

一种是写出各种方程,考虑推力阻力引力自转等等,然后求解方程,得到运动轨迹。这就是现在用计算机做的事情。

另一种奇妙的方法是,我造一个1比1000的微缩模型,控制好模型里的推力风速等等,砰的一声打一个迷你炮弹出去,直接用尺子量出落点。这就叫做“让大自然自然演化,给我们计算结果”。

量子退火,就是类似第二种的方法。

【ChenyDimpurr的回答(71票)】:

不邀自来,见识浅薄,还请诸位大神指正。

量子退火法,是一种基于量子特性的量子计算机算法,脱胎于经典计算机上的模拟退火算法。实际上,模拟退火算法的步骤和思路,与金属的退火确实有着异曲同工的妙处。

将金属加温到某个高于再结晶温度的一点并维持此温度一段时间,再将其缓慢冷却。

—— 退火 - Wikipedia

关于通用量子计算机的原理和特性,可以参见我的另一个回答:量子计算机有什么实际的应用意义? - Cheny Dimpurr 的回答

作为量子退火机应用较多的一种特性,再补充一种神秘的「量子隧道效应」。这种效应一般来说,指的是微观粒子有一定纪律穿过穿过不可能穿越的壁障,出现在壁障的另一端的情况。因为一个微观量子并不存在一个精确的位置,而是以一定概率分布在一片区域,化学上的电子云概念就是这样的。

假设容器的边缘有一个粒子,蓝色的深浅标出了它的德布罗意波,即它可能出现的位置的可能性大小。可以注意到,在很小的几率下,这个粒子会出现在容器的对面。不是漏出,也不是穿过,而是瞬移!但是这也不是瞬移,因为对于电子来说,它本来就有可能出现在那里,只是在你观测的时候,本来存在于一定范围的电子忽然给出了一个正好的容器外的位置。

首先,我们先来看看我们都熟悉的一种贪心算法,爬山算法。

爬山算法指的是以以一个任意值为起始点,计算临近的解,然后不断判断这个解和符合条件的差距,选择选择更适合的方向继续计算,直到达到一个任意方向都是更劣解的位置。

来看看这幅图。假设蓝线的位置就是正解的位置。

首先,一个登山者(计算机)从 FE 段的任意一处出发。对他来说,向下走无疑是更接近正解的。只不过,当他走到了山谷,也就是 E 点时,他会发现:此时无论他往哪边走,都会距离谷底更远!

我们的爬山者被困在山谷底,或者说「势阱」了。

至于模拟退火法,引入了一个随机的扰动,也就是温度 T 。

我们可以这样来概括它的步骤:

  1. 在值域内,按照随机扰动 Δ ,产生一个一定范围距离的新解
  2. 判断新解和正解的距离,与当前解与新解的距离进行比较
  3. 如果可以接受,那么在当前 T 的范围内,有一定可能性改用新解
  4. 当确定正解在某个区间以内时,缩小范围继续应用模拟退火算法

实际上,就模拟退火算法的具体实现来说这个概括不是很准确。不过这样一来,就可以看出它和爬山算法的最大区别:我们的登山者一次被困在山谷 E 时,他可以选择瞬移到 DC 段的某处,并且惊喜的发现这里更接近正解!在对「整座山」通过统计学方法「退火」时,他就会发现最接近正解的区间 BCD ,从而集中精力在 C 处寻找精确解了。

退火法还有很多有趣的性质,比如初温 T 越高,得到正解的概率也越高,因为此时计算机会更勇敢的选择新解,相当于退火的更彻底。相应的,要达到对「整座山」锁定目标需要的耗时就越长。这个问题,量子退火中就可以得到改善。

那么,这次我们的登山者不同寻常,是一位量子登山者。

看到这幅图也许已经有人明白了:此时这个登山者不仅处在 DE 段上的某一点,其实他「同时」存在于这四周的一大块区域!在它的可能性范围所能触及的区域,他发现了 CD 段上有着更低的一点。利用量子隧道,我们的登山者逃出了山谷!

还不仅仅如此。我们还记得在模拟退火法的第一步上,我们提到了我们会从图像(山脉)的某处开始搜索。但是,因为量子的叠加性质,我们的量子计算元件可以同时处在图中的很多个位置!这样以来,搜索的效率可以以(2 的)指数性增长!

这样优秀(当然,适合处理的问题有所局限)的算法,让我们来看看这个庞然大物, D-Wave Two 是怎么实现的。

首先,在合适的环境下,制备好一系列量子比特。 D-Wave Two 拥有 128 个量子比特。

接着,为这些量子设置好三维的伊辛模型,也就是设置好他们的初始位置和自旋状态。这个初始模型就决定了接下来的计算,可以说就是编好的程序。

随后,减弱量子间的相互作用,通过向超导电路通入特殊电流,向设置好的模型施加一个横磁场。这种情况下,量子就进入了自旋的叠加状态,相当于同时具有 0 和 1 状态的比特。

最终,我们进行「退火」。我们慢慢撤去横磁场,增强相互作用,最终,量子们稳定下来,我们得出了最终解。

就像别的答案中提到的,量子退火机就是让大自然自己去进行计算,我们等着看结果:最终稳定下来的量子,一定是在这个三维伊辛模型中,相互间能量很小的状态。意即只要模型设置得当,我们就有非常大的机率落到最低的「山谷」当中。

因为算法本身基于统计学而非遍历的性质,我们可以理解,即使量子退火算法在模拟退火算法的基础上提高了算力,还是有只得出近似解的情况存在。因此, D-Wave Two 据说会针对每次计算任务重复 4000 次,选择其中的最优解得出解答。

最终,和大家预想的不一样, Dwave Two 确实「只是」一台量子退火机。在吭哧吭哧工作时,还得全程由液氮保护运行在 0.02 K,也就是 -273.13 ℃ 下。不过,相比经典计算机,量子退火机还是在特定领域达到了上万甚至上亿倍的算力提升。我们可以期待,一个真正的通用量子计算机,将会给科技行业乃至人类智慧带来极大的革命。

【windroid的回答(162票)】:

谢邀。

1)Introduction

Dwave是目前唯一的商业量子计算机,也是目前最有前景的量子计算机。

虽然本质上,它是量子退火机(quantum annealing machine)。

Quantum annealing is a method to solve combinatorial optimzation problems and was proposed by Kadowaki and Nishimori in 1998. Many problems in machine learning and artificial intelligence can be formulated as combinatorial optimization, and the development of efficient algorithms to solve combinatorial optimization problems has enormous practical significance.

退火的意思和模拟退火算法一样。“模拟退火”算法是源于对热力学中退火过程的模拟,在某一给定初温下,通过缓慢下降温度参数,使算法能够在多项式时间内给出一个近似最优解。

量子退火算法则是量子力学的绝热演化过程,模拟了量子力学里的量子隧穿效应。通过让量子效应缓慢下降(绝热演化),找到一个解。

系统从一个初态绝热演化到基态。初态和基态需要Dwave来构造。初态随意早,末态(也就是基态)对应机器学习的costfunction。

不明白绝热演化的人可以简单地将其理解为“慢慢演化”。

Dwave是量子退火机。量子退火机和

【“这种计算机是基于可以表示介于0和1两种绝对状态中间的不确定状态的量子粒子做成的”】这种基于逻辑门的标准量子计算机基本上没有什么关系。

量子退火是基于绝热量子计算的。我们不需要操作量子逻辑门。但是,绝热量子计算其实等价于标准量子计算。

【Aharonov D, Van Dam W, Kempe J, et al. Adiabatic quantum computation is equivalent to standard quantum computation[J]. SIAM review, 2008, 50(4): 755-787.】

2)物理过程

最初,量子扰动非常强,解的概率分布几乎是均匀的。然后,演化开始,量子扰动(quantum fluctuation)减小,cost function开始主导。最后,量子扰动彻底结束,解落到(近似)最优点。计算结束。

所以,Dwave就是用来构造costfunction和量子扰动的。

Dwave的芯片就长这个样子。Dwave其实就是按着伊辛模型(Ising Model)来构造。

Dwave芯片的哈密顿量如上。Gama会随时间变化。Dwave芯片的哈密顿量如上。Gama会随时间变化。

每一个比特用超导环电流方向来模拟。所以工作温度要求20mk。

顺时针/逆时针就是+1/-1。这和电子的自旋很类似。所以是Dwave芯片里没有什么0和1的任意叠加。

连接两个比特的黑线就是哈密顿量里的Jij,是我们可以设定的参数。由于技术原因,每一个比特只能连接相邻的比特。而理想情况下应该是任意两个比特都能相互作用。

3)小结

实际上Dwave优势在于,我们不去管该怎么计算。我们知道大自然的计算结果总是对的。

我们构造一个物理系统去表示某个机器学习的costfunction。

我们只要求这个系统末态对应costfunction。我们给出这个系统,大自然自己就知道这个系统该怎么演化。

简单来说就是,让大自然自己去进行计算,我们等着看结果...

而这么诡异的计算方式居然是和量子逻辑门计算机等价的。

当然经典计算机也可以模拟量子退火算法,但是计算复杂度太高了。

【知乎用户的回答(3票)】:

好比用拉线绳的方式替代Dijkstra算法求最短路径 或 用模拟电路解微分方程。

【知乎用户的回答(2票)】:

我就说一点我懂的,我不知道中医里退火是怎么翻译成英文的,但是,一般annealing是理解成在材料专业里的退火。至于这个退火的意思,是一种热处理的方式,详见 退火(金属热处理工艺)

所以,这个退火确实和中医没关系。

【李华益的回答(7票)】:

结合@Cheny Dimpurr 的答案,让我作为圈外人士来试着解释一下,虽然不保证一定准确,但应该更容易理解。

想象我们有一个任务,就是去测量一座大座山脉的最低坐标(高度)。

先按传统方式,我们坐直升机,到了山脉上空,空投一个测量师,他降落后,遍历整座山脉的山谷,然后得出一个结论,显然这种方式逻辑简单,效果明确,但工作量很大,效率很低,要想在短时间内知道答案就算是闪电侠也会累的吐血。

现在,让我们用量子方式来试试,首先,我们得明白什么是量子,量子不是一个单一的质点,可以理解为一个质点同时出现在不同位置概率的集合,就好比孙悟空一拔毛,吹出N个分身,处于不同位置,个个都能打,所有分身在逻辑上构成一个量子。

好了,现在让这个孙猴子去做测量师,我们把它从直升机上扔下去,就相当于同时扔下了N个孙猴子,每一个猴子都可能随机降落在不同的山谷里,然后报告自己的位置,那么我们只要取其中一个最低值就是我们想要的结果。

现在,我们可以理解量子计算为什么快了吧,但还剩一个理解障碍,那就是为什么每一个分身就那么SB,扔到哪里就只报告自身位置,而不会像传统测量师那样到处走走,报告更多结果呢?

这就是量子世界与质点世界的区别,作为观察者,我们人类活在一个质点构成的世界里,量子只是活在我们的理论世界里,我们只能看到这个理论世界给质点(客观)世界带来的结果,但我们无法进入量子(理论)世界操控量子世界里反应过程。

这种不可操控性就像是你把一把烧红的剑扔进冷水里淬火,我们只看到剑作为质体,它刚性提高了,但我们无法去控制它内部晶体的反应过程(在极微观尺度下,这种反应就是量子世界的事了),钢铁退火和淬火,只不过是冷却温度控制速度的区别,只是惯例上用了”量子退火“来形容量子计算过程。

通过控制冷却温度和速度,我们可以不同程度提高刚度,这种刚度其实就是量子世界反馈回来的信息,但我们不能直接从分身上获得信息,只能通过一定的控制条件和特定的反馈信息检测,控制孙猴子整体上去做我们想做的事,得到我们想要的答案。

所以量子计算虽然快,但也有很大的局限,除非我们能控制每一个分身,否则它无法取代传统计算机,应用会非常的窄,如果我们能控制分身,那这又不是量子了,它的量子效应会消失,而变成传统的质子。

【罗望熙的回答(2票)】:

看了这些答案感觉“退火”这个词还是理解起来有歧义

中医的退火或者降火出现得更普遍

在翻译的过程中,可能也实在找不到合适的词来代表这个意思了。

annealing :

heat (metal or glass) and allow it to cool slowly, in order to remove internal stresses and toughen it.(退火工艺,金属或者玻璃加热到一定程度后缓慢降温从而实现内部结构的细微调整)

recombine (DNA) in the double-stranded form following separation by heat.(双链DNA加热裂解后重新组装恢复双链结构)

从这个叫角度来看,annealing侧重的是一个局部拆开重构的过程。如果要从字面意思能够理解量子退火计算的话,可以翻译为量子局部修复计算或者量子局部重构计算。

【机智熊孩子的回答(0票)】:

只说一点,这里的退火是冶金工业里的概念,

引用自百科:退火是一种金属热处理工艺,指的是将金属缓慢加热到一定温度,保持足够时间,然后以适宜速度冷却。目的是降低硬度,改善切削加工性;消除残余应力,稳定尺寸,减少变形与裂纹倾向;细化晶粒,调整组织,消除组织缺陷。准确的说,退火是一种对材料的热处理工艺

【节操约束核聚变的回答(0票)】:

不是有个退火算法嘛,怎么会是中医上的

【知乎用户的回答(0票)】:

看了上面各位前辈的比较专业的回答,我感触良多。鼓掌~赞同~感谢~

但是……Dwave原理的解释似乎没法“让一个妹抖都能理解”……这里请允许我抖(不止一)个机灵……献上我的处女答(处女抖)——辅助只接受过高中数学训练的妹抖们理解其猴版的本质。为啥?因为我是卖萌专业的。

——背景介绍,跳过不影响愉悦感——

可能关注M67前辈的人会看过一篇日志,讲的是姐夫·踏波(Jeff Tupper,百度这个名字的话,前面两个链接都应该是你需要的)的“自我涉指不等式”——一个不等式的图像画出来正好是它自己。这里,Jeff Tupper在同一篇论文里详细论述了所谓的“Tupper区间算法”。其数学基础是“区间算术”(进一步了解,参考wiki:區間)。

——背景介绍结束——

这里的区间,和数学中的区间概念上没有大差别,开、闭、宽度都有,有时用来做误差分析,指结果可能出现在这个区间里,且没法精确地确定下来是哪一个点。

看到这里,你有啥触动没?对于这种区域里的不确定性?……没有也没有问题。电子云——电子在原子核周围的空间中被“抹开”的结果,不考虑其概率大小变化,就目测来说,正像是一个电子运动的区间(这个区间实际上是无限大的啦)。

我们联系生活实际(?)建立了一个简单的模型,把量子现象看作是区间里的不确定性,问题就简单了。所谓“量子退火”,就是把“解区间”利用量子现象从大缩小,直到“收敛”为一个满足精确度要求的解。

来,用Jeff Tupper论文里出现过的画图神器GrafEq来画个图看看你就对退火有了直观的感受了。

我们来方程绘制

的图像(选这个方程没有其他意思,纯属是为了拉长绘图时间,好让我截图……)。

刚开始程序关于这个方程的解一无所知,那么方程的解的“概率云”遍布整个平面。如下。

接着,程序开始让解“退火”,舍去不可能的解区间,标为白色,留下可能有解存在的区间,标成漂亮的浅蓝色。如下。

等待一段时间,我们就能拿到比较准确的图像。你可以看到,解的概率云缩小到比较小的区间里了。这个时候,还是浅蓝色的区间表示这个区间中有方程的解,就是不知道精确的值是多少。但是已经能让人把握方程的大致图像了。如下。

于是,我们继续做个类比:量子退火里的“大自然”,在这里就成了被作图的方程

;最后确定的方程的近似图像(方程解的所在区间),就成了量子退火算法中得到的最优解。

结束啦。

*各位没有对这个动态过程的直观感受的话,可以去下GrafEq自己动手画一画。

**各位前辈看到这里,应该已经联想起级数收敛或波函数的坍缩了吧……我反正是被量子退火和区间算法萌到了。

**发现了不足之处,求马上指出啊……我是卖萌专业的,不是物理专业……难免会有错误……

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
模拟退火算法超详细教程,请收好!
小乐数学科普:数学家对流体方程引入非物理解——译自Quanta Magazine量子杂志
霍金与时间箭头之谜
光在介质里传播为什么会变慢?
只有猫才会变成液态?不,人也会 | 刘洋专栏
量子力学给我们生活带来了巨大影响,你真的了解薛定谔原理吗?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服