苹果虽迟但到？革命性3B模型震撼发布：超越GPT-4！

苹果公司推出的新的人工智能模型使Siri变得更加智能，并且在性能上超越了GPT-4。

苹果公司揭示了一种名为ReALM的新技术，用于提升人工智能在对话中理解引用的能力，以及对屏幕上的或在后台运行的项目的理解。

针对边缘设备
性能提升超过5%
表现超越GPT-4

苹果 ReALM 模型

苹果公司最新发布的ReALM模型标志着 AI 领域一个重要的里程碑。该大型语言模型（LLM）被设计用于改善语音助手，如Siri中的参考解析能力。ReALM，全称为“Reference Resolution As Language Modeling”，可认为是代表了苹果在AI领域的最新创新。

ReALM 模型有四个不同的规模：ReALM-80M、ReALM-250M、ReALM-1B 和ReALM-3B，每个版本都针对不同的处理能力和应用场景。这一系列模型的开发，显示了苹果在人工智能大模型方面的规划和雄心。

与其他的大语言模型不同，ReALM 采用了一种独特的方法来处理语言理解问题。它将参考解析视为一个语言建模问题，并利用大型语言模型（LLMs）来提升性能。这意味着ReALM能够将屏幕上的元素重构为文本表达，以便更好地理解和回应用户的指令。

ReALM的出现为未来的智能助手带来了极大的新可能性，尤其是在提高它们理解对话上下文和屏幕元素的能力上。苹果的这一创新不仅体现在技术进步上，也预示着智能助手发展的新方向。

来自苹果的创新：ReALM 如何改变对话理解

ReALM模型的独特之处在于它处理对话理解的方式。传统的语音助手往往在参考解析方面存在局限性，例如在理解对话上下文或屏幕上的元素时可能会遇到困难。ReALM模型通过将这些挑战视为一个语言建模问题，开创性地改进了这一点。

具体来说，ReALM能够将屏幕上的元素，如图标、文本和其他用户界面组件，转化为文本形式。这使得模型可以更准确地理解用户指令中的参考内容，如“关闭那个闹钟”或“打开我昨天阅读的文章”。此外，ReALM在处理背景活动时也显示出优越的理解能力，为用户提供更自然、更贴近实际情景的交互体验。

ReALM模型的这一创新不仅提升了语音助手的智能性，也为未来的人机交互提供了新的思路。通过更深入地理解用户的需求和上下文，ReALM为提供更为丰富和个性化的服务奠定了基础。

该技术的突破也显示了苹果在AI和自然语言处理方面的领导地位。通过ReALM，苹果不仅能极大提升其 iPhone, iPad, Mac, AirPods 和Apple VisionPro 等产品的用户体验，同时也为整个行业树立了新的技术标准。

挑战王者：ReALM与GPT-4性能比较

在比较ReALM与当前领先的语言模型GPT-4时，苹果的新模型展示了一些显著的优势。虽然在参数数量上远不及GPT-4，ReALM在某些关键领域的表现仍然堪比甚至超越了GPT-4。

ReALM的主要优势之一在于其对话上下文和屏幕元素的理解能力。它能够有效处理屏幕参考问题，这在传统的语言模型中往往是个挑战。不同于GPT-4，ReALM不需要屏幕截图即可准确解析用户指令中涉及的屏幕元素。这一特性在智能手机和其他便携设备上尤为重要，它们经常涉及对屏幕内容的直接参考。

另一个重要的点是ReALM的规模和适应性。ReALM模型从80M参数的小型版本到3B参数的大型版本，为不同的应用和设备提供了灵活的选择。这种多样性使得ReALM不仅适用于高性能设备，也能在资源有限的设备上运行，从而拓宽了其应用范围。

ReALM在特定任务上的性能表现，特别是在理解对话上下文和屏幕元素方面的优异能力，标志着苹果在自然语言处理领域的一次重大突破。尽管GPT-4在某些方面仍保持领先地位，但ReALM在特定应用领域的突出表现表明，苹果正在迅速赶上并可能在某些关键领域超越竞争对手。

应用前景：ReALM在Siri中的实际运用

ReALM模型的推出预示了苹果语音助手Siri的一次重大升级。这一创新不仅有望提高Siri的理解能力，还将极大地改善用户与其交互的自然度和效率。Siri作为苹果设备中最受欢迎的功能之一，其性能的提升将直接影响到数亿用户的日常生活。

ReALM能够在没有视觉输入的情况下，更准确地解析和响应用户基于屏幕内容的指令。例如，用户可以对Siri说“打开那个我昨天查看的文件”，而无需具体指明哪个文件。ReALM的先进算法能够理解这类含糊的参考，并执行正确的操作。

或者用户可以直接说：可以把屏幕调亮一些吗？模型会识别为这是要进行系统设置的调整，并准确进行该操作。

ReALM在理解背景活动和对话上下文方面的优势，为Siri提供了更深层次的情境感知能力。这意味着Siri可以更好地理解用户的需求，甚至在复杂或不连续的对话中也能提供相关和有用的响应。

ReALM的集成不仅限于提高Siri的响应精确度，还包括了提升其整体的智能水平和用户体验。这将使得Siri在未来的智能家居、移动通信以及日常生活中的各种场景下，成为更加强大且可靠的助手。

ReALM模型的应用将使得Siri成为一个更加智能、更能理解人类语言和需求的助手，苹果在智能语音助手领域很可能也即将迎来一次重大飞跃。

行业影响：专家视角与市场预测

ReALM模型的发布引起了科技界的广泛关注。行业专家普遍认为，苹果这一创新不仅对其自身产品产生重大影响，而且可能改变整个智能助手行业的竞争格局。专家们对ReALM的技术细节和实际应用效果表示了高度的兴趣和赞赏。

一些分析师预测，ReALM的推出可能会促使其他科技巨头加快自己的AI研发步伐，特别是在自然语言理解和参考解析领域。这可能导致一场以AI技术为中心的“军备竞赛”，各大公司争相开发更加高效和智能的语言模型。

市场预测方面，ReALM的成功实施预计将增强苹果在智能设备市场的竞争优势。用户对更智能、更人性化的交互体验的需求不断增长，这可能会进一步提升Siri的吸引力，并推动苹果设备的销售。

随着ReALM在Siri中的实际应用展示出优异的性能，苹果可能会利用这一技术在其他产品和服务中实现更多创新。从智能家居到移动通信，ReALM的广泛应用前景将为苹果带来新的增长机会。

ReALM的推出不仅是苹果技术创新的重要里程碑，也可能成为推动整个行业发展的关键因素。随着AI技术的不断进步，ReALM可能只是苹果在这一领域探索的开始。

苹果战略举措：合作与独立路线的平衡

苹果公司在推出ReALM模型的同时，也面临着决定其在人工智能领域未来战略方向的关键时刻。一方面，有消息称苹果计划与谷歌在某些AI项目上进行合作，这引发了对苹果独立发展AI技术能力的疑问。另一方面，ReALM的成功显示了苹果强大的内部研发能力，表明公司有能力在AI技术上走自己的路。

业界观察人士分析认为，苹果可能寻求与谷歌等公司合作，是为了获得更多数据和资源，以加速AI技术的发展。此外，与其他公司的合作也可能是苹果在特定领域快速取得进展的策略之一。

苹果一直以保护用户隐私而闻名，这也是其选择自主开发AI技术的主要原因之一。使用ReALM等内部开发的技术，苹果能够更好地控制数据处理方式，确保用户隐私安全。

ReALM的推出也表明苹果愿意分享其研究成果，这是该公司不寻常的一步，也许预示着苹果在AI领域更开放的未来方向。这种策略的转变可能有助于苹果在竞争激烈的AI市场中占据更有利的位置。

苹果在AI技术上的战略选择反映了合作与独立发展之间的复杂平衡。通过内部开发和外部合作的结合，苹果正在为自己在快速发展的人工智能市场中定位，同时保持其作为创新引领者的声誉。

苹果AI的未来发展

ReALM模型的推出，苹果公司在人工智能领域的地位将极大巩固和提升。这一里程碑事件不仅标志着苹果在技术创新上的新成就，也为其未来在AI技术和AI Agent 领域的发展指出了些方向。

ReALM的成功展示了苹果在自然语言处理和语音助手技术领域的领导地位。随着技术的不断完善和应用的深入，我们可以预期Siri和其他苹果服务将变得更加智能和用户友好。

苹果在保持自主研发的同时，与其他科技巨头的潜在合作为其在AI领域的发展带来了新的可能性。这种策略可能有助于苹果在保护用户隐私的前提下，更快地推进技术创新和市场扩张。

ReALM的推出也为苹果未来的AI策略提供了新的视角。随着AI技术的不断进步和应用的日益广泛，苹果有可能在智能家居、健康监测、自动驾驶等领域推出更多创新产品和服务。

作为技术创新的领导者，苹果的每一步都受到业界的高度关注。ReALM模型的推出不仅是苹果AI技术的一个重要进步，也可能成为推动整个行业发展的催化剂。

苹果的ReALM模型不仅在技术层面引领了一场变革，也为公司未来的发展策略和行业趋势提供了新的视角。随着AI技术的不断发展和应用的扩大，我们有理由期待苹果在这一充满潜力的领域取得更多突破性的成就。

ReALM模型的发布，成为讨论和研究的热点，部分评论如下：

Vishnu Suresh Perumbavoor: 苹果和谷歌的衰落。

ROIC投资者: 他们可能需要谷歌的基础设施才能实现所需的规模运行。

Yogesh K: ReALM对人形机器人可能非常有用。人类可以引用任何对象，并指示人形机器人执行涉及该对象的任务。

醉汉蓝精灵: 可能是关于Gemini nano的🤔有谁已经与它互动了吗？在移动设备上本地运行一个强大的LLM听起来相当强大。

Dave 8x7B: 看到这一点真令人兴奋！至于Gemini的事情，我确信他们必须向苹果展示一些鼓舞人心的东西，不仅仅是“相信我们，我们做得很好！”才能让他们签署合作协议。想知道那幕后是什么！

DukeMukem (e/acc): 可能是关于谷歌已经可以提供的计算能力。特别是考虑到目前对H100s的需求。

N: 巨大的颠覆即将到来。

Marsonal: 一个3b模型怎么能击败gpt4的水平，看起来像是他们在基准测试上训练的！

K Raju: 🤣🤣🤣

Leckmich: “击败”13个月前的Gpt 4并不是什么值得夸耀的事。

Mark G: 很高兴你看到了这篇论文。ReALM（从80M到3B）更像是一个针对Siri的代理式升级，而不是Gemini的竞争对手，但由于它具有上下文意识，它在这些狭窄的情况下胜过了GPT-4。苹果的模型：ReALM 80M~3B 在设备上运行，Ferret 7B Visual，MM1 30B LLM击败80B模型。

Mark G: 今天可能是4月1日，但苹果的最新AI发布（不像Siri）并不是玩笑。- ReALM（参考解析作为语言建模）用于理解上下文，包括屏幕元素，如地址和电话号码。这正是Siri应该做但没做到的。

Simon Byrnand: 苹果没有从谷歌地图/苹果地图中学到教训吗？

The Alex Houck: 谷歌的计算成本较低，计算资源足够。

Matthias Heger - e/acc ⏩: 参考解析只是智能的一个方面。苹果使用Gemini可能有很多原因。也许他们想尽快拥有一个运行的系统。或者他们想要合作，因为他们没有足够的AI专家与OpenAI竞争。

Wake up! It’s the first of the month!: LLMs并不总是足够正确，苹果不会冒着在更广泛的人群中损害自己声誉的风险支持其中一个。让谷歌为iOS LLM的错误承担“热度”，当向数亿用户开放技术时，是一个好举措。

Al Zazeera Correspondent: 它总是回应“快乐的跨性别可见性日，我们重视您的隐私”。

CS Feed🇺🇦🇺🇸: 更像是苹果最好的营销。

Roshan: 当AbacusAI变得大时，你会理解各种原因下的商业战略举措。ReALM和Gemini可能为一个价值约3万亿美元的公司服务于不同的目的。你绝对可以做出多个小赌注。苹果通过与谷歌合作并没有失去选择性。

Nicolli Massachi: 这是一个商业决定🤑。

Marc J. Saint-Jour: 现在这一切都是理论上的，我不相信ReALM能超过GPT4。

Axel Darmouni: 也许是因为红队测试。ReALM论文没有提到任何安全训练，尽管存在争议，谷歌的Gemini非常谨慎。如果他们想在设备上使用LLM，他们需要确保它尽可能安全，避免任何越狱尝试。

Duaji: 谷歌很可能为这个合作付费。

hassan: 可能恰恰相反，谷歌想与苹果合作，这样苹果设备上的流量可以保持Gemini的实时训练。Safari的默认搜索引擎是谷歌搜索，所以没有其他默认选项，手机查询的一半都不会错过。

ktguru: Bindu非常有洞察力 —— 你所说的亲密，是不是在暗示咳咳某个公司在保留默认搜索引擎的选择上的辩护，以及另一个公司通过最少时间授权他们的LLM所希望看到的现金流再平衡…

Yogesh K: 苹果的这个LLM在参数方面很小，它的方法考虑了对屏幕内容的引用，他们将其定位为iOS的设备代理助手。这将显著提高Vision Pro的可用性。

Sufiyan Hamza: 有趣的发展。

Calm: 苹果想要通过使用谷歌作为他们的默认搜索引擎来赚钱——像这样的事情会让谷歌为了这一特权支付更多费用。

Max: 这篇论文读起来像是更具代理性的Siri的前奏，而不是通用任务的生成模型。他们可能想要外包生成组件，以：a) 避免跳过所有国际监管障碍；b) 将幻觉归咎于他们的LLM提供商。

Yogesh K: 可能是谷歌庞大的数据吸引了苹果与Gemini合作？

Areda Emma Afuru Odelo: GPT-4太旧了（难以置信），所以大多数新玩家都会这样做，主要是因为每个人都有自己的基准。苹果和谷歌实际上就像共妻一样。为了管理他们的“男人”并从中获得最佳效果，需要更多的合作而不是竞争。

Akhil Gurrapu: 即使苹果拥有强大的团队并构建了开创性的模型，他们也因其隐私政策而缺乏用户数据，而谷歌则拥有大量数据。

DeReK WaTSoN: 我一直期待苹果发布一些重大声明，让他们牢牢站在AI游戏中，但这不是那个。

Bharathchinneni: 毫无疑问，这笔交易更多的是互惠互利。

Sachin B: 说真的，这是引人入胜的研究。

TexasPundit: 他们还无法建造太瓦特级的计算能力，因为能源、设施、芯片还不存在。所以他们宁愿一直跟着走，直到他们可以像Apple Maps那样做。

Kevin 👁🐝🍁: 我仍然相信Gemini是为更广泛的外部查询准备的。

注：本内容来自于同名知识星球《AGI Hunt》，由AI 创作完成。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。