在 WWDC 2025 大会上,苹果公司为开发者和消费者宣布了几项与苹果智能相关的更新。借助新的基础模型框架,开发者现在可以为他们的应用程序带来人工智能体验,这些体验可以以保护隐私的方式离线工作,并且免费提供。Foundation Models 框架基于苹果公司内部开发的人工智能模型。

苹果还发布了新一代语言基础模型。据苹果公司称,这些更新的模型速度更快、效率更高,并改进了工具的使用,具有更好的推理能力,支持图像和文本输入的多模态,并支持 15 种语言。

尽管进行了最新更新,苹果的人工智能模型仍落后于 OpenAI 的 GPT-4o

Apple Intelligence 包括两种基础模型:

  • 一个包含 30 亿个参数的模型,使用 Apple Silicon 在设备上运行。
  • 针对私有云计算优化的基于服务器的专家混合模型。

苹果公司指出,设备上的 3B 语言模型并不是为通用聊天机器人而设计的。相反,它旨在执行与文本相关的任务,如摘要、实体提取、文本理解、提炼、简短对话和创意内容生成等。

最大的问题是,与市场上其他领先的模型相比,苹果的模型性能如何。苹果没有使用标准的人工智能基准,而是分享了自己内部对基本语言和推理能力的评估结果。

小爱大模型来了!9款无屏小爱音箱推送新系统:免费用

尽管进行了最新更新,苹果的人工智能模型仍落后于 OpenAI 的 GPT-4o

根据苹果公司基于文本的评估,其设备上的 3B 模型与稍大的 Qwen-2.5-3B 相比表现出色,与更大的 Qwen-3-4B 和 Gemma-3-4B 相比在英语方面具有竞争力。其基于服务器的模型表现略好于 Llama-4-Scout,但与 Qwen-3-235B 和 OpenAI 专有的 GPT-4o 相比则有差距。

在涉及图像输入的评估中,Apple 的设备模型表现优于 InternVL 和 Qwen,与 Gemma 相比也具有竞争力。虽然苹果的服务器模型击败了 Qwen-2.5-VL,但与 Llama-4-Scout 和 GPT-4o 相比则表现不佳。

这些结果凸显了苹果在基础人工智能能力方面还有很长的路要走。苹果将其模型与 GPT-4o 进行比较,似乎是为了使其性能看起来相对体面。如果苹果将其结果与 OpenAI 最新的 O 系列机型或谷歌的 Gemini 2.5 Pro 相比,差距可能会显得更大。未来几年,苹果将如何利用自身能力驾驭人工智能时代,让我们拭目以待。

Windows 11 24H2 的人工智能 "Recall" 功能已移植到现有硬件上