尽管进行了最新更新，苹果的人工智能模型仍落后于 OpenAI 的 GPT-4o

在 WWDC 2025 大会上，苹果公司为开发者和消费者宣布了几项与苹果智能相关的更新。借助新的基础模型框架，开发者现在可以为他们的应用程序带来人工智能体验，这些体验可以以保护隐私的方式离线工作，并且免费提供。Foundation Models 框架基于苹果公司内部开发的人工智能模型。

苹果还发布了新一代语言基础模型。据苹果公司称，这些更新的模型速度更快、效率更高，并改进了工具的使用，具有更好的推理能力，支持图像和文本输入的多模态，并支持 15 种语言。

Apple Intelligence 包括两种基础模型：

一个包含 30 亿个参数的模型，使用 Apple Silicon 在设备上运行。
针对私有云计算优化的基于服务器的专家混合模型。

苹果公司指出，设备上的 3B 语言模型并不是为通用聊天机器人而设计的。相反，它旨在执行与文本相关的任务，如摘要、实体提取、文本理解、提炼、简短对话和创意内容生成等。

最大的问题是，与市场上其他领先的模型相比，苹果的模型性能如何。苹果没有使用标准的人工智能基准，而是分享了自己内部对基本语言和推理能力的评估结果。

小爱大模型来了！9款无屏小爱音箱推送新系统：免费用

尽管进行了最新更新，苹果的人工智能模型仍落后于 OpenAI 的 GPT-4o

根据苹果公司基于文本的评估，其设备上的 3B 模型与稍大的 Qwen-2.5-3B 相比表现出色，与更大的 Qwen-3-4B 和 Gemma-3-4B 相比在英语方面具有竞争力。其基于服务器的模型表现略好于 Llama-4-Scout，但与 Qwen-3-235B 和 OpenAI 专有的 GPT-4o 相比则有差距。

在涉及图像输入的评估中，Apple 的设备模型表现优于 InternVL 和 Qwen，与 Gemma 相比也具有竞争力。虽然苹果的服务器模型击败了 Qwen-2.5-VL，但与 Llama-4-Scout 和 GPT-4o 相比则表现不佳。

这些结果凸显了苹果在基础人工智能能力方面还有很长的路要走。苹果将其模型与 GPT-4o 进行比较，似乎是为了使其性能看起来相对体面。如果苹果将其结果与 OpenAI 最新的 O 系列机型或谷歌的 Gemini 2.5 Pro 相比，差距可能会显得更大。未来几年，苹果将如何利用自身能力驾驭人工智能时代，让我们拭目以待。

Windows 11 24H2 的人工智能 "Recall" 功能已移植到现有硬件上

尽管进行了最新更新，苹果的人工智能模型仍落后于 OpenAI 的 GPT-4o

评论功能已关闭

目录