手机 AI 新局：Google、苹果、三星顶流斗法

猜您喜欢

黄仁勋访华重磅官宣，H20 芯片恢复对华销售

3 月之前

Apple Remains Unaffected by New Tariffs on India, Adds $100 Billion Committed Investment in U.S.

2 月之前

文 | 鲸选 AI

最近，Google 专为 AI 手机打样的 Pixel 10，宣布在 Google 相册中可以通过文字或语音编辑图像，直接调用最近大火的 Nano Banana 图片编辑模型。

这意味着手机 P 图就省事了，国外网友已经放飞想象力，玩起来了。

其实，Pixel 不是走量的手机，但是现在凭借 AI 能力，却赢得越来越多的粉丝用户。手机从智能进入 AI 时代，会成为决定销量的核心因素吗？这事苹果和三星都在深刻思考。

前阵子，罗永浩在与李想的视频播客中提到，第一代 iPhone 发布时，声称其 OS 系统领先业界 5 年，安卓系统通过"照抄"和"照搬"iPhone，果真花费了 4-5 年时间，才在某些体验上逼近 iPhone。

而随着被国外网友称为「全球最 AI 的手机」谷歌 Pixel 10 系列，正在通过 Tensor G5 + 端侧 Gemini Nano 带来的组合，在 AI 领域建立吸引力。

乔布斯说，硬件上的领先只能保持 6 个月，全新的 Tensor G5 芯片，官方给到的参考是相比上一代 CPU 平均快 34%、TPU（AI 单元）提升最高 60%。而且支持 Qi2 磁吸无线充电，相机升级到 50MP 主摄，屏幕亮度高达 3300 尼特，电池也更大了。

这些提升不是跑分炫耀，而是为了把更复杂的模型、更多的场景判断塞到本地实时完成，从而完成乔布斯说硬件领先 6 个月的后半句：软件才能建立 2-3 年的领先。现在看来，AI 也许壁垒更高，建立的领先时长也许更长。

Google 这次重磅发布 Pixel 10，也主要展现里面的 AI 功能，尤其是 Gemini 的深度整合，它是负责「AI 理解与生成」的落地，将你的短信、截图、通话、图片等这类信息在手机里本地串起来。

这套组合的直接结果是：很多原来需要云端的「聪明」，如今不联网也能做、延迟更低、隐私边界更可控。

更重要的是，Pixel 10 手机从嫁接 AI，到现在越来越像个原生 AI 伙伴，它不再只是等你问问题，而是开始转变为主动帮你想事儿。

最典型的就是 Magic Cue 这个功能，它不是等你输入，而是主动猜想你的需求，拉取信息给你建议。例如，在聊天中，如果朋友询问晚餐地点，它会自动提取地址并建议回复；在打电话给航空公司时，它会弹出航班信息卡片。

相比之下，华为 Mate 70 系列的小艺助手通过自有的盘古大模型，以及接入 DeepSeek 模型，实现 AI 运动轨迹、AI 主角时刻、AI 时空穿越、AI 智控键、AI 隔空传送、AI 通话摘要、AI 通话降噪、AI 静谧通话等功能，软硬件结合的优势，让其能实现 AI 隔空传送等功能。

但囿于大模型能力的差别，华为手机的主动式 AI 能力还在努力。最典型的 AI 消息随身功能，是当检测到机主之外的注视时，手机会自动隐藏消息，保护用户隐私，这些能力更多基于算法层面，还不是模型层面。

三星 Galaxy AI（如 S25 系列）则有 Circle to Search 等功能，能基于屏幕内容提供建议，但 Magic Cue 的预测性更强，三星的 AI 更偏向于搜索和编辑工具，而非主动 Cue 式的指导。

总体上，Pixel 10 的 Magic Cue 在主动性和跨数据源整合上领先，其他品牌的功能更碎片化或需用户启动。

摄影方面，Pixel 10 系列的 AI 也更主动，思路从「拍完再修」，走向「拍照时 AI 指导」。

Camera Coach 功能会在你拍照时实时介入：「嘿，角度再低点，光线会更好。」

不是事后编辑图片，而是拍摄中随时提醒。这种介入式 AI 结合 Tensor G5 处理器，实现更快处理，这便是 Add Me（提示我）和 Best Take（自动最佳拍摄）。

华为手机目前对图片类的 AI 编辑还集中在 AI 修图等功能，如 AI 消除功能快速移除照片中的不必要元素，如水印、路人或物品等，也在开发更有趣的 AI 能力，比如鸿蒙 5 带来了双指抠图的能力，人像可以随时抠出换背景，也是算法层面的创新。

三星 Galaxy AI 的相机功能包括实时对象识别和编辑建议（如在 S24/S25 中），但与 Camera Coach 相比，三星更注重后期编辑。Pixel 10 的这一功能在互动性和教育性上领先，华为强调硬件优化，三星则平衡于编辑与识别。

Pixel 10 的「实时语音翻译」的升级，让双语沟通毫无障碍，拿捏 11 种不同语言，就像手机内置了一位私人翻译一样。它会实时翻译你说的日语，让对方听到的是英语，并且保持你的音色语调，不过目前不支持中文。

苹果 iPhone 17 的 Translate app 由 Apple Intelligence 支持，提供语音翻译，Live Translation 功能还可以整合至「讯息」 app、FaceTime 及「电话」 app，这些能力由 Apple 自主研发的小模型运行，以确保用户的个人对话保密。

苹果自研小模型，在翻译等特定场景上表现还行，需要创意等需要大模型的场景，就得依靠 OpenAI 等公司合作，但目前进展不大。

三星 Galaxy S25 的 Live Translate 使用 Galaxy AI（基于 Gemini Pro），支持 20 种语言，包括电话和面对面，生成自然声音。Gemini Pro 覆盖更广，但部分云端依赖可能增加延迟。

这也是三星手机没有全自研系统和小模型的的劣势。但积极拥抱 Google Gemini 系列大模型，除了本地任务打不过苹果，信息整合以及图片处理等任务还是超过 iPhone 系列。

AI 手机风向的转变非常的迅速，2024 年下半年以前，各大手机厂商都加入了一场关于自研大模型的热潮，将掌握底层 AI 能力与未来手机市场的核心竞争力划等号。

可以看到，涉及到长上下文处理以及等多模态内容处理等内容，Google 凭借模型优势，还是建立起场景服务 AI 化的领先。三星紧随其后，大力引入 Google 的整套能力；华为和苹果则旗鼓相当，二者都在加速进化，补足模型方面的能力，这些能力可能需要 2-3 年的时间。

如果说过去十年的手机之争是谁的算法更强、谁的镜头更大，那接下来的竞争，会越来越像是谁更懂「魔法」与「用户心理」，这是硬件+系统+大模型带来的乘法优势。

在这条路上，Pixel 10 迈出了不小的步子，尽管原生安卓的 UI，可能不如国产诸多『完善版』更好用。不过，Pixel 10 本身也不是 Google 走销量的产品，很多时候是为了探索发展方向。 iPhone 这块确实怎么走还没明确，iPhone 17 这次硬件不挤牙膏了，但是系统层大语言模型和图像模型，一直在思考用谁家的，Siri 的 AI 版都要拖到 2027 年才迭代了。

回到消费者视角，当手机因为 AI 更主动，便利与隐私双刃剑的问题就会席卷而至。你们怎么看这一变化？