文 | 鲸选 AI
最近,Google 专为 AI 手机打样的 Pixel 10,宣布在 Google 相册中可以通过文字或语音编辑图像,直接调用最近大火的 Nano Banana 图片编辑模型。
这意味着手机 P 图就省事了,国外网友已经放飞想象力,玩起来了。
其实,Pixel 不是走量的手机,但是现在凭借 AI 能力,却赢得越来越多的粉丝用户。手机从智能进入 AI 时代,会成为决定销量的核心因素吗?这事苹果和三星都在深刻思考。
前阵子,罗永浩在与李想的视频播客中提到, 第一代 iPhone 发布时,声称其 OS 系统领先业界 5 年,安卓系统通过"照抄"和"照搬"iPhone,果真花费了 4-5 年时间,才在某些体验上逼近 iPhone。
而随着被国外网友称为 「全球最 AI 的手机」 谷歌 Pixel 10 系列,正在通过 Tensor G5 + 端侧 Gemini Nano 带来的组合,在 AI 领域建立吸引力。
乔布斯说,硬件上的领先只能保持 6 个月,全新的 Tensor G5 芯片,官方给到的参考是相比上一代 CPU 平均快 34%、TPU(AI 单元) 提升最高 60%。而且支持 Qi2 磁吸无线充电,相机升级到 50MP 主摄,屏幕亮度高达 3300 尼特,电池也更大了。
这些提升不是跑分炫耀,而是为了把更复杂的模型、更多的场景判断塞到本地实时完成,从而完成乔布斯说硬件领先 6 个月的后半句:软件才能建立 2-3 年的领先。现在看来,AI 也许壁垒更高,建立的领先时长也许更长。
Google 这次重磅发布 Pixel 10,也主要展现里面的 AI 功能,尤其是 Gemini 的深度整合,它是负责 「AI 理解与生成」 的落地,将你的短信、截图、通话、图片等这类信息在手机里本地串起来。
这套组合的直接结果是:很多原来需要云端的 「聪明」,如今不联网也能做、延迟更低、隐私边界更可控。
更重要的是,Pixel 10 手机从嫁接 AI,到现在越来越像个原生 AI 伙伴,它不再只是等你问问题,而是开始转变为主动帮你想事儿。
最典型的就是 Magic Cue 这个功能,它不是等你输入,而是主动猜想你的需求,拉取信息给你建议。例如,在聊天中,如果朋友询问晚餐地点,它会自动提取地址并建议回复;在打电话给航空公司时,它会弹出航班信息卡片。
相比之下,华为 Mate 70 系列的小艺助手通过自有的盘古大模型,以及接入 DeepSeek 模型,实现 AI 运动轨迹、AI 主角时刻、AI 时空穿越、AI 智控键、AI 隔空传送、AI 通话摘要、AI 通话降噪、AI 静谧通话等功能,软硬件结合的优势,让其能实现 AI 隔空传送等功能。
但囿于大模型能力的差别,华为手机的主动式 AI 能力还在努力。最典型的 AI 消息随身功能,是当检测到机主之外的注视时,手机会自动隐藏消息,保护用户隐私,这些能力更多基于算法层面,还不是模型层面。
三星 Galaxy AI(如 S25 系列) 则有 Circle to Search 等功能,能基于屏幕内容提供建议,但 Magic Cue 的预测性更强,三星的 AI 更偏向于搜索和编辑工具,而非主动 Cue 式的指导。
总体上,Pixel 10 的 Magic Cue 在主动性和跨数据源整合上领先,其他品牌的功能更碎片化或需用户启动。
摄影方面,Pixel 10 系列的 AI 也更主动,思路从 「拍完再修」,走向 「拍照时 AI 指导」。
Camera Coach 功能会在你拍照时实时介入:「嘿,角度再低点,光线会更好。」
不是事后编辑图片,而是拍摄中随时提醒。这种介入式 AI 结合 Tensor G5 处理器,实现更快处理,这便是 Add Me(提示我) 和 Best Take(自动最佳拍摄)。
华为手机目前对图片类的 AI 编辑还集中在 AI 修图等功能,如 AI 消除功能快速移除照片中的不必要元素,如水印、路人或物品等,也在开发更有趣的 AI 能力,比如鸿蒙 5 带来了双指抠图的能力,人像可以随时抠出换背景,也是算法层面的创新。
三星 Galaxy AI 的相机功能包括实时对象识别和编辑建议 (如在 S24/S25 中),但与 Camera Coach 相比,三星更注重后期编辑。Pixel 10 的这一功能在互动性和教育性上领先,华为强调硬件优化,三星则平衡于编辑与识别。
Pixel 10 的 「实时语音翻译」 的升级,让双语沟通毫无障碍,拿捏 11 种不同语言,就像手机内置了一位私人翻译一样。它会实时翻译你说的日语,让对方听到的是英语,并且保持你的音色语调,不过目前不支持中文。
苹果 iPhone 17 的 Translate app 由 Apple Intelligence 支持,提供语音翻译,Live Translation 功能还可以整合至 「讯息」 app、FaceTime 及 「电话」 app,这些能力由 Apple 自主研发的小模型运行,以确保用户的个人对话保密。
苹果自研小模型,在翻译等特定场景上表现还行,需要创意等需要大模型的场景,就得依靠 OpenAI 等公司合作,但目前进展不大。
三星 Galaxy S25 的 Live Translate 使用 Galaxy AI(基于 Gemini Pro),支持 20 种语言,包括电话和面对面,生成自然声音。Gemini Pro 覆盖更广,但部分云端依赖可能增加延迟。
这也是三星手机没有全自研系统和小模型的的劣势。但积极拥抱 Google Gemini 系列大模型,除了本地任务打不过苹果,信息整合以及图片处理等任务还是超过 iPhone 系列。
AI 手机风向的转变非常的迅速,2024 年下半年以前,各大手机厂商都加入了一场关于自研大模型的热潮,将掌握底层 AI 能力与未来手机市场的核心竞争力划等号。
可以看到,涉及到长上下文处理以及等多模态内容处理等内容,Google 凭借模型优势,还是建立起场景服务 AI 化的领先。三星紧随其后,大力引入 Google 的整套能力;华为和苹果则旗鼓相当,二者都在加速进化,补足模型方面的能力,这些能力可能需要 2-3 年的时间。
如果说过去十年的手机之争是谁的算法更强、谁的镜头更大,那接下来的竞争,会越来越像是谁更懂 「魔法」 与 「用户心理」,这是硬件+系统+大模型带来的乘法优势。
在这条路上,Pixel 10 迈出了不小的步子,尽管原生安卓的 UI,可能不如国产诸多 『完善版』 更好用。不过,Pixel 10 本身也不是 Google 走销量的产品,很多时候是为了探索发展方向。 iPhone 这块确实怎么走还没明确,iPhone 17 这次硬件不挤牙膏了,但是系统层大语言模型和图像模型,一直在思考用谁家的,Siri 的 AI 版都要拖到 2027 年才迭代了。
回到消费者视角,当手机因为 AI 更主动,便利与隐私双刃剑的问题就会席卷而至。你们怎么看这一变化?