如何让AI更懂用户?除了自然语言交互之外,专业级的视觉交互正在成为AI理解用户日常场景和需求的核心入口。

3月30日,vivo X300 Ultra以及vivo X300 S在云南丽江正式发布。vivo产品副总裁黄韬在发布会上表示,“vivo X300 Ultra让每位认真生活、认真记录的人,都能够拥有专业级的影像能力”。

在这两款新品背后,vivo深耕多年的影像能力再上台阶:依托专业级影像能力,打造AI理解用户场景的核心入口。

影像成为AI融入物理世界的重要途径之一

一直以来,强大的影像功能是用户选购手机的重要参考。伴随各类AI应用日常普及,以AI为驱动的影像综合体验成为新的需求点:视频拍摄、编辑以及交互这些环节的智能化,让手机的影像功能从记录逐渐演变为“理解并和用户共同创作的智能伙伴”。


全焦段、高画质以及创作的便捷性是vivo专业“V单”的三大特点。

影像手机玩家吴峰在接受记者采访时谈道,手机影像是用户应用场景最广、频次最高的功能,“随着AI时代到来,用户对于各类AI应用的需求日渐攀升。除了自然语言交互之外,专业级的影像能力,能更精确、更真实地记录场景和反馈需求,影像已经成为AI融入物理世界的重要途径之一。”

他认为,影像是物理世界数字化的关键一步,是AI“看见”环境、“理解”场景、“预判”行动的必需条件。

吴峰观察到的这种以技术为导向的用户需求变化背后,vivo“AI+影像”战略实现跃迁。刚刚结束的博鳌亚洲论坛2026年年会上,vivo总裁、首席运营官,vivo中央研究院院长胡柏山阐述了一个全新的观点:AI大模型竞争趋向同质化,未来AI竞争最大的差异化来自于场景数据,“感知”成为AI下半场的核心。

专业级影像能力为AI落地带来优势

影像,是“感知”的重要方式之一。如何让手机端的“感知”能力更专业化?

全新亮相的vivo X300 Ultra定位“专业V单”。以全焦段、高画质以及创作的便捷性为看点,除了手机本身搭载的蔡司人文纪实镜头、云台长焦镜头和超广角镜头外,vivo X300 Ultra还特别带来等效200mm和等效400mm的两款增距镜,超长焦舞台抓拍、赛事抓拍这些场景都能轻松实现。


专业级的影像能力为AI感知打开空间。

同时,其全链路的视频创作能力将为用户带来丰富的体验,从全焦段防抖、收音、操控、监看、回放到后期编辑,每个环节的专业级操作都能在这部手机上轻松完成。

值得一提的是,vivo还为新款机型打造了专业拍摄套件,方便用户在视频拍摄中添加麦克风、补光灯、电源等其他外部设备。除了专业级的影像能力之外,vivo正在依托手机端的大模型,为用户带来更智能更便捷的AI影像体验。

吴峰认为,在这些变化背后,手机影像的竞争已经从传统的像素、变焦倍数、成像质量转向影像对用户场景的理解、动态范围的感知以及大模型加持下的影像能力交互等方面,专业级的影像能力同时也成为AI在手机端落地的优势所在。

“感知能力”竞争加速AI终端扩张

以“感知能力”为核心的技术体系,不仅是智能手机的核心竞争力,更是通向机器人、混合现实(MR)头显等下一代智能终端的底层技术基石。

行业观察者田熙认为,“手机的影像能力竞争无论硬件还是算法,基本上达到天花板级。在各类AI应用中,影像已经成为重要的交互形态,有丰富积淀的品牌厂商其核心竞争力将更为凸显,而且有机会将这种能力延伸至其他智能产品形态。”

当前,AI发展正在从单纯的生成式AI向AI智能体(Agent)演进。生成式AI负责创造内容,AI智能体负责执行任务,其过度升级的关键正是对场景的精准理解。

这意味着,智能手机竞争已经不再局限于大模型的参数量,而在于更精准地切入用户场景。影像能力越强,AI对环境的感知就越敏锐,其作为“个人助理”的决策就越准确。

田熙总结道,在未来一个阶段内,手机厂商围绕“感知能力”的竞争将成为重点。谁能在“感知”层面构建起从传感器到芯片、从算法到系统的全链路能力,谁就能在AI终端的扩张竞争中占据主动。

上游新闻记者 杨昕华 摄影报道