6月初,苹果在WWDC 2023开发者大会中正式发布了头显设备Vision Pro,不仅带来了极具革命性的VR体验,为业界带来了一套成熟的多模态交互方案,更将对其他行业产生深刻的冲击。
这其中,行业规模远超VR行业的智能汽车,其实也在人机交互领域进行深刻的变革。之前的实体按钮操作方式已经跟不上潮流,也更难吸引消费者。尤其在AI时代,汽车开始走向机器人化,集度汽车机器人就已经在人机交互方面开展创新。
Vision Pro的革命性交互,可能只是汽车交互进化史的最新插曲
外界对Vision Pro的关注,除了苹果产品自带光环外,更有复杂的现实原因。在可预见的科技潮流方向中,智能汽车、VR虚拟现实、AI人工智能,已经确定为未来消费科技发展的三大主要航向。
其中,智能汽车不仅产业链条最为庞大,且可以将AI和VR有效整合,可谓是下一轮科技产品创新的主战场,而VR,之前并没有真正的代表性产品。
而被苹果CEO库克称为“革命性的空间计算设备”的Vision Pro,通过取消目前 VR 头显普遍配备的手柄,改用视线捕捉+手势+语音交互的多模态交互方式,确实也将人机交互带到了一个前所未有的高度。
我们甚至可以判断,在Vision Pro基础上如果仍想进一步扩展人机交互模式,基本只能寄希望于未来的脑机接口。
无独有偶,就在5月底,特斯拉创始人马斯克创立的脑机接口公司“神经连接”(Neuralink),宣布获得美国药监局FDA许可,将在美国开展首次人体临床试验,一时间,全球科技界一片欢呼。
更重要的是,马斯克的主业“造车”背景,更让业界的一个大胆猜想呼之欲出,VR、脑机接口等“多模态交互”交互方案,何时才能与汽车产生联系呢?毕竟,从大众普遍认知看来,受限于车规要求,汽车技术的更新总要迟缓一步。
事实上,与刻板认知相反,得益于较高的产品售价与充足的研发预算,汽车、特别是高档汽车的交互,其实长期紧跟、甚至超前于时代潮流。尤其是来到智能汽车时代之后,智能汽车在交互方式上的探索,甚至领先于许多数码产品。
就以Vision Pro看家的三大交互方式来说,手势感应、语音、乃至VR技术的发展,都与汽车座舱的发展高度密切相关。汽车座舱对这三大技术应用的历史,也构成了一部波澜壮阔的多模态交互发展史。
早在上世纪90年代末开始,以奔驰、宝马、奥迪为代表的豪华汽车品牌,就分别推出了COMAND、iDrive、MMI系统,将触控、力度反馈按键、触摸按键接近感应、语音、手势操作等交互功能相继引入至汽车的座舱系统,丝毫不逊色于同时代的消费级电子产品。
而在当下的智能汽车市场,全力汽车智能化的中国智能汽车品牌,更是将交互竞争“卷”到了新高度,其超前程度,甚至与Vision Pro的思路不谋而合。
首先是对传统屏幕交互的智能升级。这其中,既有华为将智能手机逻辑引入座舱,将可使用更多应用的超级桌面与PC协同功能装载到车机系统中,也有ROBO-01的3D渲染的UI底座交互界面,分别带来生态体验增强和视觉体验的进步。
ROBO-01的3D智能驾驶地图,渲染更加精细,还实现静态地图导航和动态感知数据融合。其实就好比是外界物理世界的投射,就像在车内能看到一个精致的数字世界一般。
与Vision Pro形态更为接近的,则是AR与VR技术在智能汽车中的应用。在VR虚拟现实领域,奥迪推出了车载VR体验“Experience rides”,可根据车辆移动情况实时匹配虚拟娱乐内容。在AR增强现实领域,很多国产新势力相继推出了AR周边;在视线捕捉领域,一众新能源汽车也都配置了DMS视线追踪、中控屏幕熄屏控制等功能。
在产品理念上,智能车甚至拥有超前于Vision Pro的设计。Vision Pro最为经验的设计就是突破目前VR头显封闭场景、将外界交互引入产品。
而智能汽车则是基于整车的一体化设计,比如说ROBO-01在大灯灯组,特别集成了交互式AI像素大灯和高识别率AI语音交互系统,拥有车外语音、代客泊车状态提示、行人提醒等多种交互方式。
真正的座舱革命:多模态交互是开端,自然交流是终局
就更深层面而言,Vision Pro大胆舍弃按键手柄,以手势感应、语音以及VR技术作为交互方式的革新,其实已经为未来交互的演进方向做出了示范:即尽可能减少使用者的“刻意”交互,尽量以人最本能的使用方式来展开人机交互。这一理念的底层逻辑,其实正是当年乔布斯以多点触控革新手机交互的精神延续。
为了在当前技术条件下实现这一交互目标,Vision Pro目前的使用场景多固定在室内空间,而这恰恰与汽车智能座舱的密闭空间相当一致,这也就为Vision Pro类技术“上车”提供更多的想象空间。巧合的是,ROBO-01大胆取消大量物理按键的设计,其实与Vision Pro的去手柄设计具有一致的逻辑共通点。
而另一方面,汽车智能座舱不仅拥有自己的使用场景特点(如服务于交通行驶场景、面向多人、必须保证安全、赋能支持自动驾驶功能等),更在交互深度方面与目前的Vision Pro产生了分野。
最重要的不同点在于,Vision Pro代表的多模态交互仍存在过分侧重丰富交互形式的缺点。而想要真正提升人机交互的效率,就必须增强交互的质量。也就是说,人机交互,除了要在横向的增加交互方式,在纵向维度,交互深度也必须产生变革,而这一点,智能汽车已经在2021年就开始探索。
其实,这一点也是Apple的最新判断,在WWDC 2023大会现场在Vision Pro前发布的,正是 iOS17的最新升级。未来,Siri的唤醒指令不再是熟悉的“Hey Siri”,而是更直接的“Siri”。
虽然只是三个字母的变动,却体现出苹果对人机对话的最新思考。
毕竟,在人与人的亲密交流中,大多时候都会是直接称呼对方。可以说,在这次Siri唤醒的精简背后,更体现出未来人机交互的重要原则:自然交流。
这与智能汽车机器人的设计理念不谋而合。早在2021年成立之初,集度即旗帜鲜明的提出了“自然交流”,认为智能汽车必须实现“人车交互及语音语义的精准识别,让车与人能自然交流,理解用户情绪,实时响应用户需求”,早在ChatGPT早期版本被群嘲的时代,就认识到了自然语言人机交互的重要性。
更重要的是,集度的“自然交流”理念,其实归属于其对自家汽车机器人的“自由移动、自然交流、自我成长”三大理念之中,其实也正代表着人机交互的终局方向,即产品的机器人化。
“产品的机器人化”这一理念在智能汽车行业依旧领先。自集度提出“汽车机器人”概念以来,目前,汽车机器人概念已经成为业界共识:除特斯拉公开宣布“汽车,就是四轮机器人外,在实践中,通用汽车也宣布将ChatGPT搭载到汽车之中,如果再配合通其Super Cruise超级辅助驾驶系统,一个初级阶段的机器人形态已经若隐若现。
集度则更是以AI技术作为底层支撑,将离线语音、文心一言大模型、高阶自动驾驶驾驶有机融合在汽车机器人中,从开始即以打造机器人形态的产品为目标。
类似苹果Vision Pro的VR产品何时上车暂且不知,但更自然的交互方式一定是智能汽车发展方向。这一猜测的现实依据在于,AI会让汽车变得越来越聪明,达到类人的交流能力。作为第三代智能终端的智能汽车,语音、视觉、动作识别等多模态交互所带来的“自然交流”将会逐渐成为主要特征。
关键词: