明敏发自凹非寺
量子位公众号 QbitAI
空间计算的 ChatGPT 时刻还有多远?
这是行业代表玩家最新动作引发的思考。
刚刚,Rokid 发布新一代产品Rokid AR Lite,一种空间计算的新范式应运而生——AR 主机单手操作触摸屏,在三维空间沿用“触摸”,零门槛进入 XR 空间。
只需像操控电脑触控板一样,即可和虚拟大屏交互,完全无需学习新操作方式。
一副眼镜+一个单手可持的小主机,可随身携带,飞机、户外都能玩。
可以用它办公、看电影、刷小红书或者是打原神。
好家伙,空间计算这是要向普通生活的方方面面渗透了啊。
而且还用上了目前为止广大消费者最习惯的交互方式——触摸。
价格上也相当亲民,千元级别,一部手机的价位。厂商拍胸脯说保证大家买得起。
悄然间,一场要面向全社会范围的空间计算普及推广,正在开启。
如果说 ChatGPT 的出现意味着 AI 拥抱全民,那么空间计算的 ChatGPT 时刻,还有多远呢?
空间计算走到哪了?
来参考 Rokid 给出的最新进展。
此次发布的新品为 Rokid AR Lite,显示终端为Rokid Max 2,计算终端是Rokid Station 2。
眼镜方面,重量依旧保持在 75g 水平。支持0-600 度屈光。
超线性私密定向扬声器隔音 45db,超过主流水平 30%。
为了保证更好的“上头”体验,它在镜腿、鼻托等细节部件上升级,同时支持智能瞳距调节。
AR 主机 Station 2朝着轻巧、单手操作上深度改进。
最大的改变在于交互方式上的改变,从物理按键改成了触摸屏。但是上手门槛很低,“和电脑触控板交互方式保持一致”。
支持空间触控交互和空间射线交互两种。
触控交互更贴近于智能手机、电脑触控板的交互,支持单指、双指、三指(都有不同功能)等触控方式。
射线交互更贴近于 XR 玩家,“一甩”就能快速校准和重置指针。
由此,Rokid AR Lite 最大可以实现等效 6 米外300吋超级大屏。支持任意调节虚拟屏的大小和距离。
这样在一个空间里可以放置多个窗口,想要切换只需转转头即可,也能自动切换窗口。
还能将电脑、手机(安卓和 iOS)屏幕快速无线投屏,在 XR 空间里秒变32:9 超宽屏。
在巨幕模式下,还能开启运动模式,实现逐帧追踪防抖。保障在汽车、飞机等颠簸场景中的画面稳定,降低因外界抖动带来的眩晕感。
续航方面,Station 2 电池容量达 5000mAh。
升级双 type-C 双接口,支持 18w 边充边玩,满足更长时间体验的要求。
系统方面,Rokid 联合高通为最新 YodaOS-Master 进行优化,在画面渲染、AI 计算等方面均有提升。
YodaOS-Master 文件管理原生级支持 NAS 和云盘,可以免费无限制使用 100G 存储。同时视频内容支持范围扩大,支持硬解码 4K 30 帧的视频,通过文件管理器还可以快速选择内容同步到“回忆”进行播放。
此外,Rokid AR Lite 也优化了蓝牙连接,接上无线键盘,就能在 AR 眼镜上体验 PC 的办公效率。
梳理来看,Rokid AR Lite 正如其名,提供了一种更加轻量化的空间计算范式。
它在交互方式上更加亲民,方便更多普通消费者上手即用。面向的场景包括移动办公、观影娱乐、出行等,相较于去年 Rokid AR Studio 针对空间计算办公套件的定位,范围也更广。
显然,这是一款瞄准更大众消费者市场的产品。
在当下时刻,从 Vision Pro 发售到 Rokid AR Lite,厂商们纷纷交出自己的趋势理解和范式参考,消费者也蠢蠢欲动。
正如 Rokid 所说,人们对于信息交互体验的追求是无止境的。在智能手机足够成熟的今天,几乎所有人都在期待下一代计算终端能带来什么新故事。
从个人计算到移动计算再到空间计算,这个未来终局已经不容置疑。
但问题是,距离这场技术革命的爆发还会有多远?
空间计算的 ChatGPT 时刻还有多远?
首先来看,“ChatGPT 时刻”如何定义?
从技术成熟度、产品完整度以及行业社会影响三个方面来看。
技术维度,ChatGPT 的出现表明 AI 在聊天对话方面达到或接近人类水平,表现出强大的生成、迁移和交互能力;产品维度,ChatGPT 提供了自然流畅的对话体验,普通人可直接免费使用;行业及社会影响方面,ChatGPT 凭借成熟的底层技术和完善的产品体验,快速引发全社会关注。
总结来看,抵达 ChatGPT 时刻至少需要具备三重要素:
技术成熟度高 产品完善度高 大众影响力高对应到空间计算领域,现在距离“ChatGPT 时刻”还有多远?
从今天 Rokid 发布会所曝光的新品 Rokid AR Lite 来看,这个时刻已经不远了。
从技术成熟度来看,Rokid AR Lite 已经能够实现多重功能应用,打开智能眼镜后,可以轻松进行办公、娱乐,超级大屏上有无限影音内容。
从产品完善度来看,产品定价 X499,普通用户购买使用的门槛较低,相对低的价格,就能购买到功能完善的产品。此外产品使用了触控板和射线操控的模式,用户能与过往操作习惯无缝衔接。且重量极轻,方便日常佩戴。
从大众影响力来看,Rokid AR Lite 发布时,现场掌声如雷,但最终能走多远,依然还需要市场来检验。
发展路线方面,Rokid 一直坚持 OST 路线,这也是它能将眼镜做到极致轻便的原因。
当下行业内有两种方向:
VST(Video see-through) OST(Optical see-through)VST 路线代表是苹果,范式参考 Vision Pro。它利用传感器和视觉技术将物理世界在虚拟世界里重建,将用户包裹在一个纯粹的数字世界里。
OST 路线代表是 Rokid,范式参考 Rokid AR Lite。它采用更加轻便的墨镜形态,在物理世界基础上融入数字内容,用户还是在真实场景中进行交互。
技术方面,空间计算的几大核心技术包括底层芯片、光学方案、显示屏、感知交互、系统软件等。目前均取得一定进展。
芯片最新进展来自于高通和 Rokid 团队释放硬件性能的深度优化,更快的渲染,更高的帧率。Rokid AR Lite 搭载了新一代 4nm 制程高通芯片,官方新闻提到研发团队也与高通协作为 YodaOS-Master 做了深度优化,在画面渲染和 AI 计算等方面都进行提升,带来更好的视觉效果和使用体验流畅度。
光学方面,VST 路线现在通常采用 Pancake 方案。它基于折叠光路的原理,极大压缩头显体积、降低镜片厚度。
OST 路线中,近年光波导方案发展迅速,它可以实现 80-95% 的透光率。在展示真实世界的同时,通过多层波导片叠加提供更加真实的三维图像,但是全彩色显示、分辨率、亮度、画面的“干净”和细腻都是比较大的问题。较为成熟的方案 BirdBath 在高清显示、轻便、成本控制、透光率达到了目前一个最好的平衡。
Rokid AR Lite 也采用了 BirdBath 方案,FOV 视场角达到 50 度,最高入眼亮度达到 600 尼特。
微显示屏方面,Micro OLED 是当前主流。OST 路线中,Micro OLED+BirdBath 是目前落地规模较大的方案。以 Rokid AR Lite 为例,双眼分辨率达到 1200P。
感知交互层面,语音、手势、头动、眼动是趋势。Vision Pro 推崇裸手交互,但分体式方案更为普遍,比如手柄。OST 路线中,一体式和分体式方案并行。
软件系统方面,苹果依旧是独立生态。其他厂商大多以安卓系统为基础进行开发,Rokid 自研了 YodaOS-Master。软件层的核心技术需要覆盖内容生成、环境理解定位追踪和虚实结合四个方面。
总结来看,目前空间计算的底层关键技术均已布局完毕,但距离空间计算 ChatGPT 的时刻还有多远,现在还难以给出确定结论。
但谁能成为触及引爆这一时刻的关键玩家,格局基本分明。代表 VST 路线的苹果,代表 OST 路线的 Rokid,均在名单之上。
Why?
苹果位列其中,或许在很多人意料之中。Rokid 为何值得期待?
底色始终是人机交互
Rokid 以 AR 闻名,但其自身定位始终是一家人机交互公司。
移动互联网时代方兴未艾之时,创始人祝铭明(Misa)打响个人创业第一枪,瞄准的正是移动 OS。这次尝试很快得到市场的认可,被阿里收购;也给 Rokid 埋下了人机交互的基因。
2014 年,深度学习已在学术圈产生风暴。Rokid 也成立于此时,推出的首款产品是 Rokid Alien 智能音箱,尝试用 AI 技术打造下一代人机交互终端。
但随着技术和行业向前发展,人机交互的想象被更进一步打开。无论是技术前沿还是大众期待,更打破常规的交互呼之欲出。Rokid 看到了 AI+AR 这条路,2016 年 Rokid 正式组建 AI 视觉团队,为 AR、空间计算开始铺路,并用 2 年时间推出了首款一体式 AR 眼镜 Rokid Glass(若琪·慧眼)。
从人机交互的思路出发,Rokid 预判 AR 终将独立行走。因为 AR 强调连续的交互体验与手机碎片化的特点相悖,3D 内容生态本质区别于手机等终端,一直和手机借生态会限制 AR 发展。因此 AR 应该有自己的底层操作系统,并构建自己的生态。
在非常早期的阶段,Rokid 就自研操作系统,构建全栈能力、聚集开发者、打造 AR 独立生态。2019 年为吸引开发者 Rokid 还开源了 YodaOS,核心目标就是丰富 AR 世界的应用类目。后面,Rokid 还专门为开发者打造了创作工具灵境,依托单摄 RGB 轻量化 SLAM 等前沿技术,大幅降低创作开发门槛。目前,Rokid 建立了国内规模最大的 AR 社区,注册开发者超过 3000,其中企业开发者达 2000+ 家。
在硬件形态上,Rokid 率先在行业内推出分体式设计,缓解当下 AR 必须面临的重量、算力和续航之间的矛盾。并在佩戴体验和价格上,主动拥抱消费者,给出了更亲民的选择。
不难发现,Rokid 一直以来做什么、不做什么,其核心判断准则都是“空间计算需要怎样的人机交互”,而且在逐步引领用户走向真正意义的空间计算。
而且在具体脚步上,Rokid 的风格一直比较务实。
商业模式选择了先 To B 再 To C,先在垂直场景积累经验,再探索要求苛刻的大众市场。
技术路线选择先解决用户当下痛点,比如头显重量、佩戴体验、全天候使用频次、使用时长等,同时长期探索前沿技术,能够基于现有 AI、光学、微显示等技术优化产品体验,同步对软件操作系统升级,为开发者构建更加友好的生态。
产品进行阶梯式迭代。最早面向消费者的 Rokid Air 主打大屏体验,先吸引一部分用户来到 AR 领域;再推出 Rokid Max+Station 娱乐套装,让 AR 初步拥有自己的生态,并成功建立了 AR 独立的范式,Rokid 披露目前 Rokid 用户中90% 都选择连接 Station 使用。后面 Rokid AR Studio 带来了更独立、迈向前沿探索的空间计算体验,特别 Rokid AR Lite 更进一步带来空间计算里更符合用户习惯的交互方式。
以及在价格成本上,Rokid 给出更吸引消费者的定价来打开市场。成本方面则依托本土强大供应链优势,和在光学、制造、软件开发、SLAM 研发上的人才优势。
这种务实为 Rokid 在空间计算趋势里长期生存提供保障,也降低了空间计算体验门槛,让更多人先进入尝试体验起来,推动引领趋势发展。同时在技术研发方面,Rokid 布局 AI+AR 核心能力。截至 2023 年 11 月,公司技术研发人员占比近 60%。
种种信息显示,Rokid 有望成为触及空间计算 ChatGPT 时刻的关键玩家。
当下预测,空间计算引发的技术革命浪潮不会亚于 AI。
AI 带来新质生产力,引发千行百业变革。而空间计算将颠覆人机交互方式,从日常生活到生产制造,都会被重塑。
而无论是哪一波技术浪潮,向来是先拥抱先进技术的人,先享受世界。
现在,一个机会摆在眼前了:最新 Rokid AR Lite,价格 X499 元。
很神秘,没有公布最关键的第一位数字。但也很确定,比 Vision Pro 便宜一个数量级,差不多是一部手机的价格。
从桌面计算到移动计算,当一款产品以一个极具吸引力的价格腾空出世时,距离前沿技术飞入寻常百姓家也就不远了。
对于空间计算来说,X499 这个数字可能还不是终极答案,但初步开启消费者市场大概已经够了。
在发布现场,Misa 拍胸脯表示:“一定每个人都买得起”。
嗯,彻底勾起咱的好奇心了。