虽然还没有迎来属于自己的“iPhone4时刻”,但关于AI眼镜将成为下一代人机交互入口的声音,还是越来越大。更多人开始试着将智能眼镜的功能融合到生活工作中,Rokid就是其中的一个重要选项。
这个过程通常都是从学习开始的,就像智能手机刚问世的时候,大家也需要研究研究关于安卓、iOS操作系统的基础知识。那些复杂的、搭载了AI大模型和Agent的智能硬件更是如此。
好在大部分AI眼镜的学习门槛都并不高,强实用性也是市面上AI眼镜的一大卖点。
具体到Rokid Glasses来说,在手机上下载Rokid官方APP,按下眼镜的开机键——同时它也是功能键,用蓝牙连接上设备,更新软件版本、设置好模式就可以开始体验了。
当看到Rokid APP首页显示出“已连接”和对话框时,就是初始设置成功。
随后,用户就可以探索APP主页里展示的各种功能,以及智能体商店中上架的各种Agent了。
到这一步,使用者就不难发现Rokid Glasses的两个最大产品特点:屏显和大模型。
屏显,也就是AR显示,是通过双目衍射光波导方案,将微显示器生成的图像精准投射到透明镜片上,用户可以在镜片的中间偏下位置,看到绿色的字符或者箭头。
大模型,则是指通过眼镜上搭载的高通骁龙AR1芯片,用户可以协同通义千问、豆包、DeepSeek、智谱等主流大模型,使用包括翻译、解题在内的各类智能应用。
如果是国际版的Rokid Glasses,还能接入Gemini、ChatGPT,方便海外的用户使用。
通过大模型的思考能力,以及AR显示的镜片展示功能,Rokid Glasses将线上的信息世界搬到了眼镜上,拍照录像、翻译、会议纪要、导航、提示、支付等等功能比较丰富。
图灵灵在使用过程中感觉到,这些功能至今很难说都到了非常完善的程度,眼镜使用也暂时还离不开手机,但对于很多人来说仍有相当的使用价值——尤其在那些无法双手操作手机,或者分神看手机会有不安全的场景里,Rokid Glasses还是相当实用的。
拍摄场景
大家在小红书、抖音上都看到过第一视角的短视频,这其中很多就是用AI眼镜拍出来的。对很多人来说——尤其是健身爱好者或者各类穿搭博主,对镜自拍是有高频需求的重要使用场景。用Rokid Glasses的拍摄功能,在拍照时可以完全释放双臂双手。
只需要一句指令词,或者轻按镜腿上的功能键,它就能按用户眼前的视角进行拍摄。用户不用再费力举着手机,就能完成一个人的对镜拍摄——还不会被手机挡脸。
对于那些和图灵灵一样自拍技术欠佳、不太会找镜头的用户来说,Rokid Glasses也可以提供比手机强得多的自拍体验。
通过眼镜的录像功能,用户可以拍下自己更加自然的连贯表情和动作,然后再从一段视频中截取状态最好的几帧画面,就能美美get更适合抖音、小红书等内容平台的竖版照片——Rokid Glasses支持3:4、4:3和9:16三种拍摄比例,照片和视频可以同步保存在APP和手机相册里。
需要注意的是,目前Rokid Glasses使用的是1200万像素索尼IMX681传感器,画质满足日常社交分享需求是没问题,但还无法与旗舰级手机的专业级画质一较高下。
“其实画质清晰,关键时候能管用就行”,图灵灵有个朋友A表示,自己前几年出了个小车祸,对方肇事逃逸,那时候自己被“撞懵”了,根本没意识去掏出手机拍下肇事者的车辆信息。
“如果那时候我戴着AI眼镜,喊一声拍照它就给我把那人的样子拍下来、录下来,我就能拿去索赔了。”
导航场景
在骑行或者开车的时候掏手机来用,其实是不太方便而且也不安全的,但以目前的手机和各类汽车、摩托车、自行车的配套车机来看,还是脱离不了手机使用。
智能眼镜可能是应对这些使用场景时最好用的工具。Rokid Glasses的解决方案,是通过与高德地图深度合作,让使用者可以通过唤醒词直接喊出指令,比如“导航去xx地址”,全程不用掏出手机操作,也不用分心去看手机屏幕。
视频来源:小红书用户@NewClown尧
Rokid Glasses上显示的导航信息,并不会占满整个镜框内的视野,而是清晰地显示在视野中下方的位置,那里是一个“非核心视觉区域”,不会影响用户的正常视线。
它的AR设计也有讲究:一条引导线像贴在地面上一样,前面要转弯的地方,还会出现场景化的转向立牌,这样用户只需要用余光轻扫,就知道接下来该怎么走。
这种屏显导航比只用语音播报要好用得多。尤其是开车的时候,旁边不免有人说话,或者车外嘈杂或喇叭的尖声,都会盖住导航的播报声。
使用智能眼镜看屏幕上直接给出的道路指引和箭头,就不会被复杂的声音干扰到。
图灵灵有个正在考虑买AI眼镜的朋友B,觉得这个导航功能挺适合带着家人出国旅游,“一边找路,一边还能顾好孩子,不用老是低下头翻手机。”
朋友B还跟图灵灵补了一句:“再说了,AI 眼镜不是还有翻译功能嘛。到时候国外的公交站牌,我看一眼就能看懂,就不用打那种贵得要死的出租车了。”
问答场景
翻译,其实是问答场景里的一种功能,包括解题、拍图识别等其他功能也属于这个场景。
Rokid Glasses之所以能提供这些问答类的功能,全靠一套底层系统,这个系统由信息采集、预处理和大模型处理三大模块构成。
第一步,信息采集,是由镜框上的摄像头和麦克风完成。用户只需要把想翻译的文字画面给拍下来,或者把你要说的话、听到的外语直接录进去,然后告诉Rokid要干嘛,像“帮我翻译一下”、“给我这道题的答案”这样直接下命令就可以。
第二步,信息预处理,这里Rokid会处理用户提供的原始信息,图片里头的字它能认出来,因为有OCR(文字识别)技术;声音里的话也能直接转成文字,因为有ASR(语音识别)技术。
第三步,大模型上场。Rokid会把上一步处理好的信息发送到云端大模型,在那进行最终处理。如果使用的是翻译功能,大模型就会结合用户所在的语境进行翻译,如果使用的是解题功能,大模型会分析并给出解答步骤。
目前,Rokid Glasses支持89种语言的实时翻译,以及语音AI助手。
翻译的结果,解题的过程都会像悬浮字幕一样,直接打在用户的在镜片上,别人看不见。
视频来源:小红书用户@汉中日租月租
至于翻译的质量如何,图灵灵的朋友们普遍都表示“日常生活能用”,但还不能直接拿去安排商务谈判或者其他重要的、正式的场合。
这里其实是被AI眼镜行业的一个共同问题限制了:硬件厂商无法完全靠自身的能力去研发大模型——那是专业的技术公司或者大型企业集团要做的。
翻译这种对智能水平要求比较高的功能,到底好不好使,主要取决于智能眼镜厂商合作的通用大模型公司水平高不高,进步快不快有关系。
现阶段,很少有AI眼镜厂商能对各种垂类场景做针对性优化的。据图灵灵了解到的小道消息,Rokid正与国内的头部大模型公司探索深度合作的模式,研发自己专属的端侧多模态模型。
等到相关研发成功的时候,问答类功能的智能水平大概率会有一定的提升。
而对于那些本身就有一定开发能力的用户来说,压根不用干等着,自己就能动手改良自己的Rokid Glasses。
进阶玩法
开发者手里的AI眼镜,可以有很多进阶玩法,比如解题功能的升级版,是调用自己建的知识库/题库,进行更精准的回答。
比如,用户如果想考一个基金从业资格证,可以先建一个专门的题库,然后用Rokid辅助自己备考。
想实现这种操作,需要用到Rokid Glasses的智能体功能。开发者可以在电脑上访问 Rokid灵珠平台 (rizon.rokid.com) ,创建一个新的智能体,用来实现自己的个性功能。
从目前的开发情况看,有人用Rokid接入了OpenClaw,有人用Rokid接管了小米家电,开发者里有个人用户也有第三方公司,智能化的延展性相当强。
视频来源:小红书用户@E是天翼的翼
“网友的分享给了我一些启发,我想为帮助儿子成长写一个智能体。”
图灵灵的朋友C在互联网公司当程序员,他表示“自己已经切身感受到了AI革命的力量”,所以不想自己的孩子跟不上时代。
“现在学校里教的那些肯定不符合AI时代的要求了,我打算找一些锻炼孩子思维能力的题目,做一个学习伙伴。”
“我觉得AI眼镜可能比手机更适合孩子用,毕竟现在AI眼镜不能刷短视频,不会让孩子沉迷娱乐”,说到这里,C苦笑了一下,“学习是很辛苦的,但总比找工作容易。
“我们做家长的,还是要尽量早点让孩子接触AI时代的东西,要不然错过了大脑开发的关键阶段,一步错,怕是要步步错啊。”
不过,AI时代带来的也不只有焦虑,其实里面还有很多机会。
C就盘算着一件事情,“万一我做出来的智能体挺牛的,说不定能在商城里卖个不错的价钱。这样我就能多给孩子攒点钱了。
希望通过AI眼镜赚钱的开发者其实不在少数,Rokid肯定也会有一些相关的规划。
去年Rokid副总裁蔡国祥在接受采访时表示,智能眼镜商业化路径与手机有相似之处,一是通过“卖设备”,二是通过卖“应用服务”。目前Rokid所有应用全部为免费使用,未来如果推进收费,收益也将与开发者共享。
对于智能硬件来说,生态实在是太重要了。一个繁荣的生态,才能孵化出各种硬件功能,满足许许多多的用户在各式各样的场景下需要的功能。
健身爱好者锻炼的时候,就会让AI眼镜直接在眼前显示时间、心率、距离等信息。盯盘炒股的人哪怕出门在外,也想让眼镜实时弹出行情、股价。这些五花八门的需求其实都能靠智能眼镜的智能体来实现。
这也是为什么苹果的AI眼镜如此受人关注,毕竟苹果的生态是公认的强。
不足之处
“听说苹果的AI眼镜能自动调整度数,近视、散光、老花都能用,这一点真的很吸引我。”
确定会买个AI眼镜的朋友B,并不打算现在就立刻下决定,因为自己是高度近视,要等苹果眼镜也出来了,仔细对比过后再决定买哪款。
图灵灵因此也感觉到,这会是所有国产智能眼镜都会面对的现实问题。
具体到Rokid Glasses,其实这款产品并不是只能给视力正常的人用,它家的眼镜对近视、散光用户提供的解决方案是定制镜片。可以通过官方线上平台上传验光数据,或去合作门店线下一站式验配。
这种定制镜片采用稳固的四点固定(三点卡扣 + 一点磁吸),能轻松拆装,不需要专业人士来操作,用户自己就能换上去。
不过,问题可能也出在这个定制上。这镜片是专门贴合 Rokid Glasses 那块纯平显示面板来做的,不能用在其他地方。如果使用者的度数又上涨了,可能还需要重新配,所以对于像B这样相对谨慎的潜在用户来说,可能会形成一个“再看看”的理由。
B的心里话其实还没有说完,价格或者说性价比,也是让他观望的原因之一。
“现在AI眼镜普遍要三四千块钱”,朋友B告诉图灵灵,“正因为不便宜,我才盼着它能更聪明一点,不要像传统眼镜那样,让我在买镜片上多花钱。”
也有人希望AI眼镜能多学习一些传统眼镜的优点,比如时尚感。
图灵灵的朋友D是个年轻姑娘,她对市面上的AI眼镜普遍不太感冒,理由非常直接,“我一直不喜欢大黑框眼镜,我宁愿戴美瞳。”
“AI眼镜要是能做得更漂亮,有更多颜色和造型,我才会考虑。”
当然这也算不上是Rokid glasses自己的问题,因为所有智能眼镜都需要有地方放电池,太过于纤细的眼镜是无法承载的。但这也给所有智能眼镜的厂商提出了一个必须完成的超高难度要求——这可能会是智能眼镜真正完成“iPhone4时刻”的一个前置条件。
毕竟AI再往前走,总要落到人们的身上,落到人们每天的生活里,人们的要求再苛刻,也有其中大道至简的一些道理。

