复联3《无限战争》里有这样一幕,钢铁侠离开圣所上街查看情况,人群四散,他戴上黑框眼镜问助手“星期五”:“我在看什么?”

  这承载着我们对智能眼镜的一种期待,它应当成为洞若观火的“眼睛”,提供周围环境的信息并实时应答,以融入日常穿搭的形态低调存在。

  刚过去不久的Google I/O,最受关注的当属基于多模态大模型Gemini的AI助手Astra。

  合理怀疑,OpenAI比Google提前一天开发布会,就是因为消息灵通,且要针对Astra。果不其然,大家记不住Astra的本名,只当它是GPT-4o的“莞莞类卿”。

  其实单看Astra的演示,也做得很有意思,和OpenAI一样走日常生活向,至少在冗长的发布会里终于让人不困了。

  Astra,能看、能听、能说,低延迟,能与用户实时对话和视频聊天,开得了脑洞,解读得了代码,能识别周围环境,还能帮你回忆刚才镜头一扫而过的眼镜在哪里。

  Google显然考虑到了这种情况,在让Astra帮忙找到眼镜后,演示者戴上了眼镜,然后通过眼镜继续使用Astra,让它解决白板上的题目。

  Google并没有透露这副眼镜的更多信息,仅从视频中看,它带有摄像头和视觉界面,但外表朴素,辨识度不高,属于放在眼镜堆里容易找不着的路人甲。

  Google的官方博客解释了,演示分为两段,每段都是一次性实时拍摄的,前半段用的是Pixel手机,后半段用的是一款原型眼镜设备。

  为了让Astra的回答速度接近人类,他们连续编码视频帧,将视频和语音输入组合到事件时间线,并缓存这些信息,让AI处理信息的速度变得更快。

  接受彭博社采访的时候,Google DeepMind首席执行官德米斯·哈萨比斯和Google联合创始人谢尔盖·布林也确认,Astra在手机上的效果已经很好,正在考虑为Astra制造眼镜。

  虽然没打包票一定推出眼镜,但布林特意cue了一下,Google在十年前已经入局了。

  说到这里,就要把Google技惊四座的2012年Google I/O大会搬出来了。

  当时这场发布会可不像现在这么无聊,戴着一副不对称眼镜框的布林在尾声登场,请了一群跳伞运动员,发布了一款让人过目难忘的产品——Google Glass。

  这些跳伞运动员也戴着Google Glass,在高空接通了和布林的视频通话,然后一跃而下,骑山地自行车来到现场,现场观众从大屏幕欣赏第一视角,如同体验了一次极限运动。

  视觉冲击在前,无需更多言语,观众相信了,这副眼镜就是布林口中“很酷的东西”。

  至今,仍然有人在当年这场发布会的切片下留言:“这款产品远远领先于时代。”

  超前有时候等于不合时宜。在当时,Google Glass只能算包装华丽的失败品。

  Google也清楚这款产品不成熟,先推出了8000个名额的“探索版”(Explorer Edition),换句话说就是半成品,但价格毫不手软,高达1500美元。

  走下神坛,拿在手中,人们很快发现了它的问题:比手机贵,又没有手机好用。听起来是不是有些耳熟?就像Rabbit R1等AI硬件评价的翻版。

  总体来说,Google Glass有7个基础功能——搜索、导航、拍照、录视频、发消息、打电话、视频聊天,它也支持一些第三方服务,包括显示和播报推送到设备上的新闻摘要。

  这些功能手机都有,除了必须解放双手的时候,大多数情况下,手机比Google Glass更好用。

  并且,使用Google Glass的完整功能,还得把手机带在身边用来联网,离线情况下,Google Glass只能拍照片和视频。

  Google Glass最为人诟病的,其实是隐私问题,让它拍照很简单,用语音命令或者按住顶部的按钮,但没有LED等亮眼的标志,提示他人正处在拍摄状态。

  所以,从路人的角度看,Google Glass就是个不讲武德的“偷拍神器”,甚至曾有用户在电影院被保安赶出来。

  Google Glass“漂浮”在现实世界的第二块屏幕,用来固然导航很方便,让你像使用高德一样,直观看到箭头的指向,但路人可能会觉得,眼睛总往右上瞥的你很奇怪,然后避而远之。

  当时有人开玩笑,Google Glass的最大用处,是让英国王室的查尔斯王子记住每个人的名字。

  Google Glass在2015年停产,之后被定位到B端,用到工厂车间、医疗教学等场景。不过在去年3月,Google也停止销售了Google Glass的企业版。

  回首过往,Google Glass当然没法替代手机,作为一款智能眼镜也没能成功,但理念超前,提供了一些可穿戴设备的可能性。

  不如手机是事实,但换个角度,Google Glass提取出了手机比较重要的几项功能,比如相机、地图、联络信息,并且不像手机那么打扰,适合在行走等场景使用,拯救低头党。这不就是Ai Pin创始人说的,活在当下,为智能手机成瘾问题赎罪吗?

  如果不是价格太过丧心病狂,Google Glass作为辅助还是不错的。所以,也有人将Google Glass称为“手机的一个方便的显示器”,或者“一个蓝牙耳机,但有显示屏和摄像头”。

  暂时不考虑隐私问题,Google Glass拍摄的第一视角也很好,就像把广角镜头戴在脸上,真正做到眼睛看到什么就能立刻拍摄下来,很适合用来记录生活。

  2016年,Snapchat的Spectacles一推出就卖疯了,它其实就是一个会拍摄的墨镜,故意用了115度的广角镜头,画质比不过手机,但拍着很有趣味,同时也弥补了Google Glass的错误,会用LED提醒他人正在拍摄。

  更为重要的是,Google Glass展现了一种生活方式:把传感器戴在脸上,它可以为你收集环境信息,提供额外信息,和你语音沟通,让你不用双手也能完成很多事情。

  当造型奇怪的Google Glass面世,路人最好奇的问题主要有三个:你脸上戴的东西是什么?这个东西有什么用?你戴着它时看到了什么?

  现在这些问题又抛给了奇形怪状的AI硬件,只不过第一个问题可能换成了,你别在胸口上的是什么?你脖子上戴的是什么?

  至少眼镜的形态看着比一些AI硬件靠谱多了,不反人类,不挑战用户原有的习惯。

  “免提”是眼镜生来就有的优势之一,如果我们在做饭或者运动,还需要让设备辅助的话,手机往往是被pass的那一个。不用掏出手机,不等于就能代替手机,但确实是一个实打实的优点。

  同时,智能眼镜的功能也并不少,打电话有耳机和麦克风,拍照有摄像头,当你需要屏幕,AR让你的眼前呈现信息。

  Google在2022年I/O推出了一款可以实时翻译的AR眼镜,字幕就在对话人旁边,不过也只是原型演示。

  十多年前Google Glass已有的功能,后来者或多或少地承袭和改进了。然而,如何让生成式AI融入,是目前大厂们还在探索的问题。

  从用户的角度来说,买智能眼镜究竟有什么用,希望戴着时能看到什么,答案也可能和最初的Google Glass不同了。

  它的市场反响不错,原因主要有以下几个:保留雷朋的时尚外观,质量控制在普通眼镜的水平,升级了摄像头、扬声器、续航等基础功能,用户甚至可以通过它开启直播。有人评价说,这是为网红准备的Go Pro。

  与此同时,Meta雷朋增加了前代没有的功能——多模态AI语音助手Meta AI。去年12月,扎克伯格在Instagram发了一段视频,亲自展示了Meta AI。

  视频之中,扎克伯格用“Hey Meta”的指令呼唤出AI,让眼镜识别水果、把西班牙文本翻译成英语、给萌宠图片配上解说文字,以及从衣架拿下条纹衬衫,让眼镜参谋搭配什么裤子。

  Meta雷朋眼镜内置的大模型为Llama 2,除了以上功能,还支持查询体育赛事比分、当地地标、餐馆、股票等实时信息。

  这些AI功能真的是刚需吗?可能要打个问号,还不如当初召唤Google Glass,问今天天气怎么样,某个地方怎么去。

  而且,Meta AI的反应速度并不快,每次语音请求都会触发一次快门捕捉,也就是说先拍照,延迟几秒,然后AI才能读取和分析用户所看到的内容。和Meta AI对话仍然是回合制,不能像GPT-4o演示的那样随时打断。

  但不那么苛刻地看,AI功能用来锦上添花挺好,让一款能拍视频、拍照片、语音通话的眼镜更加有用,看到和听到周围发生的事情,并以声音或文本形式提供反馈。

  就像10多年前的半成品Google眼镜,Meta AI这样的AI功能也需要时间进化。

  我们对于AI助手的想象往往从电影等科幻作品而来,它们最好和我们一样,可以理解和响应复杂的世界,但又要比我们记性好,记住所有看到和听到的内容,我们和它们交谈的时候,应当像面对另一个人类那样没有延迟。

  事实上,光是将AI的应答时间缩短为人类对话的水平,已经是一项巨大的挑战了,兑现在Astra和GPT-4o身上,已经足够让我们惊奇。通过它们,我们可以脱离文学想象,一个完全形态的AI助手可能是什么样子。

  就像Google Glass之前,已经有了很多脸上的可穿戴设备,但是它让人们觉得,智能眼镜是可能的。而在它之后,有了越来越多更精致、功能更多、领域更垂直的智能眼镜。

  Engadget在11年前的测评说道,Google Glass很有意思,但不值1500美元,应该等待它的第二代或者第三代。

  现在的智能眼镜,仿佛就是Google Glass的第二代或者第三代,就连Google自己,也在有意无意地召唤Google Glass的亡魂。

  一款产品世俗意义地失败了,可能因为功能鸡肋,也可能因为想法很棒,但技术所限,没能落地成良好产品。或许我们可以换个角度看,它们中的佼佼者,可能只是未来产品的未完成形态。