AI记忆:为可穿戴设备与机器人打造视觉记忆新纪元
2026-04-20 17:25

AI记忆:为可穿戴设备与机器人打造视觉记忆新纪元

  AI记忆:为可穿戴设备与机器人打造视觉记忆新纪元

  编者按:在人工智能狂飙突进的今天,我们见证了ChatGPT的记忆革命、Gemini的多模态突破,但你是否想过,当AI走出数字世界,踏入物理空间,它该如何“记住”所见的一切?沈侠(Shawn Shen)和他的团队正在回答这个未来之问。他们从meta雷朋智能眼镜的研发中洞察到一个空白:如果AI穿戴设备无法理解和回忆视觉信息,就如同拥有双眼却患了失忆症。于是,他们毅然离开巨头,创立Memories.ai,携手英伟达、高通等顶尖伙伴,试图为机器打造“视觉记忆层”。这不仅是技术的迭代,更是AI从虚拟助手迈向物理世界伙伴的关键一跃。当记忆从文本扩展到视觉,AI或许终将学会像人类一样,用眼睛记录世界,用回忆点亮未来。

  沈侠相信,AI若想在物理世界取得成功,就必须记住它所看到的一切。他的公司Memories.ai正在利用英伟达的AI工具,为可穿戴设备和机器人构建能够记忆和回忆视觉信息的基础设施。

  Memories.ai在周一的英伟达GTC大会上宣布了与这家半导体巨头的合作。通过此次合作,Memories.ai利用英伟达的Cosmos-Reason 2(一个推理视觉语言模型)和英伟达Metropolis(一个用于视频搜索和摘要的应用程序),来持续开发其视觉记忆技术。

  沈侠(上图左)告诉TechCrunch,他和联合创始人兼首席技术官周奔(上图右)在构建meta雷朋眼镜背后的AI系统时,萌生了创办这家公司的想法。开发AI眼镜的经历让他们开始思考:如果用户无法回想起他们录制的视频数据,那么人们在现实生活中究竟会如何使用这项技术。

  他们四处寻找,看看是否已经有人在为AI构建那种视觉记忆解决方案。当发现没有时,他们决定从meta分拆出来,自己动手打造。

  “AI在数字世界已经表现得非常出色。那么在物理世界呢?”沈侠说。“AI可穿戴设备、机器人也需要记忆……归根结底,你需要AI拥有视觉记忆。我们相信那样的未来。”

  总体而言,AI系统拥有记忆能力是相对较新的事物。OpenAI在2024年更新了ChatGPT,使其开始记住过去的对话,并在2025年对该功能进行了微调。埃隆·马斯克的xAI和谷歌的Gemini在过去两年也推出了各自的记忆工具。

  但沈侠指出,这些进步主要集中在基于文本的记忆上。基于文本的记忆结构更清晰、更容易索引,但对于主要通过视觉与物理世界交互的AI应用来说,帮助就没那么大了。

  Memories.ai于2024年成立,迄今已融资1600万美元,包括2025年7月的800万美元种子轮融资和800万美元的扩展轮融资。此轮融资由Susa Ventures领投,参投方包括Seedcamp、Fusion Fund和Crane Venture Partners等。

  沈侠表示,成功构建这个视觉记忆层需要两样东西:一是构建必要的基础设施,将视频嵌入并索引成可以存储和调用的数据格式;二是捕获训练模型所需的数据。

  该公司于2025年7月推出了其大型视觉记忆模型。沈侠说,它可以被比作本月早些时候发布的Gemini Embedding 2(一个多模态索引和检索模型)的缩小版。

  在数据收集方面,该公司创建了LUCI,这是一种由公司“数据收集员”佩戴的硬件设备,用于录制训练模型所需的视频。沈侠说,他们并不打算成为一家硬件公司,也不会出售这些设备;他们选择自己制造,是因为对市面上那些专注于高清和耗电量大的视频格式的现成录像机不满意。

  该公司发布了第二代大型视觉记忆模型,并与高通签署了合作伙伴关系,计划从今年晚些时候开始在高通的处理器上运行。

  沈侠表示,Memories.ai已经在与一些大型可穿戴设备公司合作,但拒绝透露具体名称。尽管目前已有一些需求,但沈侠认为,可穿戴设备和机器人领域未来还有更大的机遇。

  “在商业化方面,我们更专注于模型和基础设施,因为我们最终认为可穿戴设备和机器人市场将会到来,只是可能不是现在。”沈侠说。

本内容为作者翻译自英文材料或转自网络,不代表本站立场,未经允许不得转载
如对本稿件有异议或投诉,请联系本站
想要了解世界的人,都在 切尔网

相关推荐