news 2025/12/28 8:31:36

告别「手搓Prompt」,前美团高管创业,要让物理世界直接成为AI提示词

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
告别「手搓Prompt」,前美团高管创业,要让物理世界直接成为AI提示词

正如奥特曼执意打造硬件,试图打破手机屏束缚,要让 AI 感受物理世界;Looki 的诞生也源于同样的渴望:补齐大模型「感官智能」的最后拼图,将现实场景实时转化为上下文,驱动人机交互从「被动问答」进化为「主动共鸣」。

2025 年,AI 硬件赛道喧嚣一片。从形态各异的 AI 眼镜,到 OpenAI 传闻中的无屏设备,无数玩家正试图摆脱智能手机的束缚。其底层逻辑清晰可见,今天的 AI 不缺智商,缺乏的是「在场感」。

被困在对话框里的大模型如同「缸中之脑」。当你需要复盘会议或分析孩子情绪时,却不得不将鲜活场景压缩成干巴巴的文字描述,这种依赖「手动 Prompt」的交互不仅低效,更是反人性的。我们被迫充当了 AI 的「人肉传感器」,而大模型因缺乏 Context(上下文语境),始终处于对物理数据的极度饥渴中。

「在物理世界中,人类本质上是被动的生物。我们期望让 AI 变得主动。」Looki 创始人兼 CEO 孙洋一语道破。

正是带着这样的思考,一支自带自动驾驶基因的团队,试图将那套解析道路环境的「从感知到决策」逻辑复用到日常生活中,填补大模型对于物理世界的认知「盲区」。他们打造的 Looki L1,在北美市场积累首批口碑后,于今天正式面向国内发布。

这款 AI 原生多模态可穿戴设备,旨在将实时视听信号转化为模型上下文,让物理世界本身,成为驱动 AI 思考与服务你的最高效 Prompt。

一、藏在 30g 机身里的「智能感知」系统

从「车看路」到「AI 看世界」,这是自动驾驶感知算法的一次微缩实战。

如果说云端大模型是「大脑」,那么 Looki L1 就是由于算力限制而不得不外挂的「视神经」。第一眼看到 Looki L1 的人,很难不将它误解为一款挂坠形态的相机。它形态十分迷你,仅重 30g,支持磁吸或直接佩戴。

这种误解源于我们对「镜头」的固有认知,镜头生来是为了审美服务的。但对于 Looki 来说,镜头是服务于机器认知的,它本质上是一个庞大的、始终在线的多模态感知器。它不需要拍得「美」,但必须拍得「懂」。它支持 1080P/30 帧画面,待机 12 小时拍摄,就像一块海绵,全天候吸收你的光影世界。

孙洋认为,任何硬件形态都有其优劣势,AI 眼镜当下在续航、重量和功能上存在「不可能三角」。而 Looki 选择挂坠形态,则是在当前供应链能力下,为了实现「全天候静默采集」这一核心需求的最佳妥协方案。

这种妥协背后,是团队技术基因的「降维打击」。

「以前是教车怎么看路,现在是教 AI 怎么看懂你的生活」,孙洋谈道。这种跨界视野,源于两位创始人独特的履历拼图。孙洋和刘博聪均毕业于卡内基梅隆大学,而在分别执掌美团智能硬件与自动驾驶算法业务之前,他们还曾在 Momenta 与 Pony.ai 两家自动驾驶企业深耕一线。

他们将自动驾驶「从环境感知到自主决策」的闭环逻辑,从道路平移到了生活场景,其感知机制体现在两个层面:

  • 首先是多维感知。它使用了多模态大模型,视觉识别场景物体,听觉捕捉环境情绪,构建起对物理世界的初步认知。
  • 其次是高效吞吐。 通过「智能间隔拍摄」技术,确保在极低功耗下实现海量视听数据的实时采集。

这套机制构成了团队从「车」迁移到「人」的底层基座,更为接下来的云端处理提供了丰富的原始数据。

二、超越 RAG,搭建一套专属用户的「数据飞轮」

从「多维数据」到「结构化记忆」,真正的壁垒在于构建一套用户专属的 Context Engineering(上下文工程)。

Looki 团队沿用自动驾驶的「数据飞轮」逻辑,来重塑用户的个人记忆:从硬件端收集数据,到建立多层级数据索引和多任务拆解,最终打造一套高效工作的 Agentic System(代理系统),让 AI 能像人脑一样,有索引、有重点地调用你的生活数据。

据 CTO 刘博聪介绍,这套系统的独创性,在于挑战了当前多模态模型的两大痛点:

首先是「长时序数据理解」。针对大模型处理大量多模态数据流(如数十万级别)容易产生「幻觉」的通病,团队通过工程优化,让 AI 能准确理解,并串联起跨度极长的时间切片。

其次是应对「多模态数据的 Context 爆炸」。视频与图像的查询会消耗巨大的上下文窗口。Looki 在云端构建了一套高效的上下文管理机制,能够根据查询需求,在海量数据中精准提取关键特征,而非粗暴地将所有素材灌入模型。

当然,这一切的基石是数据的隐私安全。Looki 通过端侧隐私过滤与 App 手动上传机制,确保数据流转的安全性。最终,物理世界的切片,被转化为结构化的「云端记忆库」。

如果说 GPT 是你工作的上下文,装载了人类的通用知识;那么 Looki 正在构建的,就是你生活的私有上下文,装载了你独一无二的经历与轨迹。

三、从「手动 Prompt」到「主动式 AI」

当语境足够丰富,交互终将进化为主动式「预判」。

目前硅谷普遍认为,我们终将迎来从 Chatbot 走向 Agentic AI(代理式 AI) 的范式转移。行业预测显示,自主 AI 代理市场将在未来三年迎来爆发性增长,而 Memory(记忆)与 Context(上下文) 正是这场进化的核心护城河。

Looki 的野心,正是基于这两者,通过可穿戴硬件构建通往「主动智能」的入口。

目前,Looki 交付给用户最显性的功能是「AI 自动剪辑」。它精准切中了那些热爱记录、却被后期剪辑劝退的用户痛点。用户在佩戴拍摄的同时,Looki 的算法自动识别一天中的高光时刻,自动生成有叙事逻辑的 Vlog。

基于这层理解,真正的质变在于「隐性洞察」。

随着记忆库的沉淀,Looki 将不再是被动等待指令的记录仪,而是能够进行推理的 Agent。它不仅记录你的饮食,更能在你点夜宵前,基于全天摄入主动发出「热量预警」;或在你情绪激动时,基于对话语境提供理性的沟通建议。

这种基于实时物理反馈的交互,让 AI 从「被动问答」进化为「主动共鸣」,这才是 AI 硬件区别于手机 App,能够真正接管用户生活的核心价值。

四、结语:当物理世界成为提示词

在 Looki 团队的构想中,硬件形态从来不是终点,而是一个「长在物理世界里的数据接口」。这也道出了 Looki 的实质:无论它今天是挂坠,还是未来演化为眼镜或耳机,其核心使命从未改变,那就是解决物理世界的数据饥渴,帮用户积累最宝贵的私有数据资产。

在 AI 时代,算力会被摩尔定律稀释,模型会被更强的版本迭代,但你在这个世界上生活过的痕迹、你眼中的风景、你与家人的对话,这些 Personal Context 构成了独一无二的你。而 Looki,就是帮你将这份资产,转化为 AI 能够理解共情的「数字直觉」。

当 AI 拥有了「在场感」,它就不再是云端那个冰冷的工具,而是你生活中的「第二大脑」。

最强大的 Prompt,其实是你未曾说出口的生活本身。

如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!​

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

四、AI大模型商业化落地方案

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/27 0:43:43

Molecular Operating Environment (MOE) 完整安装与配置指南

Molecular Operating Environment (MOE) 完整安装与配置指南 【免费下载链接】最新MolecularOperatingEnvironmentMOELinuxWindows下载指南 最新 Molecular Operating Environment (MOE) Linux Windows 下载指南本仓库提供最新版本的 Molecular Operating Environment (MOE) 软…

作者头像 李华
网站建设 2025/12/28 5:11:48

LobeChat能否用于生成直播话术?电商主播提词器

LobeChat 能否成为电商主播的“隐形军师”?用 AI 构建智能提词器 在杭州的一间小型直播间里,一位刚入行的主播正对着镜头介绍一款新上市的电动牙刷。她语速略快,眼神有些飘忽——不是因为紧张,而是她的视线始终落在面前那块不断滚…

作者头像 李华
网站建设 2025/12/27 2:16:27

终极C++网络编程:构建高性能HTTP服务的完整指南

终极C网络编程:构建高性能HTTP服务的完整指南 【免费下载链接】cpp-httplib A C header-only HTTP/HTTPS server and client library 项目地址: https://gitcode.com/GitHub_Trending/cp/cpp-httplib 在现代网络应用开发中,性能瓶颈常常成为制约系…

作者头像 李华
网站建设 2025/12/26 2:15:01

显卡驱动终极清理指南:一键彻底解决兼容性问题

显卡驱动终极清理指南:一键彻底解决兼容性问题 【免费下载链接】display-drivers-uninstaller Display Driver Uninstaller (DDU) a driver removal utility / cleaner utility 项目地址: https://gitcode.com/gh_mirrors/di/display-drivers-uninstaller 当…

作者头像 李华
网站建设 2025/12/27 11:16:59

Zotero GPT:用AI重新定义文献管理效率

Zotero GPT:用AI重新定义文献管理效率 【免费下载链接】zotero-gpt GPT Meet Zotero. 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-gpt 还在为文献管理效率低下而苦恼吗?每天面对堆积如山的学术论文,传统的手工分类和标签管理…

作者头像 李华
网站建设 2025/12/27 11:22:47

LobeChat与LangChain结合应用:打造复杂AI工作流

LobeChat与LangChain结合应用:打造复杂AI工作流 在今天的AI开发实践中,一个常见的尴尬局面是:后端模型能力强大,却困于简陋的交互界面;而前端体验流畅的应用,又往往只能做些“你好”“再见”式的浅层问答。…

作者头像 李华