「创业空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

我们专注于跟进前沿技术,旨在让这次AI的进步为所有愿意创造的人共享。最近我们梳理了AI战略方向的框架性认知(非常可读,已经过数位小白及学者级读者检验),处于小范围分享状态,如果您感兴趣,请扫码加入我们的早期读者群。

「创业空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

「创业空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

编译|Yinan, 伟博

Preface
前言

AI+硬件的发展正在开创一个全新的智能化时代,我们这次邀请到了智能硬件产品 Rabbit-r1的负责人吕骋来为大家做一期分享。
接下来我们会按照以下顺序进行分享:

01 产品介绍

02 商业模式

03 创业心得

Introduction
分享嘉宾

吕骋

YC 中国创业营首期学员,2014 年创办渡鸦科技,后被百度收购,出任百度智能家居硬件总经理。2018 年赴美创办 RCT Studio,去年推出智能硬件产品 Rabbit-r1。

「创业空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

01

产品介绍

Rabbit-r1的设计初衷是做一款能够控制终端用户体验的硬件,一台可以承载全部最好的 AI 模型的设备。用户按住一个按钮直接说话,设备可以自动理解用户的意图和想要的结果,并执行对应的指令。
未来的 AI 一定是多模态的,可以成为一个非常智能的助手。它可以解决两个核心挑战,第一个是理解用户要表达的意图(Intention),这一步已经是今天的大模型能够做到的;第二个挑战是根据意图来执行动作(Action),这就是 Rabbit 主要做的事情
无论是何种服务,其共性都是拥有一个 UI 同人类的感官和大脑交互,因此我们开发了一个神经符号网络(Neural Symbolic Network),将大量热门 App 中用户的真实行为录屏作为原始训练数据来训练,学习如何操作各类应用的数字界面。
我们现有的模型是 LAM 1.0,LAM(Large Action Model)的核心目标是在 AI 理解用户意图后真正将意图转化为动作。相关研究可以参考 rabbit.tech/research 页面。
下半年会增加名为 teach mode 的工具。例如,用户在工具中输入亚马逊电商的网址,输入任务描述,然后给 AI 示范如何购买一件商品并上传录像,云端神经符号网络就能生成一个在亚马逊购物的 Agent,可用于购买任何平台上的商品。
虽然 teach mode 工具非常泛用,但它也可能存在被黑产等恶意团体利用的风险,因此该工具目前尚未正式发布。但基于它的思想,未来的 LAM 1.5 模型将能够从物理世界中学习操作。例如,一台搭载了 LAM 模型的机械臂通过摄像头观看了人类组装一张桌子的过程,并观看了每一页安装说明,它就可以学会如何组装这个型号的桌子。
我认为通用人工智能(AGI)能够准确理解人类意图,并执行对应行为,还具备自我调整、学习和提升的能力。我们的研究目标就是做一个通用跨平台代理(Generic Cross-platform Agent)。与其他公司通过插件、App SDK等方法实现 Agent 不同,我们的 Agent 是基于 LAM 的,可能成为最强的跨平台通用系统。
过去的应用对于每一位用户都会展现相通的 UI,但 r1 展现的是可适应的 UI。例如用户向它提问时,有时它会提供文字,有时会提供文字 + 图片,有时又只提供图片。所以我们认为未来每个人使用的 UI 都会开始变得个性化,甚至有可能整个软件的 UI 都是 AI 自动生成的。这样当我们为一个平台或生态加入新的 Agent 或服务时,速度就会加快几个数量级。
虽然当前的 r1 是一个移动设备,但我们也有一个网站叫 rabbithole(rabbithole.gg),是 r1 的线上门户,且两边的数据完全打通。未来我们会将网站端的 Rabbit OS 也发展为可以完全交互的平台,将它打造为 AI 原生的桌面系统

为何采用终端硬件形式?

首先,训练语言模型对创业公司而言成本太高;其次,语言模型本身是没有门槛的,所以我们决定专注于做执行动作的 Agent 代理模型。但现有移动设备生态对 App 有很多限制,因此我们需要用自己的终端来承载自己的模型避开限制。自今年 1 月发布 r1 以来,已经销售超过 13 万台,远超同类竞品,且退货率只有不足 1%,远低于业界常见的 5% 到 7%。现在 r1 团队正在快速扩张,合作伙伴阵容也迅速扩大,未来将陆续发布很多新功能。

Rabbitr1 为何选择手持设备的形式?

首先,我要求设备定价不能超过 200 美元;其次,它不能在使用全新软件交互理念的同时,在硬件上也用全新的形式,这样风险会过大。所以 r1 的设计完全遵循去风险化原则,有几个要素:
  • 有传统的屏幕。

  • 有很多大众熟悉的元素,例如类似对讲机可以按住说话的按钮。

  • 外形和 UI 类似电子宠物,双击按钮启动摄像头的设计参考了精灵宝可梦。

  • 按住输入语音的设计不需要硬件识别提示词,可以减少约 250 毫秒的延迟。

  • 正常 4G 网络下对话响应时间为每次 500 毫秒,全球最快。

  • 使用空 SIM 卡槽而非 eSIM,可以向全球销售。

    尺寸是 iPhone 15 Pro Max 的一半,可以轻松装入大多数人的牛仔裤口袋。

苹果与 OpenAI 的合作未来是否会对 Rabbit 的产品形成较大冲击?

我觉得不会,因为我们太小了,不用臆想自己已经在和巨头同台竞争。这是早期创业者常有的幻觉。创业者需要考虑的是怎样活下来,而不是如何去打败巨头。当然巨头都是从草根做起,但我们一开始还是要做好自己的事情。

Rabbit 未来会不会考虑端侧模型?

我个人对端侧有很大的期望,但目前机会还不成熟。因为端侧模型对芯片要求很高,还会有能耗、发热问题,且本地模型会丧失搜索最新信息的能力,这些挑战都很难解决。端侧模型适合一些单一功能硬件,例如记录机、翻译机,但目前不适合泛用场景。
Rabbit 未来是否会提供更加通用的,类似 RPA 的系统?

我们没有做 RPA,而是更通用的神经信号网络。以 Spotify 为例,我们可以让 Agent 识别出那些长得像播放按钮的按键,无论应用界面如何变化,Agent 都能知道如何操作它,就可以获得更好的泛用性、可持续性。

02

商业模式


Rabbit 作为创业公司,第一目标是存活下来,这也是我在 YC 学到的第一堂课。我们会专注于具体的计划和执行上,不会对未来做过多假设。公司最终发展成什么定位可能会由市场和用户来决定。
AI 模型的特点在于,首先它是一个黑盒,其次它极不稳定,非常不可控。因此工程师要改进模型是很无助和盲目的,即使只做一个全局记忆回溯的功能都会非常困难。因此, Rabbit 的策略就是用低价销售产品,不收取服务费,并接受尽可能多的反馈来学习和调整模型,这是唯一能让我们自己的模型快速提升的方法。
Rabbit-r1 的推理服务不收费,如何控制后续成本?
大模型服务商对大客户的收费是有很多优惠的,加上 r1 的利润率达到了 50%,因此可以覆盖很长时间的成本。接下来,随着 teach mode 发布,它可以成为新的 App Store,每个人都可以发布自己训练的 Agent 向大众销售,我们可以收取 30% 的分成,这有望成为我们的主要收入来源。
这里需要注意,创业者唯独不要在商业模式上做创新,要使用已经验证过的赚钱模式。在商业模式上做创新的风险是极高的。
r1 没有采取订阅收费模式,面对投资人是否会有压力?
我们认为发展早期是一定不能收订阅费的,同投资人沟通的时候要告诉他们最大的蛋糕在未来的某个节点,他们也是可以理解的。这件事也是区分投资人的一个关键,非常少有投资人真的愿意承担如此大的风险去推动一个伟大的故事。我觉得这是一个双向选择。
Humane 的 AI Pin 目前失败的原因是什么?r1 相比之下有哪些优势?
我们先不要说它失败,只能说它没有达到它的预期。我们总结出来它有很多可以调整的地方:
第一,就是硬件需要做低风险,不能卖很贵,而且也不要有订阅。我们吸取了他们的教训,卖得便宜,绝不能有订阅,也不能去掉屏幕。
第二,他们的团队有几百人,但开发节奏很慢,而且团队背景以工业设计为主,AI 方面的资源很有限。而我们团队的 AI 比重很高,所以还是要先设计好 AI 原生软件,再去考虑它的载体。另外 r1 的颜色很特别,这也参考了 iPod 耳机线的故事。苹果做 iPod 的时候为了将它打造成文化符号,将唯一外露的耳机线做成白色,而其他耳机线都是黑色,很多像这样的一个小设计就可以决定用户的认知。
创业至今,最大的动力是什么?
在渡鸦出售给百度之前,我的动力是非常愚蠢和原始的。很小的时候我就立志要在 30 岁之前靠自己买一台兰博基尼,这里面没有很多理想主义。
创业其实是一种生活方式。有点像佛教故事里的达摩面壁,是一种自己的修行方式。你在做这个选择时,就要意识到你会牺牲很多常人的快乐和生活节奏、生活条件。我很反对把创业变得非常理想化,因为创业是非常残酷而且非常孤独的,你在做一件没有人信的事情,只有你自己信,你还要非常努力地去把它证明到让所有人都信,这个过程中的痛苦是非常巨大的。所以没必要把它高大上或理想化,它就是一个生活方式的选择。看看马斯克,看看黄仁勋,他们被大众所知前已经有很久的创业经历了。你一定有很长的时间会面对很多质疑和误解,被折磨,失去生活平衡,而且大概率还做不出来。
真正的创业动机是你有一天突然睡不着了,你觉得这个东西你不干,没有人会干了,或者别人干一定没你干得好,那个瞬间才会触发你最底层的动力。
你如何度过创业过程最艰难的时期?
我职业生涯遇到的最大困难是我解决不了头几个员工洗澡的问题。当时渡鸦的投资人给了我们一件免费的毛坯房做办公室,那时冬天很冷,我们来不及安装马桶、热水器和暖气就开始干活了。结果有一天员工跟我说他们想洗热水澡,不能总是洗冷水澡,我们又没时间等待装修公司来铺设管道安装热水器,他们说解决不了就只能离职了。
结果我在巨大的压力下想了个歪招,就是找到附近大众评分最低的健身房,跟老板谈了个优惠团体价,给员工发了健身卡,解决了洗澡的问题。我现在每次想到都想笑,就是你会觉得你有很多比这个可能更难解决的问题,但最后发现最困难的原来是这样一件事。
Rabbit 在成本控制和供应链方面有哪些经验可以给新手创业者分享?
第一,一定要找到你的硬件老大,一定是在深圳东莞这些 OEM、ODM 领域有经验的,他可以把自己的所有资源带进来。
第二,你做过一次后,这个过程中你自己学习到的很多东西就变成了你的独门绝活,并且这些积累下的资源在十几年的过程中不断地放大。
如何看待移动平台巨头在 AI 方面做整合的天然优势?
我认为创业公司不要过早对标大厂策略,因为他们有先天优势,是小公司无法企及的。但机会依旧存在,因为在全新的生态系统中大家的起点一样,大公司和小公司都是从头开始思考。所以我们只要做好自己的工作,打出自己的竞争优势就有机会。
AI 硬件领域有什么值得探索的方向?
首先你需要想明白为什么你要做硬件?一定是因为你有非常厉害的软件,并且这个软件在其他地方都没有跑得比你更好的,我们不能把这个逻辑搞反。
AI 硬件一定是特别热的赛道,取胜的关键是软件层面的革新和突破。因为大家底层模型的能力水平相似,所以要做到差异化竞争,不同形态的 AI 硬件是很好的思考角度。如果你的软件在特定场景下更好用,用户就会为它买单。
AI 硬件企业需要哪方面的人才?
一定要有非常好的 Prompt engineer。他要对这个世界的通用知识很了解,可以问出很好的提示。很多人在学术上有很大造诣,但他在用户角度的思考上,或者对提示的理解上还处于学习和摸索阶段。新时代的 AI 工程师一定要对历史文化和千奇百怪的知识有非常深的理解和学习能力,要用非常开放的心态学习和思考。
设计产品时,你会遵循怎样的第一性原理?
三个单词:
intuitive,足够直观;
sensitive,足够敏感;
obsessive,足够执着、注重细节。
比如说 r1 为什么选择这个颜色,这是我的直觉。我觉得它好看,这是我的敏感,然后我要确保生产出来的产品就是我想象的颜色,这就是执着。三点都做到了,我就满意了。
足够直观。人的直觉是非理性的,人们爱上一个事物往往没有理由,你要用直觉判断你的产品是不是正确,然后用大量实验来验证,才可能有机会让人爱上它。如果不这样想,最多只能把它做到好用而已。
足够敏感。如何让你的直觉更准?你要对一切事物有足够强的敏感性,看到很多别人看不到的细节。你要保持自己的好奇心,投入大量时间学习各种新知识,接触各种全新的领域,不能挑挑拣拣。长期坚持下来,你就会比别人更敏感。
注重细节。怎样保证出来好的结果?就要抠细节、执着。

Hope
小编寄语
我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,关于AI战略方向的框架性认知,处于小范围分享状态,如果你感兴趣,可以扫描以下二维码和我联系。
「创业空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

大模型空间站再次感谢各位朋友的支持!

— END —


原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/07/14176.html

Like (0)
Previous 2024-07-11 14:22
Next 2024-07-11 20:15

相关推荐

  • 大模型日报(4月30日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流! 资讯 0…

    2024-04-30
    129
  • 大模型日报(5月29日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流! 资讯 0…

    2024-05-29
    128
  • 大模型日报(8月10~11日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-08-11
    237
  • 大模型周报:谷歌Bard更名为Gemini,对标GPT-4

    大模型日报和周报会在2月8-17日停更放假~ 但是好消息:你会在2月18日早上收到奇绩的春节特刊,放心躺平嗑瓜子吧同学们,你错过的消息小编团队会帮你全都收集起来~ LLM SPAC…

    2024-02-09
    144
  • 大模型日报(8月2日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-08-02
    247
  • 大模型日报(7月19日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-07-19
    263
  • 大模型日报(9月5日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-09-05
    248
  • 大模型日报(五一特刊 5月1-5日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流! 资讯 0…

    2024-05-05
    97
  • 大模型日报(5月27日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流! 资讯 0…

    2024-05-27
    180
  • 大模型日报(3月26日)

    特别活动! 欢迎观看大模型日报,如需进入大模型日报群和空间站请直接扫码。社群内除日报外还会第一时间分享大模型活动。 欢迎大家一起交流! 资讯 01 准确率 >98%,基于电子…

    2024-03-26
    157