和NVIDIA、Sharpa谈灵巧手：从削苹果到Scaling Law，机器人离"有手感"还有多远？-Vol94

Description

从Sharpa近期的灵巧手Demo讲起，无论是CES上翻扑克牌、折风车，还是在春晚盘核桃，在GTC大会期间削苹果，这些Demo代表灵巧手第一次展示了够胜任精细的以及长步骤任务，这是具身智能在灵巧操作上的里程碑时刻。探讨灵巧手在硬件上的不同路线，包括直驱代表的Sharpa Wave，腱绳方案代表的特斯拉 Optimus，代表了两种“第一性原理”。梳理了具身智能行业正在发生的几个关键趋势。NVIDIA、Google DeepMind、Disney Research 联合开发的Newton物理引擎和NVIDIA Cosmos带来的合成数据与虚拟世界仿真；从EgoScale论文中看到的两万小时第一视角数据带来的Scaling Law迹象；具备视频预测能力的世界模型，如DreamDojo实现了一分钟的长程任务；还有SONIC同样展现了运动控制领域Scaling Law的曙光。在模型架构上，剖析了Sharpa的CraftNet三层系统，从System 2的语言意识层，到System 1的视觉动作层，再到System 0的触觉手感层，以及世界模型、VLA的路线之争，最后讨论了NVIDIA三台计算机（训练—仿真—推理），展望触觉作为新模态、分层预训练推动灵巧操作走向通用泛化潜力。 03:00 从盘核桃到装显卡：这些 Demo 到底有多难？ > 对于人来说简单的事情，对于机器反而是难的——就像人的 DNA 里携带了预训练的模型，机器人得完全从零做起。——朱雪洲 * 灵巧操作三个难度级：搬运物体（夹爪能干）→ 两个物体精确配合（插 USB、发扑克牌）→ 改变物体形态（折纸风车、削苹果）。 * Sharpa 的长程任务能力是亮点：不是完成一个原子动作，是把很多复杂步骤串起来。 * 触觉决定下限：带触觉的机器手展会成功率超 90%，观众现场拍打干扰也能找补回来；失去触觉后成功率直接暴跌到 20% 以下。 11:30 为什么夹爪不够用？一把刀就能说明问题 > 人要用好一个刀，你要握持，甚至拿一个手指抵住刀背——夹爪夹住刀是两点受力，那个刀是不稳定的。——朱雪洲 * 宇树 G1 全身 23 自由度（无灵巧手），Sharpa 单手就 22 自由度——手的复杂度约等于一整个机器人。 * 夹爪的致命短板：早期训练勉强够用，中后期发现姿势空间太窄，面对极其日常的场景直接束手无策。 * 人类世界的工具都是为五指手设计的：吸尘器要握手柄还要抠扳机，电动工具同理。夹爪的两点受力根本 hold 不住。 * 反直觉的训练困境：自由度少的夹爪，可行姿势空间反而太窄，训练中后期发现大量场景不适配，还得从头来。 * 为什么是五指，而不是四指？ * 特斯拉等车企坚持在工厂部署灵巧手，其最终目标并非仅限于造车，而是为了打造能胜任各种场景的通用机器人。 17:45 从OpenAI在18年的的灵巧手研究开始，谈行业的痛点 > 当我们在谈 scale 的时候，其实我们谈的在机器人这个领域往往是多个不同角度的scale，它包括任务的scale、数据的scale、模型规模的scale、计算规模的scale。——Juana * OpenAI的解魔方强化学习尝试：没有泛化、没有触觉 * NVIDIA的三台计算机加速机器人开发和基础模型构建 * 第一代硬件：手动力密度比强健人手差 2-3 倍，"两指做俯卧撑"级别的极限指力还做不到；具备触觉能力 * 模型和数据还在追求 scaling law 28:00 灵巧手Know how：直驱 vs 腱绳-特斯拉跳票的卡点在哪？ > 全腱绳也不是真正仿生——人手内部有不少小肌肉群是直驱的。——朱雪洲 * Sharpa 选直驱：22 个自由度全集成在手掌内，和人手 1:1 尺寸，客户不用绑定特定小臂，灵活拼装。代价是手略重，但有明确的轻量化路径。 * 特斯拉选双腱绳：电机放小臂、手部成本低、空间大，但一堆腱绳挤满管道，任何一根出问题就得"把手整个破开来换筋"。 * 最终形态可能融合——力量型大肌肉放小臂（腱绳），精细小肌肉留手内（直驱），就像人手本来的结构。 * 1:1的重要性，好采集数据 * 为什么不是六指？无法采集数据 * 在仿真里做数据采集，适配硬件和环境的快速迭代 42:40 CraftNet 的架构：首个三分层的模型 > 一旦接触上物体，你就没有必要视觉上一直盯着看了，这个时候触觉本体已经 take over 了。——朱雪洲 * System 2（10B，~1Hz）：语言推理层——"今晚做番茄炒蛋，先去冰箱看看有没有鸡蛋"。直接用现有大语言模型，不自研。 * System 1（1B，~10Hz）：视觉主导——看冰箱在哪、引导手伸过去抓。用互联网第一人称视频预训练。 * System 0（0.1B，~100Hz）：触觉+本体觉——抓到鸡蛋那一刻视觉就退后，手感接管。用 NVIDIA 仿真环境的合成数据预训练。 * 三层异步运行、各有主模态，分层的好处：每层单独预训练更高效，数据需求不冲突，避免模态间"互相打架"。 51:00 数据金字塔：仿真练手感，视频练眼力，真机做对齐 > 在真实世界里去做改变是比较困难的，但在仿真里它就非常容易 scale。——Juana * 底层（海量、便宜、gap 大）：YouTube 等互联网视频，训 System 1 的视觉理解。 * 中层（可控、可 scale）：Newton 仿真引擎合成触觉数据，训 System 0 的手感；Cosmos 系列做风格迁移（Transfer）、未来帧预测（Predict）、洞察推理（Reason）。 * 顶层（稀缺、贵、gap 小）：真机数据，用来把 System 0 和 1 级联在一起端到端调优。 * 仿真对触觉数据特别合适：真实世界的触觉动捕设备（手套）噪声大、retargeting 难，仿真引擎天生擅长力学建模。 * 解决遥操的问题，有希望实现远程操作 1:06:15 Scaling Law 的曙光：上万小时的第一人称视频 * EgoScale：2 万小时第一人称视频训练 GR00T，成功率随数据量呈近对数关系上升，且"还没撞墙"——20 万小时会不会出现 transformer 时刻？ * DreamDojo：4 万小时第一人称视频走世界模型路线，蒸馏到机器人后能做连续 1 分钟长程任务。 * 第一人称数据为什么重要：当前视觉 backbone 缺乏 3D 空间转换能力，第一人称和机器人视角直接对应，省掉了"第三人称到第一人称"的转换。 * Thomas 的脑洞：短视频平台上的第一人称视频（手一直出现在画面里）、开箱博主桌面视角，说不定是下一个金矿。 1:11:20 世界模型 vs VLA：形似但"灵魂还没到" > 今天 VLA 可能有点形似，但灵魂层面还没有真理解世界。一个更好的 VLA 本质就是一个基于世界模型的 VLA。——朱雪洲 * VLA（Vision-Language-Action）：视觉+语言输入→直接输出动作。主流范式，但内部不一定真懂物理因果。 * 世界模型：学习"做什么动作→世界状态怎么变"的因果律。不一定要生成像素级视频，可以是更抽象的物理状态预测。 * NVIDIA 两条路都在推：GR00T系列走 VLA 迭代，DreamDojo 走世界模型探索。 1:22:20 模型的协同、运行性能、算力需求 > 如果让医生把人的手做一个全麻，就是你完全感知不到手上末端信号，然后在这种情况下去做一些手部的操作，很多时候你就会发现你很难完成你原本以为很简单的任务。——Juana * 三层模型的协同 * 基于NVIDIA Blackwell架构的Jetson Thor支持端侧同时运行多任务（硬件分割能力） * 非分层模型的道路：GR00T的教师模型，蒸馏一个学生的policy * Newton：用GPU加速版本的Mujoco，迪士尼机器人“沙地行走”场景 * 商业化路径："先把产品形态做对"是 Sharpa 的核心逻辑：高自由度+触觉+1:1 人手比例，决定了产品能不能在市场存活，价格问题交给起量后的自然下降。人物： * Juana Du - NVIDIA 机器人解决方案架构师 * 朱雪洲（Tom） - Sharpa 研究副总裁 * 托马斯白 - “脑放电波”主播，消费电子营销人，科技媒体特约作者 * Nixon - ”脑放电波“主播，硬件产品经理，前媒体记者 * 剪辑制作：Jeff 欢迎订阅脑放电波，2024/25苹果播客周度推荐节目、小宇宙累计12次编辑推荐单集、2024CPA播客中文奖年度科技数码类播客 [https://bts-image.xyzcdn.net/aHR0cHM6Ly9sMXpmb3l2dHBhLmZlaXNodS5jbi9zcGFjZS9hcGkvYm94L3N0cmVhbS9kb3dubG9hZC9hc3luY2NvZGUvP2NvZGU9TXpWbU5qTmxOR1JqWlRjMU16ZzBaVFJtTXpCbFpEZzBOR1F6TjJNNU1qaGZhR1ZuUmpGa2JUTk9RVXRUYTJWdldGWktNa05YWkV4emNsQkNjVVV4VkRCZlZHOXJaVzQ2UTJkTE5HSkpiVk15YjNaMVVUTjRhMnR0UkdOMmNHazRibXRuWHpFM056VTVOalkzTXpBNk1UYzNOVGszTURNek1GOVdOQSZhZGRfd2F0ZXJtYXJrPXRydWUmc2NlbmVfdHlwZT1DQ00=] 欢迎在评论区留言发表你对灵巧操作、具身智能Scaling Law 的感受与看法对于节目话题的更多观点，获取更多未呈现在节目中的扩展阅读，欢迎添加脑放电波小助手微信（BrainAMP01），附言“灵巧手”，加群参与讨论，后续会发布本期节目的文字稿参考内容 1. 物理AI核心技术与平台 Cosmos [https://www.nvidia.cn/ai/cosmos/]：NVIDIA 面向物理 AI 的世界基础模型开放平台。推理 VLA (Reasoning Vision-Language-Action) [https://www.nvidia.cn/glossary/reasoning-vision-language-action/]：融合视觉、语言与动作生成的逐步推理 AI 模型。三台计算机 (Three Computers for Robotics) [https://blogs.nvidia.com/blog/three-computers-robotics/]：NVIDIA 为物理 AI 提出的训练、仿真、部署三层计算架构。 Isaac GR00T [https://developer.nvidia.cn/isaac/gr00t]：NVIDIA 面向人形机器人的通用基础模型研发平台。 Isaac Sim [https://developer.nvidia.cn/isaac/sim] / Isaac Lab [https://developer.nvidia.cn/isaac/lab]：机器人仿真与合成数据生成框架及其配套强化学习框架。 Newton 物理仿真引擎 [https://developer.nvidia.com/newton-physics]：NVIDIA、Google DeepMind、Disney Research 联合开发的开源 GPU 物理引擎。 2. 前沿机器人论文 DreamDojo [https://dreamdojo-world.github.io/]：在 4.4 万小时人类第一人称视频上预训练的通用机器人世界模型。 EgoScale [https://research.nvidia.com/labs/gear/egoscale/]：利用人类第一人称数据训练 VLA 模型、提升灵巧操作能力的框架。 DreamZero [https://dreamzero0.github.io/]（GR00T N2 基础研究）：基于视频扩散模型的世界-动作模型，具备强大的零样本泛化能力。 SONIC [https://nvlabs.github.io/GEAR-SONIC/]：NVIDIA 在运动控制上的 scaling law 研究，展示了数据、模型和算力规模化的效果 TacMap [https://arxiv.org/html/2602.21625v1]：高保真触觉仿真框架，行业内唯一可大规模商用的触觉仿真方案，NVIDIA 与 Sharpa 合作开发 3. 灵巧手与机器人公司 SharpaWave 灵巧手 [https://www.sharpa.com/pages/wave]：Sharpa 首款产品，22 个主动自由度、尺寸与人手高度匹配。 CraftNet (VTLA 模型) [https://www.sharpa.com/pages/craftnet]：Sharpa 的端到端分层视觉-触觉-语言-动作模型。 Sharpa North 机器人 [https://www.sharpa.com/blogs/news/sharpa-unveils-its-first-autonomous-full-body-robot-with-human-dexterity-at-ces-2026]：Sharpa 在 CES 2026 推出的首款自主全尺寸人形机器人。 OpenAI 机械手解魔方 (2019) [https://openai.com/index/solving-rubiks-cube/]：证明仿真训练的神经网络可控制真实灵巧手单手还原魔方的里程碑研究。 4. 经典 Demo 视频（Sharpa 官方） GTC 2026：组装电脑 [https://www.youtube.com/watch?v=RQwjVGx6-O8]：Sharpa North 自主将 GPU 精准插入主板 PCIe 插槽。削苹果 [https://www.youtube.com/watch?v=UVQdqf8ppuw]：机器人双手协调配合触觉反馈完成削苹果皮。转网球 [https://www.youtube.com/watch?v=L1ZGGW23Opk]：对比有无触觉系统辅助下灵巧手旋转网球的效果。 CES 2026：打乒乓球与折风车 [https://www.youtube.com/watch?v=wCR2eCK3kD0]：0.02 秒反应时间的乒乓球对打及纸风车折叠长程任务。 CES 2026：综合展示（含 BlackJack 发牌） [https://www.youtube.com/watch?v=W7q-qlj4EFc]：Sharpa 在 CES 展台的多项互动演示，含 21 点荷官发牌。 5.软件架构和其他技术名词 Sharpa在GTC 2026大会上的技术分享回放 [https://www.nvidia.com/en-us/on-demand/session/gtc26-s81577/] CraftNet [https://www.sharpa.com/pages/craftnet]：Sharpa 的分层模型架构，包含三个系统： * System 2（10B 模型，1Hz）：语言推理大脑 * System 1（1B 模型，10Hz）：视觉运动大脑 * System 0（0.1B 模型，100Hz）：触觉交互大脑 Egocentric Data（第一人称数据）：从机器人或人类第一视角采集的数据，对训练最有价值 Sim-to-Real：从仿真到现实的迁移，是具身智能的关键挑战节目中用到的音乐：来自monkeyman535的90's Rock Style，地址freesound.org [https://freesound.org/s/466981/]；来自kjartan_abel的Berlin Town，地址freesound.org [https://freesound.org/s/564665/]；基于 CC BY 4.0 DEED 使用。

独家实测机器人上门保洁：149元3小时背后，数据与能力的天花板-Vol96

在58同城约了个机器人上门做保洁，来的不只一台机器，还自带工程师、保洁阿姨和货拉拉司机。这一期不只有自变量的保洁机器人。去年在北美花60美金30分钟体验了一次机器人按摩，回头一查，那家叫Aescape的公司今年4月破产了。维他动力的Vbot机器狗也开始大规模交付了——4000台，占去年行业产能的五分之一。三段亲历，同一个问题：消费级机器人离"有用"到底还有多远？后半段我们扎进了行业数据策略的争论。Jim Fan在红杉闭门会上说VLA已死，世界模型才是出路。我们还扒了最近Figure、Generalist、Genesis AI三家放出的demo——这些视频看起来一个比一个强，但在真实场景里的表现，我们存疑。 02:00 自变量机器人上门：149块3小时，谁在干活？ > 一台机器人进门要三个人伺候：工程师、阿姨、货拉拉司机。 * 58同城APP预约，目前只开放深圳。149元含一位保洁阿姨+一台双臂机器人+一位随行工程师。阿姨收拾厨房厕所卧室，机器人只负责客厅——过不了门槛、挤不进卧室。 * 机器人是轮式底盘，宽50cm长80cm高约1.5m，重几百公斤。两个夹爪能从地面夹到1.5m高，工程师得用货拉拉运、用斜坡推下车，"抱是抱不下来的"。 * 它在客厅干了这些活：把倒地书包拎起、拉上拉链（夹了3次）、三个书包摞一摞、叠了五六件衣服（每件5到10分钟）、茶几杂物归类后丢垃圾、餐桌杂物叠成半桌、临走把门口鞋摆好。中间死机一次，停了20分钟。 * 机器人完全静默——没有音响，零交互。托马斯白没法给它派活，"他进来就直奔沙发开始干，我没有做任何表达"。背部USB口插着一个4K HDMI发射器（用来回传画面和遥操指令），工程师自带了华为5G路由器组网。 [https://image.xyzcdn.net/FtDRtY4cBYB1deRvx2esnfqAfmKu.JPEG] ---------------------------------------- 10:00 拉拉链那一幕：惊艳是真的，推测有人在遥操 > 我给遥操的大哥点个赞了，手法真好。 * 书包拉链是拉上了。从地面拎包→放沙发→夹拉链（失败两次）→换到侧面夹→成功，整个过程2分多钟。动作精细程度远超目前任何全自主模型的公开水平。 * 托马斯白中间说了一句"这个可以放在旁边的箱子上"，机器人大约2秒后转头找到那个箱子放下，感觉"后台有人在听"。 * 中间停住过一次，工程师查网络、联系公司，约20分钟恢复。 * 行业惯例：1X的人形机器人进家100%遥操，智元2025年展示的做三明治也是遥操，Tesla Optimus那次倒啤酒后来也被爆是遥操。Nixon："凡是看起来太完美的家用机器人现场，默认它有遥操背景是更合理的判断。" * 叠衣服的表现倒像自主尝试——不是人类叠法，不甩不抖，左抓右抓，叠得"比我儿子还差点"。托马斯白的猜测：拉拉链这类精细活是遥操，叠衣服这种标准化任务可能切到了世界模型在跑。皮沙发脚托很滑，衣服下半截接触台面后还会被拉移位。烘干后带皱的不同面料，跟实验室里轻薄垂顺的T恤完全是两码事。机器人没有"甩"这个动作能力——而叠好衣服恰恰需要抖和甩。最后那叠衣服只能说变成了方形，里面的皱褶全在。 [https://image.xyzcdn.net/Fk8anQoSImu0BsoNIN2aZynxzCio.png][https://image.xyzcdn.net/FmNlopGotNItQnmKkE-35nKKt6tY.PNG] 33:00 按摩机器人为什么死了？Aescape的1.57亿美金教训 > 像在工厂里被按摩。节奏、节拍、运行声都像车间设备。 * Aescape，2017年成立，Equinox健身房和四季酒店有部署，30分钟60美元。上个月申请破产，累计亏了1.57亿美元，融了1.2亿，资不抵债。 * Nixon去年10月体验：先上网填衣服尺码，到店换上紧身瑜伽服，摘掉项链摘项链、Body Scan，塞好衣角。躺在床上，左右两个"螃蟹钳子"机械臂开始从上到下、从轻到重地滚。咔特咔特的充放气声+散热风扇嗡嗡响，背景放着冥想音乐也盖不住。 * 力控粗糙。机械臂无法像人手一样一会儿用手掌一会儿用骨节调节压强，力道偏大时Nixon只能自己往下滑来躲。触觉也没精细到能感知衣服材质——所以才必须让客人穿统一面料，"用流程兜底感知能力不足"。 * 一周只能约三天，剩下四天机器在维护。"一台机器7天只干3天活，单店利用率直接腰斩。"商业模型里回本周期、维护成本、场地分成三项一算，根基本来就是裂的。 [https://image.xyzcdn.net/FjOn7Leoo3a7DEPtXw3PXy4ml-AE.png] ---------------------------------------- 41:00 Vbot机器狗量产 * 5月8号首批500台下线，5-6月产能冲到2500台/月，四千台进家庭。Pre-A轮近5亿元，目前消费级具身赛道单笔最大。CEO已明确下一站在做全尺寸人形机器人。 * Nixon在上海长宁来福士探店，商场草地和教堂广场上牵着遛了15分钟。四种跟随模式：稳态（要使点劲拽）、省力（手腕一转就跟）、户外探路（机器在前）、跟随（机器在后）。UWB信标=远程牵引绳+跟随定位锚，内置麦克风能语音查询"来福士到长宁区政府怎么走"。 * 新配件包括静音组、防夹手设计、家庭守护（本地48小时存储），后续Openclaw SDK路线是"模糊指令→自动编程→完成任务"。 * 4000台=去年行业机器狗总产能的1/5。Nixon："量产是数据滚轮的入场券。硬件趋同后，操作系统和生态才是真正的护城河。" [https://image.xyzcdn.net/Fm5XvIS_K8JMe89017Hhb2SYU8Do.png] 45:00 数据游戏变了：从人手把手教，到iPhone绑头上拍 * 过去两年，行业靠VR遥操攒数据起家——让操作员戴着VR头盔用手柄控制机器人做动作，录下来当训练样本。这条路走到头了：单工位年运营50万+人民币，建1000个工位也凑不到100万小时；遥操员没触觉反馈，成功率只有1/3；动作慢、动作僵，抖衣服这种依赖速度的任务永远学不会。 * 2025年出现拐点。单目人体姿态估计成熟，iPhone第一人称视频能精准提取21个手部关节——戴着手机正常干活就能产训练数据。英伟达EgoScale的配方：2.1万小时ego视频做预训练（主食），加50小时数据手套（精细对齐），加4小时遥操（校准锚定，不到0.1%），就训出了符合scaling law的模型。 * Build AI，一家18岁哥大辍学生创办的公司，把iPhone和头戴相机绑在亚洲数千名工厂工人头上。去年10月开源1万小时，年底扩到10万小时，今年目标100万小时。这本质上是把"采人类视频"做成了流水线生意。 * 三条线都在跑，只是权重在变：遥操→黄金数据（微调锚定用），ego视频→基础数据（预训练主粮），Human Data多模态→核心数据（力觉触觉全身动力学）。Jim Fan给的金字塔很直白：塔尖遥操最难扩展，塔基第一视角视频千万小时级别起步，"饭在塔基"。 ---------------------------------------- 01:00:00 Jim Fan的“暴论”：VLA已死，WAM当道 > 可乐罐放在Taylor Swift照片旁边——这是VLA最高光的demo，也是天花板。 * VLA（Vision Language Action）的根子是让语言模型理解物理任务。Jim Fan在红杉闭门会上直接给VLA画了个墓碑RIP。原因很简单："绝大部分参数给了语言"，而语言在物理世界里是有损压缩——"把可乐罐放在Taylor Swift照片旁边"这种任务靠语义指代能行，"把这件衣服叠成刚好能塞进抽屉的样子""绕着这盆花的形状擦桌子"——全是"差不多""刚好""大概"，文字编码不了。 * WAM（World Action Model）替代思路：预测世界下一帧画面，让动作微调把预测兑现成执行。"如果模型预测的下一帧是对的，动作通常就是对的。"作品Dream Zero，Jim Fan说这是"机器人的GPT-2时刻"。 ---------------------------------------- 01:11:00 实验室里的Demo：精修画面和真实世界之间隔了多少次摆拍？ > 我们不知道是不是遥操摆拍了十多次，最终给你剪一段出来。 * Generalist（GEN-1）放出6个特定任务99%成功率，背后是50万小时人类动捕数据。仔细看：只有T恤折叠、吸尘器维护这6个任务到了99%。其他任务泛化能力未知。全程没有语言参与——"没有语言就没有目标，机器人其实不知道自己在干什么。" * Genesis AI（GENE-26.5）打蛋、切番茄、做奶昔，多数子任务90-95%。打蛋和刀转移番茄两项最难的只到50-60%——打蛋刚好是"特别讲究触觉和手感"的动作，这两项做不好，离真实厨房还很远。公司自己说的是"30秒复杂技能=几小时人类数据+不到半小时机器人执行数据"，路径是人类预训练+少量机器人适配+仿真闭环（他们原本就是仿真平台出身）。 * Figure（Helix-02，5月8号放出）双机协同卧室整理：开关门、挂衣服、收耳机、倒垃圾、推椅子、盖被子，不到2分钟。画面精美，布景专业，打光讲究，像一个广告片。"考虑到今天机器人的遥操如此普及，我们不知道它真实的能力边界在哪里。" * 这三个Demo都是在实验室条件下精挑细选的展示。播客前半段聊的那三台机器——自变量保洁干3小时死机、Aescape一周坏四天、Vbot机器狗遛狗体验——是任何普通人都能上手体验、看到所有失败和局限的真实产品。精选画面和完整工作日之间，差的不是技术参数，是"能不能在全天候、无人值守的条件下持续工作"这道最硬的门槛。相关视频： * 自变量机器人发布会 [https://www.bilibili.com/video/BV1RhoYBtEKJ/?spm_id_from=333.337.search-card.all.click] * 北美机器人按摩 [https://www.bilibili.com/video/BV1qHxYzqE4g/?spm_id_from=333.1387.upload.video_card.click] * 维他动力 vbot [https://www.bilibili.com/video/BV1Uv5p6mExT/?spm_id_from=333.1387.upload.video_card.click&vd_source=898295ff33f0563c5f731c315329643c] * 【红杉AI Ascent 2026】英伟达Jim Fan：机器人领域的终局 [https://www.bilibili.com/video/BV1VLRMB2EAw/?spm_id_from=333.337.search-card.all.click&vd_source=898295ff33f0563c5f731c315329643c] * Generalist AI发布GEN-1！一脚踹开“精通物理任务”的大门，1小时数据，成功率达到99%_哔哩哔哩_bilibili [https://www.bilibili.com/video/BV1uu9NBcE8Y/?spm_id_from=333.337.search-card.all.click] * Genesis www.bilibili.com [http://www.bilibili.com] * Figure的demo www.bilibili.com [http://www.bilibili.com] 人物： * 托马斯白 - “脑放电波”主播，消费电子营销人，科技媒体特约作者 * Nixon - ”脑放电波“主播，硬件产品经理，前媒体记者 * 剪辑制作：Jeff 欢迎订阅脑放电波，2024/25苹果播客周度推荐节目、小宇宙累计13次编辑推荐单集、2024CPA播客中文奖年度科技数码类播客 [https://image.xyzcdn.net/FsLgQN2bfTI1dxiCf9h476IBYIqs.png][https://image.xyzcdn.net/FuR3nf3i7Kn8tWO4Rhoi559drhic.JPG] 欢迎在评论区留言发表你对机器人做家务的感受与看法对于节目话题的更多观点，获取更多未呈现在节目中的扩展阅读，欢迎添加脑放电波小助手微信（BrainAMP01），附言“机器人”，加群参与讨论，后续会发布本期节目的文字稿节目中用到的音乐：来自monkeyman535的90's Rock Style，地址freesound.org [http://地址freesound.org]；来自kjartan_abel的Berlin Town，地址freesound.org [http://地址freesound.org]；基于 CC BY 4.0 DEED 使用。脑放电波往期节目精选（搜索关键词可收听） * 具身智能：灵巧手 [https://www.xiaoyuzhoufm.com/episode/69db3b71b977fb2c47b5bc82] / 消费机器人浪潮 [https://www.xiaoyuzhoufm.com/episodes/693fe1832a383da16739ced6] / 戴森与追觅 [https://www.xiaoyuzhoufm.com/episode/68bede0c9eb4a493006b179d] / 大疆扫地机 [https://www.xiaoyuzhoufm.com/episode/68a1dfe9293471fed4101a27] / 宇树机器人 [https://www.xiaoyuzhoufm.com/episode/67bdf97b606e5c5940d60619] * AI 造物：3D打印机 [https://www.xiaoyuzhoufm.com/episode/6829e196457b22ce0d4c36bd] / 3D打印的"iPhone时刻" [https://www.xiaoyuzhoufm.com/episode/6922c3becbba038b42df0e1e] / 3D扫描、生成与打印 [https://www.xiaoyuzhoufm.com/episode/6922c3becbba038b42df0e1e] / AI玩具和国产芯片 [https://www.xiaoyuzhoufm.com/episodes/690eb6b1af4fc00da7b131e9] * AI 应用：闪念贝壳 [https://www.xiaoyuzhoufm.com/episodes/695a42deba709206704bd2d3] * 汽车聚变、泛科技生活：SU7营销复盘 [https://www.xiaoyuzhoufm.com/episode/661153124f66d1c1da58cbae] / 3D打印 [https://www.xiaoyuzhoufm.com/episode/6829e196457b22ce0d4c36bd] / 孵化大疆 [https://www.xiaoyuzhoufm.com/episode/689785b2032793b18a91f930] * 饮食健康、现代病人：AI助推造神 [https://www.xiaoyuzhoufm.com/episodes/692679370084e2631dc70443] / 生物骇客 [https://www.xiaoyuzhoufm.com/episodes/6933dfd13fec3166cf8efb13] / AI 内容真假难辨 [https://www.xiaoyuzhoufm.com/episode/684d37fb2a38b4d9799c96fe] / 控糖革命 [https://www.xiaoyuzhoufm.com/episode/6693526737236c546efa78d1] / 信息过载 [https://www.xiaoyuzhoufm.com/episode/6766623e15a5fd520e608aa0] / 长寿革命 [https://www.xiaoyuzhoufm.com/episode/653e7b422d3520c14fa175a9] / 阿斯巴甜致癌疑云 [https://www.xiaoyuzhoufm.com/episode/64a15d8663a61044f40992f5] * 苹果特权：腕上革命 [https://www.xiaoyuzhoufm.com/episodes/68c739df2c82c9dcca59ae01] / 设计哲学 [https://www.xiaoyuzhoufm.com/episode/66ddbfeebfd7110df4268429] / 苹果供应链迷思 [https://www.xiaoyuzhoufm.com/episode/6506cb74bbe351e616281901] / 苹果广告底层逻辑 [https://www.xiaoyuzhoufm.com/episode/64c65f3bb3f6c440a86bc1b2] / iPhone 15 和它的前任们 [https://www.xiaoyuzhoufm.com/episode/64f74bfa6884ccbb19214a13] / 苹果零售店 [https://www.xiaoyuzhoufm.com/episode/65a33569926ad7aad0e73f59] * AI 相关节目：人机交互的与“iPhone 时刻” [https://www.xiaoyuzhoufm.com/episode/687b9d23a9dec9250019c372] / 会喘气的AI语音里藏着下一代交互范式 [https://www.xiaoyuzhoufm.com/episode/66b0e99633ddcbb53c7feb37] / 解构Apple Intelligence [https://www.xiaoyuzhoufm.com/episode/6669ae45c26e396a3651d7b9] / 和李楠聊AI硬件 [https://www.xiaoyuzhoufm.com/episode/6627cfb6200abebe6ece766c] / 611款 AI 生产力工具 [https://podcasts.apple.com/cn/podcast/%E8%84%91%E6%94%BE%E7%94%B5%E6%B3%A2/id1661644635?i=1000604890182]；脑放电波是一档关注科技前沿、品牌营销和个人成长的谈话类节目。每期带给您一个有趣有据的话题，帮您在信息严重过载的现代世界小幅自我迭代。您可以在小宇宙、苹果播客或者其他泛用型播客客户端搜索“脑放电波”找到并关注我们，如果您对本期节目有任何疑问，欢迎您给我们留言，如果您觉得这期内容对你有所帮助，欢迎您关注点赞收藏转发，这对我们非常重要。

11. maj 20261 h 20 min

和NVIDIA、Sharpa谈灵巧手：从削苹果到Scaling Law，机器人离"有手感"还有多远？-Vol94

12. apr. 20261 h 36 min

和NVIDIA、Sharpa谈灵巧手：从削苹果到Scaling Law，机器人离"有手感"还有多远？-Vol94

Description

Comments

2 months for 19 kr.

All episodes