
chino
Negocios
$99 / mes después de la prueba.Cancela cuando quieras.
Acerca de OnBoard!
Hello World, who is OnBoard!? 两个爱码字的投资人关于软件、创业与投资的真诚对话。 关注主播: Monica:美元VC投资人,前 AWS 硅谷团队+AI创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学 GN:前SaaS及科技投资人,Global SaaS社区Linkloud发起人,公众号我思锅我在 (ID: thinkxcloud) 主理人。| 即刻:High 宁 同名 Podcast 在各大平台都有哦:喜马拉雅, Apple Podcasts, Spotify, Google Podcasts, Overcast
EP 69. 【直播回放】对话硅谷AI应用增长顾问陈唱:实操HeyGen, Gamma, Otter.ai 百万用户增长复盘
OnBoard! 今年第一场直播回放来啦!我们跨洋连线硅谷资深增长顾问陈畅,2个多小时的访谈,探讨了关于AI应用出海增长的各种干货,直播间饱爆满好评如潮,我们经过整理放出精修音频,绝对值得你反复听几遍! Hello World, who is OnBoard!? 今年真是AI应用爆发的大年!诞生不到26个月的ChatGPT 月活已超过8亿,OpenAI 和Anthropic ARR 分别超过100亿美金和50亿美金,Cursor, Lovable, Manus, Genspark 等 AI 应用的用户数和收入增长不断刷新纪录。 越来越多的AI应用创业者涌入赛场,如何做增长,就成了最经常被谈论的话题。尤其是对于广大打造出海应用的中国创业者,更是希望听到来自硅谷最一线的经验。 Chang 是增长顾问公司Hockey Stick Growth创始人。过去8年里,她服务过的很多客户不仅获得了顶尖VC投资,更是实现了扎实的用户和收入的跃升。这个名单,一定有不少你熟知的公司:HeyGen, Gamma, Otter.ai, 还有最近大火的语音模型公司 Cartesia, 成立不到2年,融资超过$90M, 上千万美金收入…… 在两个多小时的对话里,Chang非常坦诚地分享了他在硅谷一线观察到的AI产品增长变化,以及那些成功案例背后的真实策略。比如: * AI应用增长方式过去几年的变化 * 从"AI化"到"去AI化"的品牌定位趋势背后发生了什么? * 面对越来越卷的增长渠道,AI产品如何找到突破口? * 那些"剑走偏锋"的增长策略到底值不值得尝试? * KOL和各种渠道营销的具体方法论 * 为什么要考虑 product-channel-fit * ... 如果你正在做AI产品,或者对AI应用的增长策略感兴趣,这期来自硅谷一线的实战分享,绝对不容错过!听过直播的同学,也值得反复复习~Enjoy!嘉宾介绍 * Chang Chen(陈畅) – 硅谷增长顾问,Hockey Stick [http://hockeystick.io/]增长顾问公司创始人;曾助力 HeyGen、Gamma、Otter.ai 等头部产品打造爆款增长闭环。 * OnBoard! 主持:Monica:美元VC投资人,前 AWS 硅谷团队+ AI 创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学 * OnBoard! 主持:GN:前SaaS及科技投资人,Global SaaS 社区 Linkloud 发起人,公众号我思锅我在 (ID: thinkxcloud) 主理人。| 即刻:High寧 我们聊了什么 * 02:59 Chang 自我介绍,最近看到的有意思的AI 产品和增长方式 * 06:36 AI 应用增长方式的演变:从强调“AI”到回归“产品价值”的“去AI化”趋势。 * 13:30 Go Viral 的底层逻辑:如何利用“猎奇、强大、共情”的用户心理策划病毒式传播? * 17:37 案例复盘:如何结合热点话题 (Elon Musk's Grok) 策划成功的营销活动? * 19:59 Product-Channel Fit:如何为产品的不同阶段和用户画像找到最合适的增长渠道? * 24:00 被低估的增长渠道:为什么 ToB 产品应该重视 LinkedIn? * 30:12 KOL 营销全攻略:如何识别、触达、并与高质量的 KOL 建立长期合作? * 41:49 从“爆款”到“体系”:当市场变卷,如何建立可持续的增长护城河? * 49:47 AI 产品如何收费?订阅制、Pay-as-you-go、混合模式的利弊分析。 * 58:53 从 PLG 到 PLS/SLG:AI 公司如何抓住企业客户,何时应该拓展企业市场? * 01:10:59 Product-Market Fit 是一个动态过程,出海创业者如何更好地找到它? * 01:16:24 AI 如何赋能增长团队?从内容生成到渠道拓展的最佳实践和误区。 * 01:20:20 LLM-Native 新渠道:如何在 ChatGPT 和 GPT Store 中获取流量? * 01:24:07 Product Hunt 打榜还值得做吗?效果、用户质量和平台公信力的变化。 * 01:27:06 从0到1搭建增长团队:创始人何时应该招聘第一个全职增长负责人? * 01:32:28 推荐的增长信息渠道:Twitter, LinkedIn 和线下分享。 * 01:33:00 未来展望:AI Agent 赛道有哪些“卖铲子”的机会? 我们提到的公司和概念 * HeyGen - AI视频生成领军企业 * Gamma - AI PPT生成先驱,不到30人团队超过5000万美金ARR * Cartesia - 语音模型公司,成立不到两年融资超过9000万美金 * Otter.ai - 会议转录和AI助手,超过1亿美金ARR * Cluely - "AI agent to cheat on everything"争议性定位 * Eleven Labs - 语音合成领域头部公司 * Apollo - 销售线索工具 * Synthesia - AI 虚拟人生成工具 * PLG (Product-Led Growth) - 产品驱动增长 * SLG (Sales-Led Growth) - 销售驱动增长 * ICP (Ideal Customer Profile) - 理想用户画像 * PMF (Product Market Fit) - 产品市场契合度 别忘了!同步关注两位 Host 的微信公众号,看更多干货内容哦: M小姐研习录 (ID: MissMStudy) by Monica 我思锅我在 (ID: thinkxcloud) by GN 欢迎在评论区留下你的思考,与听友们互动。喜欢 OnBoard! 的话,也可以点击打赏,请我们喝一杯咖啡!如果你用 Apple Podcasts 收听,也请给我们一个五星好评,这对我们非常重要。 最后!快来加入Onboard!听友群,结识到高质量的听友们,我们还会组织线下主题聚会,开放实时旁听播客录制,嘉宾互动等新的尝试。添加任意一位小助手微信,onboard666, 或者 Nine_tunes,小助手会拉你进群。期待你来!
EP 68. 对话AppLovin技术VP葛小川:2年市值增长25倍,千亿美金广告平台的传奇成长史
薛定谔式更新的 OnBoard! 回来了!今天我们要聊一家在过去几年里创造了美股增长神话的千亿美金传奇公司——AppLovin。如果你关注美股和游戏广告市场,Applovin 的名字一定早就如雷贯耳了。 Hello World, who is OnBoard!? AppLovin成立于2012年,2021年在纳斯达克时估值还不到300亿美金,之后一度下跌至不到30亿美金,而经过短短几年的转型,2023年至今市值已经飙升20多倍,成为跻身纳斯达克 100 指数(NASDAQ-100) 的美股顶流千亿美金公司。2024 年营收 47 亿美元,同比 +43%,净利率也高的吓人,EBITDA 高达 27亿美金。而 Applovin 总员工数不到1000人,实现了“人均创造400万美金EBITDA”的惊人效率。 这一系列数字背后,是一个在硅谷都值得铭记的神奇故事:一家公司如何从游戏营销经纪公司,转型为游戏公司,又在大家以为广告行业被Google, meta 等巨头垄断没有新机会的时候,剥离所有游戏业务,成功转型为广告技术平台,并重塑行业生态。 虽然业绩亮眼,但AppLovin在成长过程中也一直饱受争议。那么争议背后的真实情况是什么?他们所做的事情与我们理解的广告、AI应用到底有怎样的关系?每日触达超 14 亿活跃用户的广告引擎,究竟是怎样打造的? 今天我们邀请到的嘉宾大概是最有发言权的人之一了。 AppLovin 的技术副总裁葛小川(Giovanni Ge),在 Meta 参与了广告系统核心算法的他,在 AppLovin 转型的关键时刻加入,并发挥了非常核心的作用。这次长达两个多小时的访谈,也是 Applovin 在中文媒体中第一次深度访谈。小川畅谈了很多理解这个公司的关键问题: * 如何从物理学博士转型,并在关键时刻加入 AppLovin * AppLovin 两次转型的精彩历程 * 如何在被低估的手游广告市场中打造了买卖闭环的新型平台 * 这个 AI 第一股背后朴实又本质的算法逻辑和技术思考 * 华尔街为何集体错判(并且似乎还没看清) * 电商如何成为下一个增长飞轮 * …… 嘉宾介绍 * 葛小川 (Giovanni Ge),AppLovin (NASDAQ: APP) 技术副总裁 (VP of Engineering),曾在 Meta, Uber 担任高级机器学习工程师,SISSA 凝聚态材料物理学博士,中科大少年班。 * OnBoard! 主持:Monica:美元VC投资人,前 AWS 硅谷团队+ AI 创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学 友情小广告 2024 年,AppLovin 在北京正式组建 Axon China 团队啦!这支团队致力于打造全球化的广告产品,同时,积极探索大语言模型的应用,以技术创新推动行业变革,重新定义广告的未来。如果你听完了这一期分享,对公司的职位感兴趣,可以在如下招聘渠道中申请,不要错过跟这么有意思的一群人打造未来的机会! * AppLovin招聘邮箱:lillian.cao@applovin.com * 招聘网址:(中国)app.mokahr.com [https://app.mokahr.com/m/social-recruitment/applovin/148184];(北美)www.applovin.com [https://www.applovin.com/jobs/] 我们还聊到AppLovin 为什么自认为是 "千亿美金的创业公司”,形成了no meeting,CTO亲手写代码和产品原型的独特文化。 OnBoard! 之前聊了很多AI 技术的细节,这次难得的千亿美金公司成长故事,希望给你不一样的启发。Enjoy! (注:本文不构成任何投资建议!) 我们都聊了什么 00:03 开场介绍,AppLovin 为什么值得你关注03:34 Giovanni 自我介绍,从凝聚态物理 PhD 到 Uber、Meta,再到 AppLovin 的职业转型09:06 AppLovin 发展史:手游应用推广,自建发行,关键收购,广告平台转型14:24 转折点:广告收入反超游戏,2025 Q1 出售自研游戏资产19:57 AppLovin 的历史机遇与移动广告“三国杀”:Google / Meta vs 碎片化长尾流量22:26 AppLovin 新型平台如何改变定价方式和行业生态,为什么 Google, Meta 做不了30:04 广告推荐模型的演进历史,AppLovin 新模式 ROAS > CTR 背后数据飞轮 39:36 关键决策:“保护开发者长期利益”42:26 华尔街“迟到的认可”——连续 8 季 beat,却股价滞后,被低估的是什么48:32 为什么说 AppLovin 像也不像拼多多?50:35 利润率飙升逻辑56:22 电商广告如何为游戏生态注入“外部现金流”,新的挑战和机会是什么58:30 生成式 AI 机会:创意生成、特征提取与推荐模型01:00:38 如何理解 AppLovin 业务天花板?平台更迭和 LLM 可能带来哪些机遇01:16:34 人均400万美金超高人效背后的“千亿美金创业公司”文化01:23:00 全球招聘与北京研发中心:寻找“三段式”高成长人才01:26:30 AppLovin 人才招聘观,北京团队招人啦!欢迎关注M小姐的微信公众号,了解更多中美软件、AI与创业投资的干货内容! M小姐研习录 (ID: MissMStudy) 欢迎在评论区留下你的思考,与听友们互动。喜欢 OnBoard! 的话,也可以点击打赏,请我们喝一杯咖啡! 如果你用 Apple Podcasts 收听,也请给我们一个五星好评,这对我们非常重要。 最后!快来加入Onboard!听友群,结识到高质量的听友们,我们还会组织线下主题聚会,开放实时旁听播客录制,嘉宾互动等新的尝试。添加任意一位小助手微信,onboard666, 或者 Nine_tunes,小助手会拉你进群。期待你来!
EP 65. 对话 Daloopa CTO Jeremy Huang:融资4千万美金,如何打造红遍华尔街的AI金融产品
久违的 OnBoard! 全英文的访谈,这次的嘉宾 Jeremy Huang, 是美国AI创业公司 Daloopa 的联合创始人兼 CTO。Daloopa 是一家很低调但是很值得关注的公司。几位华裔创业者 2019 年成立的公司,他们的客户是企业服务软件公司都最想切入又最有难度的行业:金融服务业。 今年5月,Daloopa 宣布了B轮融资$18M, 总融资额超过$40M。他们的AI 产品帮助华尔街的对冲基金、银行、PE等投资机构实现投资模型中的数据工作自动化,他们的客户覆盖了大部分大家耳熟能详的头部金融机构:Morgan Stanley, L/S hedge fund, Credit Suisse 等等。 Hello World, who is OnBoard!? 在两个多小时的对话里,Jeremy 真是非常坦诚地分享了很多从0-1的真实经历和非共识的观点,比如: * 为什么要 sell before you build? * 早期 startup idea 探索踩了那些坑? * 为什么 CTO 也要每天花 8 小时去跟客户打电话? * 如何平衡大客户定制化要求和标准化产品的设计? * 如何管理遍布全球的远程团队? * 面向准确度要求很高的金融领域 AI产品,LLM有哪些机会和挑战? 如果你也是创业者,或者未来想要成为创业者,这期满满创业者一线视角的分享,可千万别错过!Enjoy! 嘉宾介绍 * Jeremy Huang, Co-founder & CTO @Daloopa, ex-Software engineer @Meta, Airbnb * OnBoard! 主持:Monica:美元VC投资人,前 AWS 硅谷团队+ AI 创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学 我们都聊了什么 01:30 Jeremy 的自我介绍,如何开始创业旅程,一开始如何尝试不同的创业方向 07:22 Jeremy 从 Airbnb 的经验中学到什么,为什么不需要写代码就可以验证 PMF 14:32 如果你自己就是“目标用户”,你还需要做用户访谈吗? 29:02 如何从潜在用户访谈中找到“对的” idea? 35:02 Daloopa 早期如何设计 MVP 并找到种子用户 41:13 对于一个准确度要求很高的AI产品,如何设计产品的 Human-in-the-loop 交互? 49:19 如何应对早期大客户的定制化要求? 54:01 为什么 founder-led-sales 是了解市场规模的最好方式 59:01 面对金融行业的销售流程是怎样的?创业公司如何切入?Product-led-growth (PLG) 方式管用吗?如何从0到1开始打造销售团队? 73:59 为什么CTO也需要每天8小时跟客户交流? 82:25 为什么要打造全球 remote 团队?如何管理全球化团队? 89:06 LLM 对于 Daloopa 的产品带来怎样的机会和挑战?对金融行业有什么影响? 108:59 早期融资遇到哪些挑战?对初次融资的创业者有什么建议? 114:53 快问快答:推荐的书籍,第一次校园创业,LLM的未来1年和未来3年展望 参考文章 * mp.weixin.qq.com [https://mp.weixin.qq.com/s/C3Wp-ot2S_lX_BcT9z9DdQ] * daloopa.com [https://daloopa.com/blog/how-daloopa-is-transforming-fundamental-data-for-equity-analysts] * www.prnewswire.com [https://www.prnewswire.com/news-releases/daloopa-closes-20m-series-a-to-automate-data-extraction-for-financial-institutions-301334158.html] * daloopa.com [https://daloopa.com/blog/press-release-daloopa-raises-series-b-funding-round-led-by-touring-capital-with-participation-from-morgan-stanley-and-nexus-venture-partners] * daloopa.com [https://daloopa.com/blog/ceo-note-what-daloopa-does] * daloopa.com [https://daloopa.com/blog/ceo-note-daloopa-started-with-a-phone-call] 欢迎关注M小姐的微信公众号,了解更多中美软件、AI与创业投资的干货内容!M小姐研习录 (ID: MissMStudy) 欢迎在评论区留下你的思考,与听友们互动。喜欢 OnBoard! 的话,也可以点击打赏,请我们喝一杯咖啡!如果你用 Apple Podcasts 或者 Spotify 收听,也请给我们一个五星好评,这对我们非常重要。 最后!快来加入Onboard!听友群,结识到高质量的听友们,我们还会组织线下主题聚会,开放实时旁听播客录制,嘉宾互动等新的尝试。添加任意一位小助手微信,onboard666, 或者 Nine_tunes,小助手会拉你进群。期待你来!
EP 66. 深度解读Coding Agent与OpenAI o3:中美Agent 创业者、研究员与投资人眼里的未来
终于来到了OnBoard! 2024 年压轴之作!那必须是绝对深度绝对精彩的一期!年底关于 AI 的新闻太多,但是最值得我们压轴深入探讨的,必须是 coding agent ——即使已经有很多讨论,或许也都还是被低估。 不到两个月的时间,coding agent 产品完成了二连跳式的升级,从IDE 助手 Cursor 到 Replit Agent, Windsurf 为代表的 coding agent,到Devin 的惊艳发布,让我们意识到真正 end-to-end coding agent 的能力已经超过 coding 本身,打开了大模型未来全新的想象空间。 Hello World, who is OnBoard!? 更巧的是,就在我们录制这一期节目的凌晨,就是 OpenAI 12天发布会最后一天,OpenAI o3 横空出世,在编程和数学领域最有挑战的 Benchmark 上超越了绝大部分的人类,也让我们对大语言模型能力天花板的预期再次被刷新。要展望2025年AI领域还会发生什么,coding agent 以及强化学习为新范式的 o3系列,无疑是最核心的问题。 这一期的嘉宾,汇集了国内和硅谷 coding agent 一线创业者、coding 大模型研究员和 AI 投资人,这次长达三个多小时的讨论,在全网恐怕都很少见了,有一线 coding agent 设计解读,还有最新鲜热乎的对 o3 实现难点和未来挑战的拆解,你是不是还不知道,在好几个开源项目里,OpenHands 已经超越人类成为最活跃贡献者了?我们还探讨了: * 为什么说 Devin 展示了“完成工作”的 scaling law? * 最早引领 coding agent 潮流的 Replit Agent,以及开源 Devin 项目 - Openhands, 是设计中有哪些关键决策? * Coding agent 未来是 Devin 形态赢家通吃吗? * 底层模型能力之外,coding agent 应用公司的核心能力和壁垒是什么? * Coding Agent 对于工程师和未来的组织和社会,会有哪些深远影响? * 如何看待 o3 超越大部分人类的能力?未来的发展空间在哪里? 理解这次内容需要一些背景知识,非常强烈推荐大家去复习Onboard! EP 62. 与Google deepmind 研究员对o1的讨论,以及EP 53 对coding agent 的第一次探讨,其中一位嘉宾姚顺雨,作为 SWE bench 的提出人,已经加入OpenAI 负责 agent方向的研究。 未来已来,不论你是否已经感知到,这3个小时,绝对值得你的时间。 感谢大家这一年以来的支持,如果喜欢我们的内容,今年最后有机会在小宇宙里面打赏,在Apple podcast, spotify 里面给五星好评啦!我们明年见!Enjoy! 嘉宾介绍 * Yusen Dai,真格基金管理合伙人,聚美优品联合创始人。 * Zhen Li, Replit Agent 核心成员,Replit 资深工程师,ex-字节,Google. * Xingyao Wang, Allhands AI (开源项目 OpenHands) co-founder & Chief AI Officer, UIUC PhD. * Binyuan Hui, 阿里巴巴通义实验室科学家 * Cohost: Peak, 真格基金EIR,前猛犸浏览器创始人 * OnBoard! 主持:Monica:美元VC投资人,前 AWS 硅谷团队+ AI 创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学 我们都聊了什么 * 04:06 嘉宾自我介绍,最近用 coding agent 实现的有意思的任务 * 15:17 投资人视角下,Coding agent 发展历程中的核心节点,为什么说 scale of work 是最令人兴奋的机会 * 22:03 Replit Agent 诞生的历程,发展过程中的关键节点,从1-10 有什么计划 * 36:04 如何看待与Devin 的竞争?未来不同 coding agent 产品形态会融合吗? * 39:01 OpenHands/All hands AI 不同寻常的诞生故事,打造开源 coding agent 的重要技术和商业决策? * 41:48 Openhands 的架构设计,与Devin 的异同意味着什么? * 49:24 Coding agent 与 Anthropic Computer Use 之间的关系? * 54:35 OpenHands 产品发布以来,社区的主要反馈和重要变化?开源有什么作用? * 1:04:40 Coding agent 产品的长期竞争力是什么? * 1:09:20 o3 最让人印象深刻的是什么?对 coding 和AGI 未来有什么影响? * 1:20:08 解决真实世界的复杂问题,o3 之后还需要什么? * 1:24:33 SWE bench 被“刷爆”之后,下一个有意义的 benchmark 是什么? * 1:36:27 Coding agent 领域今年还出现了哪些重要变化? * 101:33 未来需要怎样的工程师和怎样的组织? * 1:58:07 如何进一步提高模型 planning 的能力?完成多步骤任务能力如何实现? * 2:07:45 Agent 的普及会带来哪些底层技术栈和工具的新机会? * 2:17:25 投资人如何看待 AI agent 的价值和投资机会?未来中国 coding agent 的机会是怎样的? * 2:25:55 快问快答:未来1年和3年对AI的期望,coding agent 翻车的例子,AI被高估和低估的能力 我们提到的公司和重点词汇 * Cursor * Cognition labs/Devin * Replit * Replit Agent * OpenHands, github.com [https://github.com/All-Hands-AI/OpenHands]; OpenHands 论文: arxiv.org [https://arxiv.org/abs/2407.16741] * VisualWebArena: arxiv.org [https://arxiv.org/abs/2401.13649] * TheAgentCompany: 官网 the-agent-company.com [https://the-agent-company.com/],paper arxiv.org [https://arxiv.org/abs/2412.14161] * OpenAI o3 * OpenAI o1 * Anthropic * Computer use by Anthropic * SWE bench * Windsurf * Bolt.new 参考文章 * 刚体验了一小时 Devin,这是我第一次见到真正意义上的 A - 即刻App [https://m.okjike.com/originalPosts/6759369e0ebeb9cd3daf2169?s=eyJ1IjoiNWIzOGNjNGU1NGVhOGUwMDE3ZjVhNWY1IiwiZCI6MX0%3D&utm_source=wechat_session] * Devin和Agent Cursor使用体验对比 [https://yage.ai/devin-vs-agent-cursor.html] * www.latent.space [https://www.latent.space/p/bolt] * Our Problems | Cursor - The AI Code Editor [https://www.cursor.com/blog/problems-2023] * More Problems | Cursor - The AI Code Editor [https://www.cursor.com/blog/problems-2024] * www.cognition.ai [https://www.cognition.ai/blog/introducing-devin] 欢迎关注M小姐的微信公众号,了解更多中美软件、AI与创业投资的干货内容! M小姐研习录 (ID: MissMStudy) 喜欢 OnBoard! 的话,也可以点击打赏,请我们喝一杯咖啡!如果你用 Apple Podcasts 收听,也请给我们一个五星好评,这对我们非常重要。 最后!快来加入Onboard!听友群,结识到高质量的听友们,我们还会组织线下主题聚会,开放实时旁听播客录制,嘉宾互动等新的尝试。添加任意一位小助手微信,onboard666, 或者 Nine_tunes,小助手会拉你进群。期待你来!
EP 55. 对话UCSD副教授苏昊:从学术到创业,深度解读具身智能的实现路径
这次依旧是硬核话题,我们跟学术大牛深度聊聊2024年上半年美国创投圈最火的的话题之一,具身智能。 没错,智能机器人之火终于从国内来到美国了。在去年下半年的时候,美国创投界还是在关注大模型和应用、infra等等,虽然Deepmind RT-2 等工作彼时已经崭露头角,更喜欢软件的美国VC似乎还在犹豫机器人这个太硬的赛道。但是从今年上半年开始,事情似乎有了变化。 Hello World, who is OnBoard!? 除了Figure AI 这样的人形机器人公司获得了英伟达、微软等一系列战投的加持,硅谷的老牌基金们也疯狂涌入了所谓的机器人大模型公司,比如学术大牛创立的 Physical intelligence, Skild, 还有 Cruise 前CEO 创立的Bot company, 等等。 这次的嘉宾也是大名鼎鼎,UCSD 计算机科学副教授,苏昊老师,关注具身智能和3D视觉领域的同学应该都不陌生。他参与的一系列AI数据集和软件工作,从ImageNet到ShapeNet、PointNet、SAPIEN,以及最近的ManiSkill等等,都是三维视觉、机器人操作等领域穿越几个时代的标志性作品。 苏昊老师现在还是智能机器人创业公司Hillbot 的联合创始人,我们深度探讨了: * 过去一年,我们从学术界、工业界讨论的种种话题,又有了哪些新的进展? * 大模型的发展如何影响具身智能的不同技术路径? * 大模型带来的泛化能力,跟硬件、控制系统等,又会怎样相互作用? * 机器人模型里的数据问题,有哪些解决方案? 具身智能这个看似很纷繁的话题,苏昊老师总是能抽丝剥茧,相信你们也能从我们两个多小时的交流中,受益匪浅。Enjoy! 对了!今年年初,Onboard 就发布过一期关于具身智能的讨论,嘉宾包括了 Deepmind Robotics,高仙机器人和UCSD 的不同视角的重磅嘉宾。那一期讨论也非常精彩,建议大家回去复习哈! 嘉宾介绍 * 苏昊 [https://cseweb.ucsd.edu/~haosu/'] (Twitter @HaoSuLabUCSD [https://x.com/HaoSuLabUCSD]),UC San Diego Associate Professor,Hillbot智能机器人初创公司创始人、CTO。Stanford PhD, UCSD 具身智能实验室主任,数据科学研究所创始成员,以及视觉计算中心和情境机器人研究所成员。他的研究工作集中在开发算法来模拟、理解并与物理世界互动。 * OnBoard! 主持:Monica, 美元VC投资人,前 AWS 硅谷团队+ AI 创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学 我们都聊了什么 * 03:04 苏昊的学术历程,为什么最近觉得有关证明的研究进展对机器人领域很有启发? * 10:05 从智能演化的角度,理解“具身智能”这个“老概念” * 15:01 为什么从语言而不是视觉上最先看到了接近人类的智能? * 21:31 实现具身智能有哪些主流的路线?如何理解不同路径不同切入点背后的逻辑? * 32:10 可以通过大模型的能力实现运动控制吗?有泛化性的控制数据要怎么采集? * 38:26 演示学习 (learning from demonstration) 有哪些不同路径?ALOHA这类遥操作有什么利弊? * 47:00 规划和执行需要一起做训练吗?做一个端到端的系统核心难点在哪里? * 51:15 划重点:好的算法的本质就是降低对数据的需求 * 52:23 针对机器人的大模型会跟LLM架构有什么异同? * 59:31 人形机器人可以解决数据和能力泛化的问题吗? * 66:16 模拟器能解决训练数据的问题吗?近年来模拟器相关技术有什么关键进展? * 78:31 AI生成3D,Sora 等新技术进展对实现 sim2real 路径有什么影响? * 95:26 苏昊老师现在的创业项目 Hillbot * 100:32 快问快答:推荐的书,影响最大的人,具身智能被高估和低估的话题,如何解压! 重点词汇和公司 * Boston Dynamics * PI (Physical Intelligence) * OpenAI DALL-E 3 [https://openai.com/index/dall-e-3/] * SAPIEN: A SimulAted Part-based Interactive ENvironment [https://sapien.ucsd.edu/] * ManiSkill [https://maniskill.readthedocs.io/en/latest/]: a powerful unified framework for robot simulation and training powered by SAPIEN. * Google Deepmind RT-1 [https://research.google/blog/rt-1-robotics-transformer-for-real-world-control-at-scale/]: Robotics Transformer for real-world control at scale * Google Deepmind RT-2 [https://deepmind.google/discover/blog/rt-2-new-model-translates-vision-and-language-into-action/]: New model translates vision and language into action, Paper [https://robotics-transformer2.github.io/assets/rt2.pdf] * Google Deepmind Open X-Embodiment [https://deepmind.google/discover/blog/scaling-up-learning-across-many-different-robot-types/]: Robotic Learning Datasets and RT-X Models, Paper [https://arxiv.org/abs/2310.08864] * ALOHA [https://tonyzhaozh.github.io/aloha/]: A Low-cost Open-source Hardware System for Bimanual Teleoperation * Mobile ALOHA [https://mobile-aloha.github.io/]: a low-cost and whole-body teleoperation system for data collection. * Behavior Colony:行为克隆 * Learning from Demonstration:示范学习 * Meta AI Habitat [https://research.facebook.com/publications/habitat-a-platform-for-embodied-ai-research/]: A Platform for Embodied AI Research * AI2 [https://allenai.org/]: The Allen Institute for Artificial Intelligence * Segment Anything Model (SAM) [https://segment-anything.com/]: a new AI model from Meta AI that can "cut out" any object, in any image, with a single click * robot-VILA [https://robot-vila.github.io/]: Look Before You Leap: Unveiling the Power of GPT-4V in Robotic Vision-Language Planning * CoPa [https://copa-2024.github.io/]: General Robotic Manipulation through Spatial Constraints of Parts with Foundational Model * ImageNet: image database organized according to the WordNet hierarchy [https://image-net.org/index.php] * EP 44.【AI年终特辑3】具身智能深度对话:从学术到产业,机器人的ChatGPT时刻来了吗? - OnBoard! | 小宇宙 [https://www.xiaoyuzhoufm.com/episode/658ea058bf3589e8946b19d0] * Debate: Is Scaling Enough to Deploy General Purpose Robots @CoRL2023 [https://www.youtube.com/watch?v=pGjzxdD2Sa4] * 解密机器人大模型RFM-1:Covariant创始人陈曦专访 [https://mp.weixin.qq.com/s/IFxGDZ0e2ra0rqDyOgyBMg] * 对话高阳:具身大模型框架ViLa+CoPa [https://mp.weixin.qq.com/s/XwQcXQ6jlxEFCUROJ6QJ1w] 参考文章欢迎关注M小姐的微信公众号,了解更多中美软件、AI与创业投资的干货内容! M小姐研习录 (ID: MissMStudy) 欢迎在评论区留下你的思考,与听友们互动。如果你用 Apple Podcasts 收听,也请给我们一个五星好评,这对我们非常重要。 最后!快来加入Onboard!听友群,结识到高质量的听友们,我们还会组织线下主题聚会,开放实时旁听播客录制,嘉宾互动等新的尝试。添加任意一位小助手微信,onboard666, 或者 Nine_tunes,小助手会拉你进群。期待你来!
Elige tu suscripción
Más populares
Premium
20 horas de audiolibros
Podcasts solo en Podimo
Disfruta los shows de Podimo sin anuncios
Cancela cuando quieras
Empieza 7 días de prueba
Después $99 / mes
Empieza 7 días de prueba. $99 / mes después de la prueba. Cancela cuando quieras.