banner
图片
工程业绩
新闻资讯
工程业绩

首页 > 工程业绩

对话星海图联创许华哲:具身智能风口有些泡沫化无大碍

时间:2025-04-04 17:18:09     来源: wwwkaiyun.com

                                                                                            

  星海图联合发起人许华哲认为具身智能赛道虽有泡沫,但相比元宇宙泡沫化要好,因为具身智能拥有扎实的硬件基础。

  2.许华哲表示,融资能力强且能够产出实际成果的公司更能穿越周期,迎来下一轮市场的热情高涨。

  3.除此之外,星海图计划在北京和苏州两地布局,苏州负责机器人本体的研发生产基地,北京则专注于具身AI研究。

  4.目前,星海图已融资近1亿美元,蚂蚁集团先后两次领投,公司将继续加大研发投入。

  当人形机器人的热度在春节后迈上另一个台阶,认为赛道出现泡沫化、同质化的质疑声也浮出水面。

  “大家非常担心,一哄而上以后,会不会像中国很多的产业一样,又是一地鸡毛。我觉得这点根本不需要过多的担心,一定是一地鸡毛。”博鳌亚洲论坛2025年年会一场分论坛上,民建中央经济委员会副主任马光远直言,产业发展不可能没代价、不走弯路,但只要机器人的火热本身符合产业规律,“这个火应该烧一下”。

  “具身智能泡沫化总比元宇宙泡沫化好。”3月27日,星海图联合创始人许华哲接受南都记者正常采访时说,具身智能有着扎实、有用的硬件基础,出现一些泡沫并无大碍,不会像一些风口那样,泡沫破裂后无法沉淀下任何实质性的成果。他认为,融资能力强且能够产出实际成果的公司,更能穿越周期,并迎来下一轮市场的热情高涨。

  星海图是一家2023年9月成立的具身智能企业,四位联合发起人中,除了许华哲只在清华大学交叉信息研究院任教以外,高继扬、赵行、李天威三位均有在无人驾驶公司从业的经历。

  2月下旬,星海图宣布完成3亿块钱的A轮融资。这是星海图一年时间内的第四笔融资,累计融资近1亿美元,蚂蚁集团先后两次领投。

  星海图是许华哲创业的第一站。采访中,许华哲既谈到了星海图自身的业务布局、技术路线,还从行业角度分享了他对跨界玩家入局具身智能、初创公司拼量产、融资热度等话题的看法。

  记者:入局人形的玩家类型慢慢的变多,除了车企蔚然成风,还有传统的工业机器人公司、家电企业乃至vivo这样的手机生产厂商。您如何看这一些企业跨界下场做人形机器人?初创公司会感受到压力吗?

  许华哲:以车企来说,现在电动汽车赛道已经很拥挤了,我觉得“巨头”都在寻找自己的增长点。制造业下一个能升级的点是什么呢?大家自然会想到机器人,尤其是如今火热的具身智能机器人。从用途来说,具身机器人既能在车厂里打工,又能和家电做设备串联,还可以跟手机去结合,扮演移动的大脑和身体。所以跨界玩家拥有很强的动机。

  对创业公司来说肯定是有好有坏了。好处是我们有了更多玩伴,可以共同完成一些事情。比如,我们不可能自己制造MR(混合现实)设备,但像vivo,将MR作为机器人技术布局的一环,说明我们未来可能不用去花3万块钱买苹果的Vision Pro,而是跟具身智能赛道上的伙伴一起去做。

  跨界玩家增多,说明具身智能赛道在变好。大家都比较相信这条赛道有未来、有前景,能做出东西。越多人涌入,赛道相应地发展越快,整体来说利好行业。

  当然,挑战也很多。创业小公司如何部署战略,其实是挺难的话题。因为初创公司的资源肯定不如人家多,“巨头”随手就能拿出我们融到的钱。

  如何应对?首先是要坚定。当看准一件事,立刻行动和迭代,去占领用户心智,或者抢占应用场景。做事坚决,是初创公司的一个优势。大厂很多时候比较犹豫,害怕错过机遇,但又不希望在没看清之前就立刻跳进去,这给了我们生存的宝贵时间。虽然一些大厂在公开场合说要重磅投入,但私底下并不像我们从始至终做机器人或者做具身智能的人,有一种信仰在。信仰的力量听起来很虚,但其实很重要。比如,OpenAI的GhatGPT能成,也是有一群人坚信遵循scaling law(规模定律)可以把大模型做出来。因为相信,所以坚持。

  初创公司另外需要做的,就是在技术还没有成熟之前,从始至终保持先进性。这是因为,当前阶段,钱重要的同时,市场上还特别难找到能把具身智能这件事做成的人,全国最多可能只有20个人能把VLA(视觉-语言-动作模型)训出来,这给了勇于探索商业模式的公司尽可能拉长技术领先时间的可能性。一旦后面技术成熟,只要花钱就能找到能做具身智能的人,此时,钱就变得更加重要。很显然,大手笔花钱不是勇于探索商业模式的公司的强项。

  创业公司能做的第三件事是尽快量产。就像造新能源车那样,当量产的拐点到来之后,就很难再融入到游戏之中了。所以,初创公司要尽快地跟别的玩家一起达到拐点,或者率先达到拐点。

  记者:作为蚂蚁集团的被司,你们怎么看蚂蚁前段时间下场自研人形机器人?

  许华哲:蚂蚁本身是一家科技公司,本来就该做这种新技术,没太多可惊讶的。星海图也在和蚂蚁灵波科技公司合作,瞄准“无人后厨”的场景。在算法上,双方有一些分工;本体层面,则以星海图的机器人作为载体。

  记者:你前面提到vivo机器人技术栈布局中的MR,星海图后续也会就此和vivo合作吗?

  许华哲:昨天(3月26日)跟(vivo执行副总裁胡柏山)交流了解到,vivo后续会在机器人业务上大力投入,而且他们更着重机器人的“眼睛”和“大脑”部分。vivo虽然没有排除自己做硬件,但短期内可能还没有下决心去造机器人硬件,先看看产业链上有没有合作伙伴可以一起把机器人业务做起来。vivo这次邀请我来参加博鳌论坛的一场分论坛,也是希望讨论未来合作的机会。

  3月27日,清华大学交叉信息研究院助理教授、星海图联合创始人许华哲参加vivo主办的博鳌亚洲论坛2025年年会“促进经济复苏:科技公司的机会与挑战”分论坛。图:杨柳

  许华哲:很难给出一个具体的数字,也许是一个企业年产10万台,但这也许都是不负责任的猜测。

  记者:今年又被称为人形机器人的“量产元年”,不少公司最近也宣布了下线交付进展。这个速度是否有超出您此前的预期?

  许华哲:不会。当你真正投入到硬件开发中,会发现它并不像想象中的那么困难。这更多地是需要清晰地梳理每一个链条,确保每个部分都研发完善,然后将它们拼接整合在一起的过程。所以,量产这件事儿的到来,技术上本身就应该实现的。其次,外界对人形机器人的热情也起到一定催化作用,实现更多的量产。

  记者:量产交付过程中,一些企业掀起低价报价潮,比如最近松延动力给出3.99万的起售价。这是一种降本的良性竞争,还是落地“价格战”的“内卷”范畴?

  许华哲:倒不觉得是卷价格的恶性竞争,只是一种营销手段,在公司早期打响自己的品牌。宇树G1机器人的9.9万元只是起售价,真正卖给实验室,还得三十多万。如果线万元的价格就把所有东西卖给别人,那这就是“价格战”了。而且,无论是宇树G1,还是松延动力3.99万元的人形机器人N2,身材都比较矮小(G1身高1.3米、N2身高1.2米),价格自然可以报得较低。

  记者:虽然量产拐点没到,但做人形机器人本体的公司已相当之多了。你认为现在还是入局做本体的好时机吗?

  许华哲:如果只是做硬件,当下入局也并非完全不可行。硬件不像软件那么高科技,依靠供应链,就能做出硬件。但能否加入做“整机+具身智能”,在大多数情况下要打个问号。现在入局也不算晚,但肯定不是最好的那个时间档口了。

  记者:初创公司的路线也有分化,有的专注于硬件,有的只做具身智能模型。但前段时间,包括Figure AI和智元称,机器人公司要垂直整合硬件、AI和制造。你是否认同这一观点?

  许华哲:“整机+智能”目前来看确实是比较优的模式。原因是,类似于互联网,入口对具身智能产业也很重要。入口在谁的手里谁就比较舒服。有了机器人整机,才有数据入口。谁拿到数据,谁就能造出更好的模型,更好的模型又给用户所带来更好的体验。纯粹做具身智能模型的公司只能从别人手中购买入口。

  如果你的软件真的特别好,是世界独一档的,那很有一定的概率会出现所有硬件供应商都求着跟你合作。比如美国具身智能公司Physical Intelligence就想走这条路,用AI去赋能所有的硬件公司。

  但我觉得在中国不是很适合做这件事儿。中国有硬件制造优势,机器人厂商为啥不直接把这部分也做了呢?另外,供应链上的玩家可能没有想象中那么愿意把硬件分享给你,倾向于自己做具身模型。基于这样的判断,星海图同时做AI和整机。

  许华哲:百分之八九十。可能唯一不自研的是芯片,芯片还是外采自英伟达或者是国产芯片。公司早期在电机零部件方面依赖一些供应商,但现在也开始做特殊的比例的自研。

  记者:星海图创业时,你和高继扬、赵行、李天威三位联创是如何凑成一个团队的?

  许华哲:继扬是我在清华电子系的师兄,比我高一级。和继扬在本科的时候有过几面之缘,不算很熟悉。赵行是我在清华交叉信息研究院的同事。后面一起聊下场创业,也是通过赵行和其他几位联创结识。聊完以后一拍即合,觉得风来了。

  记者:不少像星海图这样的具身智能初创公司的创始团队,都有学院派背景。但外界对学院派背景的创企有一种担心认为,可能会过于坚持自己的路线,而不愿适应行业技术路线的风向转变。这种说法是否成立?

  许华哲:有一些道理,但星海图显然不是这样的风格。学术圈有一种风气,就是说做一个研究,要一直做下去,哪怕从热门变成了冷门,也要接着做。也许再熬过一个周期,又重新变成热门。但在创业上,可能逻辑不完全是这样。商业上是关乎生死存亡的,而且创业者的责任比单纯的研究者大得多,毕竟公司还有那么多员工。

  我们首先坚定地相信我们是正确的,但如果有充分的理由论证我们犯错了,会立刻调转船头,去做最正确的事情。这种灵活性也是创业公司的优势。

  许华哲:这跟每个企业的风格有关。除了我以外,星海图的其他三位联创都有过无人驾驶行业穿越周期的经验。他们看到当风口遇冷,很多明星公司立刻就倒下。所以,我们在“广积粮”的同时,不会大手大脚地花钱,不会立刻把摊子铺得很大。这是一种底线思维,是为了穿越周期,随时准备过冬。

  另外,我们觉得好的创新一般都不是大团队做出来的,DeepSeek便是很好的证明。大团队的优势在工程化。随着人员规模的增加,沟通成本也在增加,会阻碍创新的锐度。所以我们有意地控制规模,只招精锐的人,不要盲目地去扩充一些中庸的人,这反而会拖慢节奏。但未来如果量产,肯定是要扩充人员规模的。

  记者:智元这类刚成立两年的公司,迅速将规模铺得这么大,你从业内人士角度如何看这种打法?

  许华哲:就我了解,智元采取的是生态打法。智元迅速成为一个大公司,同时孵化其他勇于探索商业模式的公司,建立起自己的产业生态。智元就像是一艘航母,其他孵化出的公司是航母战斗群的一部分。说实话,这样的做法不像是一家传统勇于探索商业模式的公司。我们不会一开始就向下游布局。

  许华哲:融资市场上,有的投资机构喜欢技术强的,有的喜欢资源强的,还有一些喜欢投规模大的。规模大的看起来最稳,对融资肯定有一些帮助。但就我们而言,融资只是把事做成的条件,而不是我们要做成的那件事。

  记者:很多初创公司都在发布VLA模型的演示视频。业内人士能看出哪些门道?

  许华哲:VLA是这轮具身智能技术突破的一个看点,为了融资和曝光度,许多公司都宣称自己是做的VLA。如果在这样的领域待一阵子,你就学会看这些视频是面向哪些受众的。一些厂商的视频面向大众,因为经过了充分的剪辑,像拍大片一样,视觉效果上很有科技感。但业内真正想看的,是一镜到底地演示机器人如何完成一项任务。

  真正的VLA,一定要具有长序列的动作执行能力、语言指令的跟随能力等,灵巧型和泛化性比较高。

  许华哲:投资人是一个巨大的群体,里面有很聪明的,也有很有钱的。很聪明的那一类中,有的是会认真去读技术论文,跟一线的技术从业者做访谈,梳理各种技术细节。这样的人你是骗不过的,他们了解什么东西该看,啥东西是假的。有些投资人对技术本身没那么关注,但对具身智能赛道非常有热情,获取信息主要靠打听,常常掌握的是二手乃至三手的消息。

  记者:春节后宇树、众擎等初创公司频繁发布机器人炫技视频,你们的投资人会因此施加压力吗?

  许华哲:其实不会。因我们的投资人都被我们充分“教育”过了,他们了解这是两套技术。机器人的手部操作(manipulation)能力,主要靠模仿学习、VLA去完成,可能还会再借助强化学习等手段。但机器人腿部的移动(locomotion)能力,采用强化学习加仿真的路线即可完成。

  走路、跳舞、跑步这些事儿,对机器人的精度要求低,只要能保持平衡就行。而且,这些腿部动作能力相对而言易于在仿真环境下模拟。如果让机器人去抓取一瓶水,一旦产生几毫米的误差,机器人的手就没办法完成抓取。这样的一个过程是十分艰难的。所以你会看到,即便是Figure AI的机器人,在将物品放入冰箱都哆哆嗦嗦。其最终的原因在于,操作本身是难于locomotion的。

  记者:既然技术侧重点不同,那宇树这类路线下的机器人能适配当下哪些应用场景?

  许华哲:现在不排除人形机器人的最大价值就是提供情绪价值,比如给4S店做导购、在商场跳舞等等。这些其实是短期热情带来的,长期可能未必就一直喜欢机器人去干这个事儿。再往后,做manipulation一定是各家的必选项,否则意味着机器人不具有劳动能力。

  记者:研发VLA需要数据,数据又是当前一大瓶颈。星海图的数据来源有哪些?有没有自建数据采集工厂的计划?

  许华哲:个人会使用市面上的开源数据,以及自采的数据。目前在星海图北京办公点有几位采集员,也在苏州建了一座数采工厂,场地和机器人已经准备就绪,采集人员也正在逐步到位。

  许华哲:目前已经累计了1000小时的可用数据,今年内可能达到几万小时的数据量。预计今年在苏州数采工厂配置50位采集员,以及对应的50台机器人。

  许华哲:仿真数据能够更好的起到增广的效果(data augmentation,在现有数据基础上去做增强、扩充、调整)。仿真数据少用有效、多用有毒。由于仿真平台与现实环境之间有差异,如果模型主要是基于仿真数据来进行学习,有几率会使机器人在实际应用中表现不佳。在光影、视觉层面可以大量用仿真数据,但物理层面一定要以现实真机采集的数据为主。

  许华哲:银河通用一直在做pick和place(抓、放)层面的事情。合成数据在训练抓放能力上某些特定的程度上具备可行性,但丢失了更大的视角——我希望机器人做的远远不止pick和place。用“搓盘子”这一操作为例,当盘子摆放成一摞,若机器人要把最上面的盘子拿起来,仅仅通过pick是做不到的,因为盘子底下被挡住,机器人的手搓不进去。盘子底下复杂的摩擦力,很难在仿真环境下模拟。所以,我认为银河通用的路线侧重于短期应用。

  许华哲:宏观来讲就是操作能力。微观层面,则是用于客户的几个场景。比如在车厂搬运箱子,在和海尔合作的厨房场景做展示营销。

  记者:很多公司都说让人形机器人到车厂搬运箱子,你们会感受到同行的竞争吗?

  许华哲:目前不会,机器人能力没那么强,大家都还停留于做POC(概念验证)的阶段,不存在开始挤占市场占有率的情况。只有当机器人能够真正投入到正常的使用中,才会出现争夺客户的局面。

  许华哲:苏州是机器人本体的研发生产基地,今年还会在苏州建造一个生产线工厂。希望工厂具备万台产能的水准,但不是说实际生产万台。北京的注册地在亦庄,是因为首钢基金投了我们,相当于被引进到亦庄。但北京的办公室目前仍在海淀,一方面我和赵行在清华教书,同时也便于吸引海淀高校的实习生。实习生的产出,甚至不低于在业界有两三年工作经验的员工的产出。后续,海淀的办公室继续保留,专注于具身AI的研究。也会在亦庄建造一个更大规模的办公室,用于研发双足人形机器人等硬件。

  记者:今年年初,人形机器人的热度愈发高涨之后,你们在融资上感受到的水温和去年相比有何变化?

  许华哲:体感上,融资变容易了很多。去年,投资人的心态可能是有兴趣投资,但要进一步考虑。然而,今年他们的心态已经变成FOMO(Fear of Missing Out,害怕错过),更倾向于迅速达成一致,抓紧机会投资。

  许华哲:在股权稀释没那么夸张的情况下,融资肯定是多多益善。当然也有前期融资太猛,后期融不动的情况。

  人形机器人公司的成本主要出在人力和算力两个方面。机器人的制造成本可以从订单出售中得到回血,唯一在白白烧钱、短期内没有收益的就是人力成本,以及训练具身模型所耗费的算力、显卡。如果按照这两方面成本计算,融到1亿美元会是一个小的门槛。

  记者:热度高涨的同时,近期也有不少文章发出警惕泡沫的声音。你认为,人形机器人赛道现在有泡沫化现象吗?如何正确看待?

  许华哲:具身智能泡沫化总比元宇宙泡沫化好吧!因为具身智能有着扎实、有用的硬件基础,有一些泡沫并无大碍。包括互联网早期也有很大的泡沫,当泡沫破碎,沉淀下来的公司都活下来了,谷歌就是其一。而不会像一些风口那样,泡沫破裂后什么实质性的成果都没有留下。加之当下特别难找到其他能媲美具身智能的新兴赛道,于是大家纷纷涌入进来,这势必会造成泡沫。

  记者:泡沫什么时间会第一次破碎?有投资人近期交流时就认为,“淘汰赛”大概1-2年后就会开启。

  许华哲:有些公司表面上对人形机器人表现出了极大的兴趣并投身其中,但实际上造出来的机器人并不好用,或者声称专注于具身智能技术,却没办法实现任何真正的智能化功能。如果这类公司在融资方面也没有显著的表现,那么它们很可能面临被市场淘汰的命运,要么被其他公司吸收合并,要么破产消失。而沉淀下来的优秀人才会逐渐向头部公司集聚,因为公司不好不代表人不好。那些融资较多且能够实际产出成果的公司,或许更能穿越周期,并迎来下一轮市场的热情高涨。

  如果让我预测,觉得应该是2到3年迎来“淘汰赛”。我认为今年会持续看到许多既有趣又能提振信心的成果出现,但这样的发展速度不会一直持续。后续遇到瓶颈停滞不前时,就需要大家共同攻克。

                                                                                                                                                                                        
上一篇:2025年 “六大困惑”困扰轮胎产业踌躇前行 下一篇:维基媒体基金会:人工智能爬虫导致维基共享资源带宽需求激增 50%
IKREQ1thCyfu9mwbA8iscnLX4HdCsC+DDTV2G6gClYk50PTv6hubtVbDJPB5/FnZM6Hiq4ndLfiYBp3F+xbQgVwYwLdW+HegW+PRAPenEp2EaGUGTOTnB8HEaYOb1Sv816HqM9O0ySdP2hKEsi/Jkw==