鳣痯往吇新闻网
建立于2023年5月的银河通用近日迎来了两周岁华诞,这家年青的企业于人形机器人赛道快速崛起。在3月底召开的2025中关村服装论坛t.vhao.net年会上,银河通器具身大模子机器人Galbot G1为观众取送了数千杯咖啡,任务乐成率达到99.97%,成为名没有虚传的现实临盆力。银河通用何故锋芒毕露?创始人王鹤的学术配景常被视作枢纽,除了企业家身份,他还是北京大学前沿较量争论研讨中心助理教授及博士生导师、北大—银河通器具身智能联合实行室主任,以及北京智源人工智能研讨院具身智能研讨中心主任。从肯定程度上讲,创始团队扎实的学术履历让银河通用在技术路径挑选上越发刚强。银河通用以为,没有论人形机器人的存量有无达到主动驾驶范畴百万级设备的范围,“ 仿真合成数据”的技术门路都是长期可行且具性价比优势的。在应用层面,银河通用走务虚门路,目标是推动具身智能机器人在多类场景中真正“动起来,干起来”。
以小补大
有关数据中,谷歌的一个项目常被拿来举例,16人的团队泯灭约17个月,投入百万甚至千万美元,仅采集到23万条真实交互数据。而一旦机器人被迁移到新的房间或场景,其模子并没有事情,必要重新采集数据。在王鹤看来,这种“场景迁移即重修”的价值是难以接受的。
展开剩余 86 %创立之初,银河通用便坚持以合成数据驱动具身智能训练的技术门路。“当人形机器人的存量尚未达到主动驾驶范畴百万级设备的范围时,依赖海量真实数据训练没有仅成本高昂,而且周期冗长,极大限制了大模子的训练效率与场景顺应本领”,王鹤说。
这是银河通用构建自研仿真数据天生管线的原因,“能够以极低的边际成本批量天生高度多样化的合成数据,用于大模子的预训练阶段。这部份数据约占全部训练数据的99%甚至更高,支撑起模子的泛化本领”,银河通用市场部相关担任人武文韬向北京商报记者表明。
在模子后训练阶段,银河通用会针对特定任务需求,采集少量真机数据进行快速对齐。武文韬举例,“在零售场景中若必要机器人理解‘按顺序抓取矿泉水’,我们只需采集一人一天即可完成的数据量,便能完成模子的高效微调。这种‘以小补大’的方式极大提升了训练效率与场景顺应性”。
没有止银河通用,其他人形机器人公司也在考虑数据淹没成本、数据采集的范围。全球范围内的人形机器人企业和研讨机构都在探索具身智能的最优训练路径,目前还没有形成一致的标准谜底。
在路径未收敛的当下,银河通用的想法没有变,“即便将来人形机器人出货量达到百万级别,我们依然以为‘合成预训练 + 真机对齐’的策略是长期可行且具性价比优势的。因为纵然硬件普及,真实数据的猎取仍旧面对高昂的成本与复杂的组织难度,特别在多样化、高频次更新的真实天下场景中更是如此”,武文韬分享了公司的想法。
以用促研
目前,银河通用已经过一款大模子展现了合成数据的价值——全球首个端到端具身抓取底子大模子 GraspVLA。
GraspVLA由银河通用联合北京智源人工智能研讨院(BAAI)及北京大学和香港大学研讨职员联合公布,训练包罗预训练和后训练两部份。
其中预训练完整基于合成大数据,训练数据达到了有史以来最大的数据体量——十亿帧“视觉—语言—行动”,掌握泛化闭环抓取本领、达成底子模子。预训练后,模子可直接Sim2Real在未见过的、千变万化的真实场景和物体上零样本测试,全球初次全面展现了七大杰出的泛化本领,满足大多数产品的需求。针对特别需求,后训练仅需小样本学习即可迁移底子本领到特定场景,保持高泛化性的同时形成符合产品需求的专业技能。
作为真正意义的端到端具身底子大模子,GraspVLA 展示了无需大范围真实数据、仅经过合成数据达到底子模子的预训练过程,和进一步经过小样本微调使底子“通才”快速成长为指定场景“专家”的本领,定义了VLA(视觉语言行动模子)进展的新范式。
这一范式具有重要意义,打破了天下范围内具身通用机器人当前进展的数据瓶颈和泛化瓶颈。
若是和大模子、挪动互联网相比,以人形机器工资代表的具身智能的进展过程绝对漫长,一个重要原因是具身智能必要软件+硬件合营进展,但这两者的进展并分歧步。
武文韬以为,近两年硬件的进展在已有显著突破,好比市面上的一些人形机器人已具有没有错的运动本领,反而在具身大模子的应用上更具挑衅。
“银河通用一直坚持‘以用促研’的进展路径,以为具身智能的技术突破,最终必须落着实真实场景中的机器人本领体现上。是以,我们在推进GraspVLA等具身智能底子模子研发的同时,也在推效果器人从实行室走向现实天下”。武文韬表示。
· 应用场景剖析 ·
【零售】
任务和场景可通用
真机演示人形机器人自立干活,银河通用在多个国际化场合展示过。
从2024年6月推出Galbot G1算起,7月在2024天下人工智能大会展会现场,Galbot G1经过物体抓取等展示无人值守取货,8月Galbot G1在2024天下机器人大会的两处展位秀“肌肉”,既可抓取物品、搬运料箱,又能在药店理货、在商店取货。别的,Galbot G1还在2024我国国际服务商业交易会、2024 智能机器人与系统国际集会、美国消费电子展CES 2025、2025中关村服装论坛t.vhao.net年会进行过真机演示。
以最近一次参与的2025中关村服装论坛t.vhao.net年会为例,Galbot G1五天为顾客取送咖啡数千次,乐成率超过99.97%,获评官方的“钢铁劳模志愿者”。银河通用与合作伙伴联合公布的“人形机器人智慧药房办理计划”还当选2025中关村服装论坛t.vhao.net年会十大重大科技成果。
以后的4月,银河通用宣告与姑苏市达成计谋合作,计划率先在商业零售、先进制造、适老康养、文化旅游等重点场景推进具身大模子机器人的应用。
谈到这次合作,银河通用产品合伙人傅强告诉北京商报记者,“进展经过与姑苏市的合作,推感人形机器人和具身智能技术在产业中的实际应用,切实办理行业痛点。目前银河通用正推进机器人在商业零售、工业制造等多个范畴的落地事情”。
简单来说,Galbot G1可在分歧的场景下服务,是一款通用人形机器人。
作甚“通用”,傅强向北京商报记者表明,“通用包罗两层含义,第一是任务通用,即机器人能够完成多品种型的任务;第二是场景通用,意味着其能够适用于多种应用场景。通用机器人正是任务与场景双重通用的连系体,具有在分歧环境中执行多样化事情的本领”。
Galbot G1高度173cm、臂展190cm、身体升降65cm、续航时候10小时,可应用于零售、家庭、教育等场景。
将落地百家门店
上述场景下,零售和药店被展示得最多。谈到差同化,傅强向北京商报记者引见,“零售商超是一个狭义的观点,其中包罗药店、方便店、超市等多个子场景,复杂程度也存在差异。相比之下,药店的SKU品种较少、包装形式更加标准,是以被视为较适合率先落地的偏向。正因如此,我们与合作伙伴共同打造了人形机器人参与的‘智慧药房’无人值守办理计划,将来也将渐渐推广到更复杂的商超场景中”。
他还透露,“‘智慧药房’无人值守办理计划,预计将在2025年落地约百家门店,率先在北京、上海、深圳等一线乡村应用落地。部份消费者经过手机购买的商品,其实已经是由机器人在门店完成拣货并托付给外卖骑手,再送达用户手中的”。
以“智慧药房”无人值守办理计划的补货任务为例,面对货架上数十种商品, Galbot G1能够自立分析哪些必要补货,并从货筐中辨认出对应的商品,精准抓取,并放置到货架的对应位置,无论是货架最高层还是底层都可驾御。当有顾客“下单”后, Galbot G1会自立计划路径挪动到物品附近,经过大模子精准辨认、抓取商品,随后平稳送给顾客。银河通用聚焦的是推动具身智能机器人在多类场景中真正“动起来、干起来”。
武文韬也向北京商报记者分享了Galbot G1在多个场景下的事情,“我们的人形机器人已经开始承担车厂料箱搬运、天窗搬运等操纵任务的应用测试,在医疗康养范畴,我们联合宣武病院建立实行室,努力于探索机器人怎样参与到老龄社会的照护支撑中,如认知测试、康健监护等。与此同时,在大众服务和招待场景,我们的人形机器人也开始承担迎宾、讲解、参观指导等任务,提升场所的服务体验”。
对于银河通用而言,存眷的是机器人整性本领的进化,以及它是否真正办理了现实成绩。
· 对话 ·
银河通用创始人王鹤:
智能和硬件轮流成为瓶颈
Q:一个主流观点是具身智能是通往AGI(通用人工智能)的必由之路,影响具身智能进展的瓶颈是什么?
A:我觉得数据是一大瓶颈,这也是学术界近两年激烈讨论的。数据基础上能够分为真实数据和仿真合成数据两大类别,真实数据里有一种是无行动标签的,指的是互联网上的一些视频数据,这种反映真实天下的视频数据在收集上是大量存在的,固然很有效但没有敷。我常举如许一个例子,“你看别人泅水真的学得会吗?”除了这种视频数据,真实数据还包括真实天下采集的数据,真机遥操数据很宝贵也很有价值,然则目前的获得成本很高。
银河通用的一个核心观点是,我们要用大量的合成数据去做预训练,用真机数据做后训练。我以为当人形机器人的存量尚未达到主动驾驶范畴百万级设备的范围时,合成数据是最宝贵的数据资产,我们用99%甚至99.9%的合成数据来推动具身智能的进展,用真实数据走完“末了一公里”,是现阶段最可行的一种方法。
Q:当前具身智能机器人的任务品种和事情量增加,能够实现跨本体、跨场景、跨任务吗?
A:我个人的看法是先沿着能够发生临盆力价值的维度去探索具身智能的泛化,好比抓取、放置,包括在场景中挪动。这几个本领看似很简单,但工厂、超市、零售环境里没有就是拿、放、走的组合?若是这几个技能都能够经过合成大数据和少量的真机数据做到泛化,那么人形机器人就有了临盆力价值。等出货100万台人形机器人时,再去研讨它在更多维度的本领,好比家庭场景的种种任务等,去超过这些技能。末了才是跨本体,因为跨本体意味着每个本体都要有充足的数据。
Q:具身智能是一个长期主义的事情,ChatGPT时候会在什么时候到来?
A:当下全部人形机器人的呼声很高,但往前另有没有短的门路。在这个过程中智能和硬件会彼此促进,在每个时候点彼此轮流成为瓶颈,再轮流被突破。我们以为,这种货架级别的智能在2025年、2026年会迎来全面的突破。突破后,机器人就可以拿所有货架的东西了,能生产10万台以上的轮式人形机器,算没有算ChatGPT时候?机器人可能必要腿在一些非常复杂的地形穿越,到当时腿式人形机器人会没有会非常波动、成本低、噪音小、续航高?智能和硬件又会彼此请求,对方进一步成长,直到机器人进入家庭场景。
北京商报记者 魏蔚
公布于:北京市