米兰体育官网 这家机器东谈主公司把“具身数据”塞进1万个背包里
发布日期:2026-02-12 22:54:28 点击次数:53

作家丨苏建勋
在具身智能范畴,“搞数据”这个事儿,可能是为数未几的共鸣。
依靠检会巨量数据,谎言语模子出生了Chatgpt,“Scaling Law”也成了AI东谈主的信仰,可在具身智能所属的物理宇宙,莫得互联网上海量的数据参照。非论是东谈主,已经机器东谈主,在现实中的数据量,齐不及以复现GPT时刻。
是以,数据怎样搞,能搞到若干,以及要让数据有质地,就成了具身智能从业者当下最遑急的责任之一。
最近,就有一家机器东谈主公司思在数据汇集上“整点花活儿”。鹿明机器东谈主发布了全球首款背包版UMI数采开发FastUMI Pro(背包版),并规划在2026年投放1万台开发,在工业、家庭、旅馆、餐馆、市场、办公等六大果真场景开展系统性数据汇集。
全球首款背包版UMI数采开发:鹿明FastUMI Pro(背包版)
简便阐述一下“UMI(通用操作接口)”:UMI是斯坦福大学、哥伦比亚大学与丰田沟通所勾引淡薄的低本钱数据网罗与学习框架。永别于市场同业的遥操数采,UMI不错与机器东谈主内容解耦,这就意味着检会出的数据,不错不仅适用于某一家/个机器东谈主风景。
在2026岁首的一次媒体交流会上,鹿明机器东谈主创举东谈主兼CEO喻超也聊到UMI和遥操的效果与本钱对比:
“雷同是像叠一稔这么的事情,遥操作数据汇集,需要花 50 秒,本钱是3-5元,若是是用FastUMI Pro的形貌去汇集,唯有 10 秒,本钱<0.6元,这么的话其实汇集的效果能大大升迁,本钱更低。”
鹿明机器东谈主建设于2024年9月,创举东谈主喻超是前追觅具身机器东谈主业务追究东谈主,领有近10年具身机器东谈主研发教授,主导了小米CyberDog的研发和千台量产。联席CTO丁琰是大陆最早作念UMI的东谈主,初次将UMI从实验室带向工业界。
有量,也要有质
2025年,鹿明通过自建数采中心的形貌,已罢了10万小时的数据产能。喻超判断,2026年,头部具身模子的数据范畴展望100万小时起。
而鹿明在2026年最遑急的主义,便是建设年汇集百万小时的UMI数据产能。这意味着,鹿明需要用更具范畴化的妙技,汇集更多量据。
“机器东谈主检会数据本不应该如斯昂然和稀缺。东谈主类在物理宇宙功课过程中产生的数据无处不在,仅仅莫得被很好地网罗。”喻超暗示。
背包版FastUMI恰是为处治这一问题而生——它是一款便携的步伐数采责任站,可将果真场景操作高效回荡为高质地检会数据。
此前具身数据汇集,大多依靠实验室或单一场景汇集,米兰体育这就会导致一个问题:机器东谈主在汇集时通常只在一个场景下类似几个动作,这么获得的数据就会清寒千般性,也会影响模子的泛化材干。
因此,鹿明机器东谈主但愿遴荐更爽脆的数据汇集形貌,将汇集器具径直装进背包,让果真场景的数据汇集门槛更低。
在具体场景上,鹿明机器东谈主但愿隐敝工业、家庭、旅馆、餐馆、市场、办公六大中枢场景,细分30个小类任务,构建结构化、多维度的操作数据体系。
“采–训–推”一体化闭环材干是鹿明数据基础法子的中枢。这次范畴化数据汇集的运行,正依托于这一已全面买通的基建体系:依托FastUMI Pro,鹿明双臂具身机器东谈主MOS在5小时内完成从“数据汇集-策略检会-模子推理”的工场质检全过程考据;FastUMI Pro在合肥实地部署后,仅用7小时便跑通果真场景下的汇集、检会与部署推理。

FastUMI Pro在分拣零部件任务中,完成“数据汇集-策略检会-模子推理”闭环
要训模子,数据先行
有了背包式的汇集器具之外,鹿明还作念了一件事,他们建了一个“数据超市”,把汇集到的数据形成了不错畅通的步伐产品,让客户不错径直在官网上采购步伐化操作数据。不错看出,看成一产品身智能公司,鹿明当下的公司战术要点,齐围绕“数据”。
鹿明机器东谈主的一系列动作背后,现实上反应了具身智能当下“最痛”的业务需求。
在岁首的媒体换取会上,鹿明机器东谈主联席CTO丁琰就对《智能深远》等媒体共享了他关于数据和模子的感悟。
“我便是作念模子出身的,我之前一直在训模子,其时咱们在作念的时候就发现一个很大的问题。“丁琰说到,”要思训一个至极好的模子,必须要有一个很好的数据管线,包括数据坐褥、数据评估、数据筛选,建设的过程自己就需要本领。“
在摸清行业果真发展近况后,丁琰和团队其时就决定,模子和数据二选一的话,细目先选数据,不成上来就训模子。
”因为模子架构拼到临了,人人拼的不是模子架构,而是模子数据的质地,这是一个行业的共鸣。“丁琰说到。
具身智能的材干上限高度依赖果真操作数据的范畴与质地,当通用数据不错像硬件一样在线下单,行业模子检会门槛被权臣拉低,具身智能材干从定制化探索走向工程化坐褥。
从“万台开发同步开采”到“通用数据电商下单”,鹿明正将“无处不在却未被网罗”的物理宇宙操作数据,变为可范畴供给的步伐化基础法子,并以此构建数据驱动的生态系统。当数据不再稀缺,机器东谈主才果真走向通用。
end
备案号: