关闭广告

开源炸场!优必选具身智能大模型Thinker再次狂揽9项全球第一!

雷峰网847人阅读

过去一年,以人形机器人为代表的具身智能在实验室中的“场景理解”与“任务规划”上进展显著,但面对真实的工业产线任务时,往往面临“想得到但抓不准、算得出但跟不上”的困境。这背后,是长期横亘在实验室环境与真实应用场景之间的鸿沟:人形机器人在空间层面的度量失准与时间层面的响应迟滞。


基于百亿参数底座模型,优必选对其具身智能大模型Thinker进行了架构升级。本次升级聚焦“小参数、高性能、全开源”,旨在打造一个能为工业人形机器人提供快速反应与精准空间感知的下一代具身智能大脑,以应对动态工业场景的挑战。Thinker将作为智能基座,为优必选的群脑网络和协作智能体Co-Agent提供认知与决策支持,进而驱动单机自主与群体智能的协同进化。

Thinker 实现了 “小体积大能量” 的关键性能突破,优必选此次将其开源,让广大开发者可基于该基座探索人形机器人大脑的应用,一同加快具身智能技术的迭代节奏,携手共建人形机器人的全新未来。

小参数+高性能+全开源狂揽9项基准全球第一

当前,机器人领域大模型表现欠佳,尤其在空间理解、视觉感知等关键任务上精度不足;且模型参数量普遍较大,难以满足机器人对实时性的高要求;其次,互联网上虽有海量数据,但质量参差不齐,制约了模型通过Data Scaling 实现性能有效提升。

优必选具身智能大模型Thinker以“小参数、高性能、全开源”突破具身大脑领域限制。近日,在涵盖10B以下具身智能大脑模型的权威基准评测中,Thinker一举拿下9项第一,重新定义了该领域的性能标杆。这些基准全面评估了具身智能的两大核心能力:一是机器人第一视角下的场景认知与任务规划能力,二是支撑物理交互的精准感知与空间理解能力。

该权威榜单囊括了英伟达、字节跳动北京智源及北京人形等顶尖团队近期发布的代表性模型,集中体现了具身智能行业的前沿水平。


优必选具身智能大模型Thinker

在9项权威基准评测中排名全球第一

(数据更新至01/30/2026,结果基于flageval, evalscope框架评测)

从海量数据到高质量“大脑”Thinker的数据转化之道

具身智能的核心竞争力根植于高质量数据的支撑,但行业普遍面临原始数据噪声大、多模态对齐困难、标注成本高、小样本泛化难等痛点。优必选以数据为核心,构建了覆盖"精炼提纯 - 自动化标注 - 数据驱动训练” 的全链路解决方案,通过极致的技术优化破解行业难题,为轻量化具身大模型的高性能表现筑牢数据基座。


优必选具身智能大模型Thinker技术架构图

从20B 到 10M多模态数据的 “精炼提纯” 流水线

面对高达20B、含噪声、难对齐、模态缺失的原始数据,优必选构建了全流程自动化“精炼提纯”流水线。通过“数据筛选”与“质量评分”两步,实现从20B到10M级别高质量数据的极致提纯。

  • 广度筛选:基于定制化规则,从视觉、语言、动作、环境等多模态数据中,快速过滤出约1%的候选数据池。

  • 深度评分:引入大模型构建多维度评分模块,从质量、任务、场景等多维度进行精细评价,最终筛选最高价值的训练数据。

自动化标注闭环人工参与率<1% 的高效方案

针对具身数据标注难度大、成本高的行业痛点,优必选搭建了“弱监督 + 自监督 + 少量人工校验”的自动化标注体系:

核心技术:采用“大模型辅助标注 + 多模型交叉验证”策略,对视觉场景分割、动作序列分类、指令意图解析等任务实现端到端自动化标注;

人工校验机制:仅对标注置信度低于阈值的样本进行人工复核,最终将人工参与率控制在1%以下,较传统全人工标注方案成本降低 99%,标注效率提升超百倍;

动态迭代优化:将模型训练后的误差反馈至标注流水线,持续优化标注算法参数,形成“标注 - 训练 - 反馈 - 迭代”的闭环,标注准确率随迭代逐步提升。

Data-centric 核心优势 小样本撬动强泛化能力

具身智能的核心需求是 “在复杂真实场景中精准交互”,而数据质量直接决定模型的环境适配与任务迁移能力。优必选的训练范式以下三个核心维度系统保障模型的泛化与迁移能力

  • 样本多样性覆盖:基于精炼的10M高质量数据,全面覆盖具身智能四大核心任务类型:任务规划, 视觉定位,空间理解,通用知识;

  • 任务导向型采样:针对具身智能 “感知 - 决策 - 执行” 闭环中的关键环节(如精细操作、模糊指令理解、突发场景应对),进行样本动态采样,提升模型核心能力;

L4级标注标准:通过设计精细的4级数据标签,从任务-功能-分类-模态4个维度进行精确划分,实现对训练数据配比的精准把控。


Thinker训练数据类型分布

转动数据飞轮驱动模型持续进化

依托具身智能大模型Thinker的技术积淀,优必选创新性打通数据回流机制,通过在工厂搬运、工件分拣等真实场景中的深度部署,确保技术优势转化为落地优势,并反哺模型持续进化。包含:

基础能力深度解析

详细拆解模型多模态理解、空间推理、任务规划等核心能力,明确不同具身场景下的能力边界与适配阈值,为下游应用提供精准的技术参考。

精准问题定位指南

提供场景化问题诊断方法论,针对落地中常见的指令理解偏差、操作精度不足等问题,给出可直接套用的排查流程与解决方案。

实操优化全流程指导

涵盖Prompt工程精细化优化技巧,以及SFT微调阶段的数据构造规范、不同任务类型样本比例配比建议,助力快速完成场景适配。

双向数据回流机制

回收下游场景中的全新数据、新兴任务需求及交互反馈,将其转化为模型可学习的训练资源,反向注入Thinker迭代过程,持续扩展模型基础能力与泛化性。以工厂搬运为例,系统持续收集实际作业中的长尾案例数据,如料箱识别失败、抓取轨迹动态调整等。这些真实场景数据直接反哺 Thinker 模型的训练,推动其自主进化,不断增强基础性能与场景适应能力。最终基于Thinker大模型,Walker S2可在箱体搬运、工件分拣等下游应用场景中实现 99.99% 的作业准确率。


具身智能大模型Thinker的应用闭环

当前,具身智能正加速渗透工业智造、商用服务等千行百业,但技术门槛与成本限制成为行业普及的关键瓶颈。优必选坚持开源共享理念,将模型权重、训练工具链与应用案例全量开放,希望与更多开发者和企业共同拥抱具身智能的浪潮。

开源代码网址:

https://github.com/UBTECH-Robot/Thinker

权重链接:

https://huggingface.co/UBTECH-Robotics/Thinker-4B

论文链接:
https://arxiv.org/abs/2601.21199

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

方永飞怼雷军,“行业不敢说的话全被他讲透了”

车轱辘话V 浏览 1373

北约启动今年最大规模军演 美国未参与

看看新闻Knews 浏览 815

继《沉默的荣耀》后又一黑马谍战作品

娱乐圈笔娱君 浏览 1623

直接吹爆!年度最敢拍的禁片级港片出现了!

独立鱼 浏览 298

满脸都是奔驰标!全新一代奔驰GLB官图发布

新汽车志 浏览 1378

25岁女孩海岛求生赛吃老鼠蜈蚣 35天暴瘦28斤

潇湘晨报 浏览 6653

最新!这家险资巨头,透露康养生态布局进展

券商中国 浏览 1199

秦海璐直言不敢再和张嘉译合作,藏着什么真相

星创文化 浏览 1971

高芙输球后更衣室摔拍遭外界批评,萨巴一句女人比男人耐热惹争议

网球之家 浏览 883

石破茂:拥核绝不会给日本带来正面影响

环球网资讯 浏览 1271

特朗普改打感情牌承认中方非常强大 疑想北京再给机会

现代小青青慕慕 浏览 8154

央视点名!这5位艺人现原形?

君笙的拂兮 浏览 1826

图卢兹vs梅斯:雷斯特、西迪贝首发,巴洛-图雷、哈比卜-迪亚洛出战

懂球帝 浏览 1808

奇瑞集团10月份销售汽车281161辆 同比增长3.3%

网易汽车 浏览 1655

金莲花奖女配提名 85花顶流之争再升级

桑葚爱动画 浏览 1412

全球港口博弈拉警报?李嘉诚亮终极底牌了

大猫财经Pro 浏览 815

拉夫罗夫被指"地位下降" 克宫否认其与普京关系紧张

红星新闻 浏览 6511

华尔街主流投行也要参与!高盛CEO称正在探索预测市场机会

华尔街见闻官方 浏览 1036

斗跑杨立昆后自己也要被废?汪滔赶忙“端菜上桌”

字母榜 浏览 343

什么信号?有银行直接5.5折卖房

大猫财经Pro 浏览 1551

德国财长访问中国备受关注 德媒:此行意义重大

环球时报国际 浏览 6089
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1