行业资讯

机器人“投身”家庭保洁具身智能迈向家庭“终极考场”

机器人“投身”家庭保洁具身智能迈向家庭“终极考场”(图1)

　　当58到家的保洁阿姨按下门铃时，她的身边多了一位新“同事”：一台由具身智能企业自变量研发的

　　记者了解到，目前保洁员已先后在深圳、北京等地累计服务近百个家庭。这也意味着机器人从实验室和工业场景来到了更为复杂的家庭场景，为攻克具身智能应用“最后一公里”迈出了真实一步。

　　深圳市民陈果（化名）是呼叫保洁员上门服务的首批体验者：她通过58同城App预约了国产机器人上门的智能保洁服务。“确实很新奇，一开始还有点担心机器人做家务活会做不好。”

　　在3小时的服务中，陈果观察到，机器人不仅能在客厅和厨房间顺畅行走，还能负责清理垃圾、收拾桌面、清洁收纳等任务。“这台机器人干活还挺稳，人机配合很高效，比预期中好得多。”

　　在家庭服务场景中，人机协作分工明确：保洁阿姨主要承担与客户沟通、现场判断以及更复杂的深度保洁工作，机器人作为得力助手，主要负责客厅区域的收纳和基础清洁。

　　作为“实习保洁员”进家入户，对机器人来说已是显著的进步。因为家庭是一类具有极高复杂性、非标准化特征的开放场景，被认为是检验通用机器人技能的“终极考场”。智元机器人合伙人、高级副总裁王闯认为，普通百姓可能期待机器人直接进入家庭干活，但家庭场景实际上落地难度最高，需解决安全性、成本、复杂任务泛化性、作业成功率及避免破坏物品等诸多难题。

　　正因如此，为使机器人在家庭场景中更稳定地干好精细活，需要更优的预训练，这对机器人的“大脑”——模型能力提出了更高要求。一位参与技术研发的工程师打了个比方：工业机器人像循规蹈矩的实习生，每一步都按手册操作；而家庭机器人需要像一个有常识的成年人，即使遇到没见过的情形也能随机应变。

　　应用于家庭场景的机器人，一直是具身智能领域公认的“最后一公里”。36氪研究院发布的《2026年具身智能产业发展研究报告》提出，人形机器人产业发展的核心突破口在于机器人大脑的“演进”。宇树科技创始人王兴兴也不止一次公开表达过，机器人当下及未来最关键的挑战在于大模型，足见具身智能模型能力提升的急迫。如果说硬件决定了机器人能不能动，那么大模型决定了它能不能“聪明”地动——而这恰恰是目前全球业界共同的瓶颈。

　　“真正的智能机器人难点不在于单一动作的重复，而在于能不能在随机环境下做出全新的没有被训练过的动作。这要求基础模型必须具备高度的泛化性、准确性，能应对足够复杂的任务。”自变量机器人CEO王潜介绍，为此自变量研发了具身智能基础模型Wall-B。

　　纵观全球多数具身智能企业，VLA（视觉-语言-行动）架构是当前具身智能领域的主流方案，其结构清晰：视觉模块负责“看”，语言模块负责“理解”，动作模块负责“做”。三个模块各司其职，数据依次传递。然而这一架构具有天然缺陷：数据在模块之间每传递一次，就会发生一次信息损耗和延迟。视觉模块“看到”的丰富空间信息，传到动作模块时，往往只剩一个模糊的摘要。而且VLA只能“模仿”训练数据中的轨迹，并不理解杯子为什么会掉，也不理解为什么盘子悬在桌边需要推回去。

　　王潜说，Wall-B不是一个只会背标准答案的大脑。“它包括三方面能力：一个是以感知和理解，代替死记硬背标准答案的动作模仿。第二种能力是举一反三，不是每一个动作或场景都需要历史数据或‘老师’教。第三是实时调整的能力，做错动作之后可以马上调整正确，以高效完成任务。”

　　具体而言，Wall-B将视觉、语言、动作、预测四方面的能力统一放在同一个架构里进行训练。这意味着模型不再是“看了再想、想了再做”的串联模式，而是能同时处理多种信息流。因此模型能够对物理世界的重力、惯性、摩擦等规律有更精确的认知和感受——比如它知道一个空纸杯比一个装满水的杯子更容易被碰倒，也知道光滑的地板上刹车需要更长的距离。这种对物理常识的内化，使得模型对数据的处理更加高效准确，而且能够应对从没见过的场景。

　　例如，在一次真实家庭服务中，机器人第一次遇到一个底部带有吸盘的杯垫。它没有经过专门训练，但通过视觉识别和物理推理，意识到需要稍微用力才能拿起杯子。这种“现场推理”能力，正是Wall-B区别于传统VLA模型的关键所在。

　　今年以来，具身智能迈入应用快车道。2026年政府工作报告中，具身智能被明确列为需要培育壮大的未来产业之一。同期，工业和信息化部正式发布的《与具身智能标准体系（2026版）》，为行业规范化、规模化发展提供了顶层设计。

　　记者注意到，目前不论工业机器人还是用于商业场景的机器人，大部分依然依赖于遥操作，或者需要人的现场“指挥”。这意味着机器人的功能还停留在被动执行而非主动行动层面。拿得掉遥控器，机器人才能真正独立；离得开人，它才算拥有了自己的“大脑”。

　　除大脑不够智能之外，数据也是相当关键的制约因素。再好的算法模型，如果没有海量、高质量、贴近真实场景的数据去训练，都会沦为“纸上谈兵”。

　　因此，让进入实战场以提升数据质量，已成为业内共识。王兴兴在2026人形机器人与具身智能标准化年会上说，通过模仿学习采集真人数据，机器人才有望掌握人类的各类动作。中国科学院自动化研究所研究员赵晓光称，实训场就像机器人上岗前的“实训课堂”，通过由简到繁的系统训练，让机器人掌握解决实际问题的能力。

　　然而，目前行业大多数训练模型的数据来自实验室：固定光照、固定物置、无干扰环境。但这一环境与真实世界有着显著差距，尤其与家庭中随时变化的自然光、随意摆放的物品、孩子和宠物的随机动作截然不同。在实验室里表现优异的模型，一旦面对真实家庭的“混乱”，准确率可能从90%骤降到60%以下。

　　机器人保洁员每次完成任务后，都会将脱敏后的感知数据和操作数据回传至训练平台。这些来自真实场景的“一手经验”，成为模型迭代最宝贵的养料。“训练的数据包括两个部分，我们用实验室的数据去帮助它建立基本能力，用真实场景的数据让模型学会真正的生存。”王潜说。

　　接下来，搭载Wall-B的新一代具身智能机器人将更大批量进入多个城市的家庭场景，并加快训练、增强能力，使机器人尽快成为人类的家庭成员与好帮手。可以预见，在不远的将来，当我们听到门铃开门，迎接一位机器人保洁员进门服务，或许会像今天看到扫地机器人一样习以为常。

上一篇：每周股票复盘：奥普特（688686）构建3D视觉技术闭环下一篇：当RPA遇上AI：数字力量如何重新定义人机协作

栏目导航

新闻资讯

联系我们

电话：0755-27586855

传真：0755-27586833

手机：13966220023

邮箱：2788505339@qq.com

地址：深圳市宝安区新桥街道洪田社区新桥东先进制造产业园

Kaiyun（开云体育）中国官方网站-开云体育登录入口

行业资讯

机器人“投身”家庭保洁具身智能迈向家庭“终极考场”

相关新闻

栏目导航

新闻资讯

联系我们

Kaiyun（开云体育）中国官方网站-开云体育登录入口

行业资讯

机器人“投身”家庭保洁 具身智能迈向家庭“终极考场”

相关新闻

栏目导航

新闻资讯

联系我们

机器人“投身”家庭保洁具身智能迈向家庭“终极考场”