机器人“犯错”也能变聪明?Facebook 实验揭秘自我监督学习
在人们的传统认知中,机器人应按照设定完成精准任务。但 Facebook 的研究人员却另辟蹊径,有意让机器人“犯错误”,探索其如何通过不断试错变得“聪明”。
“明知故犯”是“智”也
位于硅谷的 Facebook 实验室中,一台名为 Sawyer 的机器人反复尝试完成指定动作,但却屡次偏离轨道。虽然看起来失败,但其背后是一种特殊的智能行为。
Facebook 认为,这种“非理性”的行为对 AI 和机器人开发具有重要意义——它可以带来更多的数据样本和更高的适应性。
强化学习让机器人更“聪明”
传统上,机器人依靠预设指令执行任务,缺乏灵活性。而人类则是通过大脑构建的世界模型来理解行为后果,从而做出判断。
Facebook 首席 AI 科学家 Yann LeCun 表示:“AI 下一步的重大挑战是建立世界模型系统。”
加州大学伯克利分校的研究团队曾使用强化学习,让双臂机器人 Brett 通过不断试错,将钉子插入洞中。每一次成功或失败都被记录,从而优化后续行为。
创新的自我监督学习
与强化学习不同,Facebook 引入了“好奇心”机制。机器人 Sawyer 在接近目标后故意偏离,探索更多可能路径。
研究科学家 Franziska Meier 表示:“这种方式能获取比传统方式更多、更具多样性的数据。”
该方法被称为“自我监督学习”——机器人自主尝试新动作,并预测其结果,从而提升灵活性。
模拟与现实之间的差距
虽然模拟环境训练速度快,但难以完全反映现实复杂性。Facebook 研究科学家 Roberto Calandra 强调:
“如果它在现实世界中行得通,那它就真的行得通。”
AI 和机器人相得益彰
Facebook 正推动 AI 与机器人的融合。AI 借助机器人平台优化算法,机器人则借助 AI 提升自主决策能力。
LeCun 指出:“机器人解决一个问题的能力可以迁移到其他场景。”
尽管目前尚未直接转化为具体产品,但 Facebook 相信,未来机器人将在远程呈现等技术中发挥关键作用。


