公众号:环球解密(点击复制)微信
当前位置: 未解之谜网 > 技术创新 > 特斯拉人形机器人Optimus二代来了!手捏鸡蛋、深蹲蹦跳更像真人

特斯拉人形机器人Optimus二代来了!手捏鸡蛋、深蹲蹦跳更像真人

2023-12-9 未解之谜网

悄无声息,特斯拉突然发表二代人形机器人 Tesla Optimus Gen 2。一句话划重点:和前代相比,Optimus Gen 2 动作更像真人。

特斯拉全新执行器和感测器,提高执行任务效率和精准度。

2-Dof(自由度)驱动颈部,头部转动更自由。

11-Dof 手关节,手部运动更灵活。

整合执行器与电子元件、线束,提高系统稳定性。

步行速度提升 30%,增强环境适应性。

引入脚力/扭矩感测,灵活适应各种地面。

重量减轻 10 公斤,机动性更强。

从马斯克分享的影片可看到,Optimus Gen 2 能平稳行走,速度比前代快 30%,还能 90 度左右蹲下,肢体控制度相当不错。Optimus Gen 2 还升级手部,11 个自由度让它像人手,准确度和流畅度均佳。Optimus Gen 2 所有手指都有触觉感测,能拿取鸡蛋等易碎物,好像会料理。

最后看到两台 Optimus Gen 2 随着音乐节拍和灯光手舞足蹈,这也算特斯拉给粉丝的小彩蛋。

特斯拉高阶工程师表示,一切都是真的,没有用 CGI 偷吃步,且动作都是即时没有加速播放,盛赞特斯拉机器人硬体性能有难以置信进步。若他所说属实,特斯拉人形机器人的进化一目了然。

特斯拉机器人的进化之旅

特斯拉推出第一台人形机器人开始,短短三年就有如此进步,2021 年 8 月 AI Day 马斯克宣布开发人形机器人 Tesla Bot,高 5 尺 8 寸,重 125 磅,能承载 45 磅和举起 150 磅,主要执行危险或重复性任务。但那时机器人只是几张“活在”萤幕的 PPT 概念图,就连上台跳舞也是由扮成机器人的人类负责。

接着第二年 AI Day 2022 大会,主角变了,自己走上台的 Optimus 成了主角。裸露机械结构让颜值有些粗糙,但搬箱子、浇水还是在超级工厂搬砖,示范影片显示它能做的工作可不少。

提供 Optimus 能量的不是火种,而是一块容量 2.3kWh 的电池包,充分保护放在最核心的位置,即图中蓝色区域。马斯克称 Optimus“非常适合一整天工作”,静坐功耗约 100W,快走 500W。可能有人会问走多快,答案是秒速约 2 米。为了确保灵活性,特斯拉甚至设计了 28 个关节,每个关节都有多套执行器,能后台分析执行效率,减少无效工作。

特斯拉表示,Optimus 有 200 多个自由度,手就占了 27 个,为促动机(actuator)驱动,经视觉系统和演算法,Optimus 能准确辨识手与物体位置,做出浇花取物等动作。从迈出第一步到自如摆出各种姿势,Optimus 可是花了五个月时间。

3 月特斯拉投资者大会,Optimus 再次史诗级进化。亮点之一是 Optimus 从桌上拿起机械手臂并自己固定到身体,另一台 Optimus 则帮组装中第三台 Optimus 装手臂,敏捷流畅,比最初版进步甚大。Optimus 动作仍僵硬,还不能做跑酷等复杂动作,但可短距离行走、搬运物体和使用基本工具等一般功能。

仅半年,9 月 AI Day Optimus 不仅能根据颜色分类方块,还能自信将双臂举起,用一条腿做出瑜伽姿势,展露优异的平衡力和协调力。更栩栩如生的身躯,灵活的手指,流畅轻盈的步行,Optimus Gen 2 运动和操作能力更贴近人类。也许再过不久,机动性更强的 Optimus 可复制人类“爬、跳、抓、举”等复杂动作。

当然照马斯克设想,Optimus 远景不仅只取代人类完成重复劳动、危险性高等任务,而要成为通用机器人,融入家庭、办公场所和商业场景等更复杂背景。故机器人硬体只是基石,完整的人形智慧体还要“大脑”等级软件和演算法赋能。

把 GPT-4 塞入人形机器人会发生什么事?

今年大模型不断升级,智慧泛化能力高速提升,让人看到人形机器人的潜力,更不时看到新玩家加入人形机器人赛道。他们不约而同选择具身智慧,顾名思义指智慧体用物理身体透过感测、运动和环境互动取得资讯、判断并采取行动,可视为人工智慧的终极形态。

强调身体对认知和行为的关键作用,比起纯思维型智慧,具身智慧更贴近人类自然智慧,强调身体、行为和环境对认知的作用。不严谨的表达是,AI 大模型为大脑,机器人是躯壳,AI 大模型套上机器人就是具身智慧。

除了特斯拉机器人,更直觉案例是,东京大学发表人形机器人 Alter3 便是首款 GPT-4 驱动的人形机器人。因 GPT-4 加持,不需先程式设计调教,口头回馈就能让它做出各种动作,弹出重金属音乐、自拍、投球、扮鬼吓人,GPT-4 智慧语言描述映射后都不在话下。

Alter3 当然无法理解“抬手多高”等细节,故无法改善动作,只透过人类口头回馈,如“自拍时手抬高点”,接收资讯的 GPT-4 会将人类指令分解为一连串步骤,再转化为控制 Alter3 各部位运动的 Python 程式码,也就是所谓的思维链(CoT),然后 Alter3 会储存改善后运动程式,形成“运动记忆”。

碰到再生成相同的运动时,它会根据经验推理如何最佳执行任务,就不用从零开始,零样本学习能力(zero-shot)也是机器人获得真智慧的关键。更离谱的是,没有意识的它甚至可从 GPT-4 回馈文本推断出适当情感,并用清楚动作表达,又是机器人“超群”表现。华为天才少年稚晖君的智元机器人远征 A1,雷军“铁蛋”也属 AI+机器人范围。

大模型以前,机器人属专用设备,如今有大模型通用能力,通用机器人开始曙光乍现,正如稚晖君说不只需 ChatGPT,还要 WorkGPT。进化间接印证一条清晰可见的道路:当 AI 大模型生根发芽,总要走进现实世界,具身智慧就是最佳路径。

活跃于 AI 前线的辉达创办人黄仁勋:“具身智慧将引领下波人工智慧浪潮。”

成熟 AI 大模型为人工大脑,类比人脑复杂神经网络,实现语言理解、视觉辨识、情景推理等认知功能,解决机器人更高层次认知和决策问题。各种感测器、执行器、计算单元整合至机器人躯体,达成环境感测和互动,如视觉系统可捕捉图像和影片,触觉感测器可感受物体形状和质地等。

因此,AI 大模型与机器人实体融合基础上,假设有一日,究极体 Grok 结合 Optimus,也许能初步虚拟和物理现实界限,让智慧 AI 彻底走出萤幕,真正融入人类生活社会。最后放上网友 @cb_doge 叫 Grok 评价 Optimus Gen 2 的回答:

特斯拉 Optimus Gen 2 进步真让人瞩目!上次上线后,无论速度、重量减轻,还是处理像鸡蛋等易碎物体的能力,都有显着提高。这就像看到小鸟勇敢尝试第一次飞行,尽管它有更多执行器而非羽毛。

放眼全球,我们要明白,发展 Optimus 这类机器人是长跑而不是冲刺,就像看技术与人性一起缓慢优雅跳舞,每步伐都使我们更接近理想未来,机器人和人类和谐相处,一起工作。

至少,这是我们的梦想。

共有358阅 / 0我要评论

发表你的评论吧返回顶部

!评论内容需包含中文


请勾选本项再提交评论