自选
APP下载
扫一扫,下载

【电源设备】电力设备行业专题报告:海外科技研究-从谷歌看机器人大模型进展

原文出处: 华鑫证券   贡献者:研报专业户

投资要点


大模型是远期人形机器人的必备要素:


人形机器人的特点在于通用性和泛化能力,远期可以替代人类完成多项任务。而大模型具有庞大的先验知识库与强大的通识理解能力,可以满足人形机器人通用性的场景要求和技能要求,不再仅限于完成某一类特定工作,而是进一步完成多类型任务。在机器人大模型上,思维链可以帮助机器人拆分与分解一件事件如何完成,先解码出计划的步骤,再解码需要完成任务需要输出的动作。


谷歌:从Saycan到RT-X,软件领军者,步步为营,模型高速迭代


从2022年4月谷歌推出Say-can模型,初次引入大模型用于做任务理解和拆分,到RT-1使用传统神经网络的方法来执行SayCan的任务,再到RT-2将VLM大模型与RT-1的机器人执行数据集一起微调训练,最后创建OpenX数据集训练出模型RT-X。谷歌的模型持续高速迭代,逐步向底层运动控制方面发展。


机器人产业仍然处于较为早期阶段,数据、数据与细分场景模型搭建均有产业机会目前大部分机器人大模型仍然以单机械臂抓取为主,且模型的框架仍然在持续变化。可以明确看到大模型现在对底层的控制仍然偏弱。我们认为未来产业机会主要有三个方面,1、算力:机器人需要快速与环境交互,同时大模型本身要计算和存储空间。二者叠加之下机器人所需的参数和算力比自动驾驶以及大语言模型都要更大,因此对于算力的需求将在后续逐步有所体现。2、数据:机器人需要通过多种传感器感知环境状态,然后执行实际动作来完成任务,一方面需要3D环境数据,另一方面需要的是主动数据,此类数据量极度稀缺。3、细分场景的模型:未来大模型在机器人的应用,或许是通过底层的通识大模型+细分场景模型微调获得,其中底层架构的通识大模型有望参考类似手机安卓的模式由头部的AI企业开源,而细分场景的模型(同时也包括所需的数据)才是未来大部分企业可以竞争的市场。在这个赛道中,数据仍然是模型的基础。


风险提示


机器人下游发展不及预期


算力与算法模型更新迭代不及预期


行业竞争加剧风险


表情
同时转发

请点击右上角的【...】按钮

选择【浏览器】打开

×