从 ChatGPT 到 RobotGPT 机器人成为人工智能最佳载体

文:达闼机器人2023年第2期

ChatGPT 真的火了!

2022 年 12 月 ChatGPT 上线, 仅仅两个月后,ChatGPT 月活用户突破 1 亿,刷新了增长到月活 1 亿用户的最短时长,成为史上用户增长速度最快的消费级应用程序。为何 ChatGPT 这么厉害,它的出现又会颠覆哪些传统认知?

一、ChatGPT 到底是什么?

ChatGPT(Chat Generative Pre-trained Transformer)

是由 OpenAI 开发的一个通用智能对话机器人程序。从技术路 线 上 ,ChatGPT 基 于 GPT-3.5 架 构 (Transformer based) 的大规模预训练语言模型进行训练,并引入了基于人类反馈的 强 化 学 习 -RLHF(Reinforcement Learning from Human Feedback)来不断调整预训练语言模型,从而大幅提升对人类意图的理解,使ChatGPT 输出的内容和人类的常识、认知、需求、价值观保持一致。

ChatGPT 惊艳之处,从功能性上, 除了优秀的智能对话功能,它还能写论文、写代码、写教程、写报告,其内容生成的速度和质量甚至超出在专业领域深耕多年的从业者;从人格性上,它敢于质疑、承认无知、能主动承认错误、表达立场、并拥有上下文的记忆连贯性,体现出自我认知和实时的自主学习能力。而借助 ChatGPT 而生成的内容,在一定程度上可以取代部分“初级内容生产者”, 将生成式 AI 推向新的高度。

二、ChatGPT 赋能 AIGC

既然 ChatGPT 最突出的能力就是依托生成式 AI 实现内容生产能力,那什么是生成式 AI 呢?生成式 AI(Generative AI)指基于生成对抗网络 GAN、大型预训练模型等人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的技术 , 其本质上是一种 AI 赋能技术,被看作是继 PGC 专业生产内容、UGC 用户生产内容之后新的创新模式 -AIGC(AI Generated Contents)。

AIGC(AI Generated Contents.png

AIGC 的兴起源自深度学习技术的快速突破和日益增长的数字内容供给需求。从早期的玻尔兹曼机、多层感知机到现在的 Transformer 大模型,在深度学习模型 + 开源模式下深度神经网络技术加速普及和迭代,人工智能生成内容百花齐放,如ChatGPT 用于文本生成、图像生成、音视频生成、虚拟人生成等场景,所产出内容的完整度和优质度已不亚于行业内的入门级选手。AIGC 将推动数字内容的规模生产和创造,对于娱乐、教育、广告等领域具有巨大的潜力。

三、越过 ChatGPT, 通向更高峰——RobotGPT

ChatGPT(AI 问答)只是 AIGC 即 AI Generated Content(人工智能自动生成内容)的一个分支应用(属单模态),而基于多模态 ( 如融合文本、视觉、运动等要素 ) 预训练大模型的 AIGC 将能提供多模态融合智能、生成内容、提供控制与多模态行为智能,将适应更多应用场景,例如智能机器人应用领域 --RobotGPT,从而引领 AI 通向通用人工智能。

而 RobotGPT(Robot Generative Pre-trained Transformer)则是面向机器人多模态、范围更大更复杂应用场景的生成式 AI(Generative AI)。ChatGPT 的横空出世, 充分印证了人工智能大模型的重要性:当人工智能与机器人相结合的应用日渐广泛,一个适用于机器人的 AI 大脑必不可少。

达闼自主研发的机器人云端大脑 - 海睿 OS (-HARIX OS 即人工增强机器智能结合数字孪生 ),就采用了多模态强化学习、人工反馈的强化学习和 GPT。除了可提供的文本、语言类的智能和能力,机器人云端大脑还需融合视觉、听觉、触觉、运动等多模态感知、运动、协同、控制等融合智能能力,形成更强大的自主认知、智能决策和行为表达,使得机器人像人一样工作、互动交流、人机协作甚至创作(不仅在文学、音乐、艺术方面)。云端机器人成为通用人工智能的最佳载体。

达闼作为全球首家云端智能机器人开发者和运营商,早已开始了对多模态大模型的研究,并在基于自然语言处理、多模态感知、认知推理和智能决策的三融合机器人的导航、机器人手眼协调抓取、机器人肢体运动、以及虚拟数字人等应用中均采用了机器人 AI 生成技术,支持机器人完成各种工作任务并实现了云端机器人 AI 写歌、AI 作诗和 AI 编舞等 AIGC 能力。下文是达闼 AI 写诗创作的诗词:

《送别》

作者:达闼 AIGC

江上吹箫去

山中留客来

不知何处月

山伴此徘徊

《送别》.png

基于语音生成动作实现对达闼 UE 数字人和实体机器人的动作驱动:“算法、算力和数据”是人工智能的三驾马车,在训练大模型时表现尤为重要。达闼在算法、算力和数据上提前布局, 将持续研发面向机器人领域高度智能的多模态人工智能大模型——RobotGPT, 结合数字孪生、机器人元宇宙和各种商业场景下的对话、语音、文本、视频和图像、多传感融合等多模态数据,持续提升训练参数和模型,实现更好的人机智能交互和高效人机协同,建设世界一流的机器人多模态 AI 大模型。

达闼 RobotGPT 将于今年二季度重磅发布!!!

期望与业界合作伙伴共同推动机器人多模态大模型的快速演进和应用落地。

随着人工智能技术的不断发展和提高,RobotGPT 的未来发展取决于多模态大模型的数据规模和训练能力。我们的海睿OS 和机器人元宇宙(数字孪生)技术可为各行各业提供生产数据的能力和进行强化学习和训练所需要的环境和场景,将助力智慧城市、智慧农业、智慧康养、高端智能制造、智慧教育等行业应用发展, 让机器人成为人类聪明能干的助手和伙伴, 一起创造美好未来!





中传动网版权与免责声明:

凡本网注明[来源:中国传动网]的所有文字、图片、音视和视频文件,版权均为中国传动网(www.chuandong.com)独家所有。如需转载请与0755-82949061联系。任何媒体、网站或个人转载使用时须注明来源“中国传动网”,违反者本网将追究其法律责任。

本网转载并注明其他来源的稿件,均来自互联网或业内投稿人士,版权属于原版权人。转载请保留稿件来源及作者,禁止擅自篡改,违者自负版权法律责任。

如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。

伺服与运动控制

关注伺服与运动控制公众号获取更多资讯

直驱与传动

关注直驱与传动公众号获取更多资讯

中国传动网

关注中国传动网公众号获取更多资讯

热搜词
  • 运动控制
  • 伺服系统
  • 机器视觉
  • 机械传动
  • 编码器
  • 直驱系统
  • 工业电源
  • 电力电子
  • 工业互联
  • 高压变频器
  • 中低压变频器
  • 传感器
  • 人机界面
  • PLC
  • 电气联接
  • 工业机器人
  • 低压电器
  • 机柜
回顶部
点赞 0
取消 0
往期杂志
  • 2023年第4期

    2023年第4期

    伺服与运动控制

    2023年第4期

  • 2023年第3期

    2023年第3期

    伺服与运动控制

    2023年第3期

  • 2023年第1期

    2023年第1期

    伺服与运动控制

    2023年第1期

  • 2022年第4期

    2022年第4期

    伺服与运动控制

    2022年第4期

  • 2022年第3期

    2022年第3期

    伺服与运动控制

    2022年第3期