4月11日,自动驾驶人工智能公司毫末智行举行第八届 HAOMO AI DAY,正式发布了业内首个自动驾驶生成式大模型DriveGPT,中文名“雪湖·海若”。据悉,目前,毫末DriveGPT雪湖·海若已正式对外开放,开启对限量首批客户的合作,北京交通大学计算机与信息技术学院、高通、火山引擎、华为云、京东科技、四维图新、魏牌新能源、英特尔等已经加入。专业人士认为,自动驾驶技术正进入以数据和知识双驱动的多模态感知和认知理解为代表的新阶段。
值得一提的是,基于该大模型的智能驾驶能力将在长城汽车即将量产上市的新摩卡DHT-PHEV车型落地。毫末智行表示,其城市NOH将在北京、保定、上海等城市落地,并开启泛化测试,到2024年有序落地100城。商业化层面,包括长城汽车在内,毫末已获得了3家主机厂的定点合同。
据介绍,DriveGPT雪湖·海若现阶段主要用于解决自动驾驶的认知决策问题,其底层模型采用GPT生成式预训练大模型。雪湖·海若面向自动驾驶场景,输入是感知融合后的文本序列,输出是自动驾驶场景文本序列,即将自动驾驶场景Token化,形成“Drive Language”,最终完成自车的决策规控、障碍物预测以及决策逻辑链的输出等任务。
【资料图】
毫末智行CEO顾维灏提到,DriveGPT雪湖·海若可以逐步应用到城市NOH、捷径推荐、智能陪练以及脱困场景中。有了DriveGPT雪湖·海若的加持,车辆行驶会更安全;动作更人性、更丝滑,并有合理的逻辑告诉驾驶者,车辆为何选择这样的决策动作。
大数据方面,依托HPilot的量产,毫末智行目前已积累了超过4000万公里辅助驾驶里程的数据,参数规模达1200亿。就场景来看,包括城市道路、城市快速路和高速;就数据分类来看,既有真实的感知数据,也包含真实的人驾数据。
大算力方面,毫末智行很早就预见了算力对于自动驾驶研发的重要性,公司今年1月份发布了中国自动驾驶行业最大的智算中心MANA OASIS(雪湖·绿洲),算力达67亿亿次/秒。此外,毫末智行还建立了一套基于4DClips数据的自动化标注方案。
上述专业人士表示,大模型对算力要求,也将通过智能网联不断得到车载计算平台算力、路侧端边计算和云端分布式算力的支撑。同时,大模型对数据高要求可通过数据和知识双驱动方法,通过数据混合与人工增强等方法来解决;同时,通过从数据中提炼知识,降低模型数据需求、节省模型训练算力,节约大量资源。
据了解,当前,毫末在使用数据过程中,逐步建立起一套基于4D Clips驾驶场景识别方案,具备极高性价比。在行业上,给出正确的标注结果,一张图片需要约5元;如果使用DriveGPT雪湖·海若的场景识别服务,一张图片的价格将下降到0.5元。单帧图片整体标注成本仅相当于行业的1/10。
华泰证券认为,GPT 大模型范式有望赋能垂直领域智能驾驶感知标注、决策推理等核心环节,加速智驾落地,同时大模型研发或推动驾驶数据和算力需求快速增长。推荐经纬恒润、舜宇、联创。
天风证券研报认为,预计到2025年乘用车L2以上搭载率将达到70%,2023年城市辅助导航NOH将围绕量产上车发力,搭载行泊一体功能的智驾产品将迎来前装量产潮,大模型成果将会落地车端。毫末智行DriveGPT为大模型在自动驾驶行业的应用提供了一种思路,有望提升行业整体的智能驾驶决策规划算法能力,助力智能驾驶渗透率更快提升及端到端智能驾驶早日实现,建议关注两大方向:
掌握大量数据拥有较强研发能力的整车公司:小鹏汽车、长城汽车(毫末智行控股母公司)、理想汽车、蔚来汽车等;
在大模型的部署过程中,终端车载算力的需求有望提升:关注德赛西威、经纬恒润、寒武纪、地平线(未上市)等域控及智驾芯片公司。
相关概念股:
长城汽车(02333):目前该公司既是毫末智行的大股东,也是毫末智行的大客户。 公司新一代全自研智能座舱系统Coffee OS 2的语音产品规划覆盖全车功能领域控制与对话场景功能高达940个,包含车控车设、系统设置、导航、多媒体等各模块,并具备四大领先行业的语音交互功能,其中包括瞬间响应、多领域多意图指令精准识别执行、后排抑制、语音车控。
理想汽车(02015):近日,知行科技正式向港交所递交招股书,拟主板挂牌上市。知行科技是一家自动驾驶解决方案提供商,专注于自动驾驶域控制器。公司股东中,理想汽车通过北京车和家持股 4.5%。
小鹏汽车(09868):近日,小鹏全新一代智能驾驶系统XNGP(Xiaopeng Navigation Guided Pilo, 自动导航辅助驾驶)正式上线。在刚刚过去的3月末,小鹏汽车启动了推送全新版本OTA——Xmart OS 4.2.0,向小鹏G9及P7i Max版用户开放XNGP第一阶段能力。