AI大模型摘要

内容纲要

2023.11.23

车企大模型应用场景

  • 东风日产、红旗、长城这些,就宣布接入百度的 “ 文心一言 ”。
  • 理想的自研大模型 Mind GPT
  • 广汽的 AI 大模型平台
  • 吉利的全栈自研全场景 AI 大模型等等。

语音助手

就目前而言,大多数车企还只规划了座舱的语音功能,说白了,就是做 ChatGPT 的语音版。——语音助手

会议助手

比如百度的文心一言,据说搭载上车之后,可以一边在车上电话开会,一边自动记录会议纪要,并且完成简单的 PPT 制作。

吉利的这个全场景 AI 大模型就更有意思了,说是有主动搭讪、自动唱歌以及哄娃等能力。

辅助智驾训练

一些车企已经到了第二层,开始用大模型做智驾了。

将大模型作为工具,辅助汽车的智驾训练,其中关键是训练智驾系统的应变能力。目前智驾系统还不能保障 100% 的自动驾驶安全性,是因为存在 AI 还没见过的场景,一旦遇到这种情况, AI 就容易 “ 把 CPU 给干烧了 ” ,大多数自动驾驶的安全事故都是这样发生的,这个情况被称作 Coner case 。

解决一个 Coner case ,必须得经历数据预处理、数据标注、模型训练和模型仿真等过程,需要用上万的样本数据以及数周时间进行测试,费时费力。

过去用来训练 AI 的数据基本来自真实数据,但是由于 Coner case 发生的概率非常低,要找到世界各地出现的相同 Coner case 并不容易。

用上大模型之后,AI 就可以帮助构建虚拟空间,自动生成训练场景,可以大幅缩减成本。

比如华为的盘古大模型,会根据路采数据进行重建,生成可编辑的虚拟空间,将原来两周左右的 Coner case 处理过程缩减到两天内。

另一些车企选择了更为激进的做法,直接选择用大模型开干智驾。这就不得不提到特斯拉的 FSD,特斯拉就采用了 BEV (鸟瞰图)+ Transformer 的智驾算法。这套模型架构将主要用于 FSD 的纯视觉感知算法,帮助系统将 2D 的摄像头视频数据融合转化成 3D 的鸟瞰图,从而自行判断合理的行驶路线。

file

用于智驾存在的问题

大模型做智驾的主要问题,是处理不完的各种 Coner case ,未来的智驾大模型还得继续在泛化能力上进行升级。

比如在今年的 8 月 26 日,马斯克在直播测试自动驾驶时,AI 把左转车道的绿灯当成前进的绿灯,打算笔直穿过路口,此时的老马不得不主动介入刹停,才避免酿成事故。老马也只能说 “ 将投喂更多样本数据 ”。

因为压根没有什么直接了当的解决办法,毕竟模型是一个黑箱,没有人能在里面微操,除了继续训练还真没有什么别的办法了。

不仅如此,大模型做智驾的另一个难处就是钱。

特斯拉之所以能用上 Transformer ,关键是有 72 TOPS 算力的 HW3.0 芯片作为支撑。而现在一些车企用的都是英伟达 orin 芯片,它的算力更是达到 254 TOPS,今后随着模型越来越大,对智驾芯片的算力要求也会越来越高

最近, FSD 又进行了一次全面的算法更新,打造了一个 “ 端到端 ” 的智驾模型,把整个智驾过程融入到一个算法和模型里面,这可能是未来各大车企做智驾大模型的一个方向。

智驾算法是分成三个部分的,感知、决策和执行各司其职,如果将其整合在一起,那么成本会更低,智驾反应也会更快。

https://news.iresearch.cn/content/202311/485929.shtml


2023.12.04

优必选 预将成为“人形机器人第一股”

12月1日,深圳市优必选股份有限公司(优必选)通过港交所聆讯,即将在港交所主板上市,正式成为“人形机器人第一股”。

招股书显示,截止到2023年6月30日,优必选已服务全球50多个国家和地区,拥有900多家企业客户,并已售出超76万台机器人,在全球人形机器人尚处于技术探索和发展的早期阶段,人形机器人销售数量突破10台

深圳市优必选股份有限公司官网:
https://www.ubtrobot.com/

file

  • 展馆展厅:迎宾接待、导览讲解、娱乐表演
  • 影视综艺:主持&颁奖、相声&脱口秀、舞蹈表演、太极&瑜伽
  • 仓储物流:Walker机器人可在仓储物流场景中实现搬运、装配和检测等功能
  • 科研高校:具备通用便捷的开发环境、开放的接口和标准化平台,降低科研入门门槛,助力高校的前沿科技研究
  • 家庭服务:Walker机器人可以提供简单的家庭服务,如垃圾处理、搬运物体、控制智能设备、操作设备/工具、浇花等,提升家庭生活品质;Walker机器人具有亲切的仿人形态,可以陪伴老人和孩子,提供情感价值以及事故安全报警。
  • 办公场景:Walker机器人精准的人脸识别技术和数字监控系统完美结合,可以代替人类完成一些重复工作,如迎宾接待、自动扫描来访人员、端茶递水、控制智能设备等。

https://m.jrj.com.cn/madapter/stock/2023/12/04084038651817.shtml