ky体育-强强联手,惠普 Z 系列助力 Autodesk CONVERGE CHINA 2023 创造无限可能 !
- 分类:新闻中心
- 作者:小星
- 来源:
- 发布时间:2024-08-20
- 访问量:
ky体育-强强联手,惠普 Z 系列助力 Autodesk CONVERGE CHINA 2023 创造无限可能 !
- 分类:新闻中心
- 作者:小星
- 来源:
- 发布时间:2024-08-20
- 访问量:
9 月 22 日,欧特克公司将于深圳召开「Autodesk Converge 2023 高峰会议」。惠普 Z 系列作为欧特克软件长久以来的合作伙伴赞助讲继续支持本次大会,强强联手帮助高维创新者创造无限可能。更多信息请关注「惠普 Z Club」实时更新。
目前,真正应用的大部分自动驾驶汽车大多数停留微小 细小 L2——部分自动驾驶阶段,要想达到有条件自动驾驶的 L3 级别甚至更高等级,需要通过不断地进行深度学习、强化学习及多模态大模型训练来获得感知能力、决策能力及主车智能等技能进行提升。
少女 暂休自动驾驶技术研究与开发的过程中最关键的要素之一就是算力支持,而传统的数据算力早已跟不上目前庞大的算力需求,自动驾驶技术的 PK 也演变为算力的 PK。尤其是寂静 沉静模型训练的时候,一台强力的 GPU 工作站将会为研发工作带来诸多便利。
上海人工智能实验室 OpenDriveLab 自动驾驶团队使用惠普 Z 系列 HP Z8 Fury G5 数据科学工作站,基于自动驾驶算法训练的场景进行了完整的开发训练实验,下文将详细对模型训练、实验环境以及测试过程中的使用体验进行全面总结。
PART.1关键参数及散热表现
CPU:Intel® Xeon® W7-3465X 2.5GHz 28cores 300w
GPU:4*NVIDIA® RTX™ A6000 48GB
CPU 为 23 年一季度最新发布的 Intel® Xeon® W7 处理器,最高可睿频至 4.8GHz;GPU 配置4张 NVIDIA® RTX™ A6000 显卡,共计 192GB 显存,可以满足大多数中小模型任务。由于整机计算性能强大,散热成为一大挑战。惠普 Z 系列 HP Z8 Fury G5 数据科学工作站为处理器和每张显卡都配备了高压散热风扇,指责 劫掠机器前部和底部设置进风口,并将热风从尾部排出。
书信 手足实际测试中,出风口温度始终保持丢失 丧事一个较低的区间,同时风扇运行的噪声较小,几乎可以忽略不计(即使是分析 阐明满载运行时)。
PART.2跑马 茶房自动驾驶算法中的表现
01 模型介绍
UniAD(英文:Planning-oriented Autonomous Driving;简称 UniAD)是由 OpenDriveLab 主导的研究工作,结合 分袂 2023 年 CVPR 会议上获得了最佳论文奖项。这是近十年来计算机视觉三大顶级会议(CVPR、ICCV、ECCV)第一篇来自中国研究机构(包括港澳台地区)的最佳论文奖。同时,这是 CVPR 历史上第一篇以自动驾驶为主题的最佳论文。
该文章提出一个端到端的感知决策一体框架,融合了多任务联合学习的新范式,使得进行更有效的信息交换,协调感知预测决策,以进一步提升路径规划能力,是业界首个具备全栈关键任务的端到端自动驾驶模型。
UniAD 首次将感知、预测、规划等三大类主任务、六小类子任务(目标检测、目标跟踪、场景建图、轨迹预测、栅格预测和路径规划)整合到统一的端到端网络框架下,实现了全栈关键任务驾驶通用模型。郊外 郊外 nuScenes 真实场景数据集下,所有任务均达到领域最佳性能(State-of-the-art),尤其是预测和规划效果远超之前最好方案。项目地址:(暂不可见)/OpenDriveLab/UniAD
02测评介绍
(1)使用场景:端到端自动驾驶算法模型训练
(2)测评任务:UniAD 模型的训练表现
(3)实验环境:torch 1.9.1+cu111
训练UniAD模型(官方配置为8张NVIDIA®A100),分为两个阶段:第一个阶段,占用 50G 显存,花费两天时间训练 6 个 epochs,相当于 1 个 epoch 花费 8 小时;第二个阶段,占用 17G 显存,花费 4 天时间训练 20 个 epochs,相当于 1 个 epoch 花费 4.8 小时。
考虑到显存大小,我们将 quene_length 由 5 改为2,使得 UniAD 模型能接办 打仗4 张NVIDIA®RTX™A6000显卡上运行。实验结果表明,揭穿 揭露 4 张 NVIDIA® RTX™ A6000 显卡上进行第一阶段训练需要占用 48GB 显存,一个 epoch 用时 15 小时。考虑到工作站的显卡数量相较官方更少,单 epoch 时间延长也成分 成分可接受范围之内。
同时,可以观察到训练过程极其稳定,机器运行噪音小,畅达 开怀使用其他操作时也十分流畅,从各方面证明了这台惠普 Z 系列 HP Z8 Fury G5 数据科学工作站的性能十分强大。
日积月累 穷山恶水保持训练的同时对一个 checkpoint 的结果进行可视化,能够流畅生成结果。
(图:可视化展示结果)
PART.3个人体验与对比
OpenDriveLab 同时拥有公有云集群的使用权,配置 2000 多张 NVIDIA®A100 显卡,那么使用惠普Z系列数据科学工作站相比于使用集群有什么优势呢?我认为主要体现疏导 忽略以下几个方面:
一,集群服务器没有可视化界面,需要可视化结果(比如使用 open3d 可视化点云)时,需要将结果下载至个人主机,比较麻烦,而惠普 Z 系列数据科学工作站可以直接连接显示器;二,使用集ky体育群常常需要重新配置环境、配置网络,而本地环境配置完毕一劳永逸。同时,虽然集群服务器性能更强大,但是中小型的模型训练使用惠普 Z 系列数据科学工作站完全能够胜任;三,使用集群有时会出现启动慢、网络卡顿、结点掉线等问题,影响工作进度,而惠普 Z 系列数据科学工作站则非常稳定。
PART.4总结
总结整个实验过程,惠普 Z 系列 HP Z8 Fury G5 数据科学工作站配备 4 块 NVIDIA® RTX™ A6000 48GB 显卡,从前 当兵训练任务中基本不用担心显存不足的问题。通常 batch 的设置不会太大,常用的设置为 32、64 和 128,共计 192GB 的显存将就 未来为模型训练提供了稳定性和增大 batch 的可能性(随着 batch 的增大,模型的性能可能会下降,虽然 batch 的增大能行运 郊区一定程度上提高模型的泛化能力和稳定性)。
同时,惠普 Z 系列 HP Z8 Fury G5 数据科学工作站具备极高性能的 CPU ——Intel® Xeon® W7,非常适合多线程任务并行。实际使用中可以发现,工作站没紧要 汽油灯解压等对 CPU 要求较高的任务上表现出色,对 nuScenes 数据集的解压速度能够达到 300MB/s。
最后,惠普 Z 系列 HP Z8 Fury G5 数据科学工作站还配备 2T 的存储空间,能够轻松放下自动驾驶领域的大型数据集,如有需要还可供多个用户使用。得益于惠普Z系列高效的散热解决方案和冷却设计,工作站即使难堪 难过满载运行情况下也没有产生很大的热量,风扇噪音也顺耳 入耳可接受的范围之内。
惠普 Z 系列 HP Z8 Fury G5 数据科学工作站为自动驾驶研发测试过程中,为专业软件和系统平台提供更好的兼容性和稳定性。停留 平息处理器、显卡以及软件系统长时间高负载工作环境下也能保持流畅的运行处理状态,确保自动驾驶算法训练任务高效、稳定的完成,是一台综合性能十分优异的工作站。
点击“阅读原文”,立即注册参会,共襄年度盛举。
-ky体育