特斯拉2022 AI Day会议纪要:Optimus后续的生产规模可能会达到数百万台|特斯拉

发布日期:2022-10-03 11:05:24

安装⇐新浪财经客户端第一时间接收最全面的市场资讯→【下载Χ地址】∨

  本次AI日主要展示了人形机器×人Opt–imus、自动驾驶研发进⊗程、以及Dojo超算。

  ਲ਼【Opti૊mËus】

  特斯拉人形机器人亮相首次亮相,并做了一个舞蹈动作。之后,该公司展¥示了一些机器人做其他任务的视∇频片段,比如捡箱子、浇水等。最后,特斯拉展示了将量产的机器人外形,不过功能还不全,只是进ઢ行简单展示。

  Optimus后续的生产规模可能ਊ会达到数百万台,૎并且因为这台机器人所采用视觉算法、计算芯片、电池均与特斯拉汽车产品线共用,所以它并不是一个完全从零开始的产物,并且可以获得比其他类人型机器人更好的成本控制。未来Υ售价或低于2万美元。

  ς最新一代采¼用了2&#256e;.3kWh容量的电池,并采用了集成式的设计,能提高52伏特的电压。

  ਗ਼░芯片部分则采用了特斯拉的全自动驾驶芯片,但是针对ⓞ具体的软件、硬件适配情况进行了更改。

  针对机☺器§人的不同动作,对躯干的28个关节进行受力功耗模拟,并设计了6款单独的模拟肌肉的电机,可以ú在很小的体积以及重量下实现巨大的动力。

૪ⓘ  手掌设计લ部分通过六个致动器完成11个角度的自由动作,并能够举起超过20磅的物体,使用工具。

  通过AI计算,该机器人ઝ可以将目标路径和相关的轨迹结合起来,生成最佳的计划,并且当外界存在意外的情况时,还能进行动作上的适应,实现在稳定性¼的基础上,实现机器人动作的自然性,是特ਨ斯拉视觉方案的室内体现。

  目前Optimus的研ã发仍然处♦于初级阶段,‎还有很多需要优化的点。

Π  【→自动驾驶】♪

  ú2021年,大概有20ધ00用户使用特斯拉研发的FSD Beta软件,直至202ਯ2年9月,160,000用户使用了该款软件。

 🙀 FSD Beta可以实√现自动泊车、根据交通灯或交通标志行驶、在与其他⊗车辆交汇处转弯等功能。

ϑ  通过收集大量的数据,生 成对应的图像,训练强大的神经网络模型▧

  特斯拉的推理系统可以在੟两个独立的计算机上分配单个神经元网络੡的执ς行,这两个相互独立的计算机与自动驾驶系统相互连接。

  轨迹评分系ã统包括碰撞预测、舒适度૪分析、干预可能❄性、拟人鉴别器四个方面。

  特斯拉的自动ù驾驶系统利用全方位的3D技术,预测周围环境Ë占用的可能性,识别车、人等、识别路上随机移动的物品⊄,以10毫秒的速度运行。

  基Ï于图像处理,车辆&#ffe0 ;可以░识别移动物品与非移动物品,预测物品移动方向,并能够识别路面情况,在下坡路段降低速度行驶。

  特斯拉建设了三台超级计算机,拥有14ી,000片GÄPU,其中10,000片用于训练系统及运行,4000Å片用于自动标签。

  FDS Laζnes:目标通过神经网络系统产生全面的道路集和不同道路的连接点。૝该神经网络系统由视觉部分、地图部分、语言部分。视觉部分通过转换器将车辆上的8个摄像头的数据转换为视觉代表数据,传入下一个部分。在地图部分,通过已有的道路导航模型对数据进行处理,对传入数据进行强化,将传入得数据拓扑化。在语言部分,用这些复૮杂的数据集来预测道路情况以及相应的连通情况,并将这些信息编码为一种专属于特斯拉的语言。通过这一系统,可以将所有的操作简单的、完整的编译到训练引擎中。

  FDS道路神经系统可以在É9.6毫秒的延迟内处理达Κ7500万参数,并能耗保持在8w左右。

  FDS神经系统总共能够同时处理超过10亿的参数,超过15w∴的神经网络层和超过3750万的神经૞节点。总体算力达到了100TOPS。为了达到这些,需要对每个层面进行ς优化。

 ⓜ 特斯拉的自动标注系统也变得效率更高,采集环境信息、重构可用于ⓨ训练的3D模型、再在模型上让系统完成自动标注、再用少量的人工对于特殊标记进行校正的流程。在目前的特斯拉数据标注体系里已经跑通💼,而且效率相比之前有着巨幅提升。

  数据引擎是指通过数据来提ï升神经网络性能的过程,使用数据引擎功能,车辆行动的准确率得到了∞快速的提升,从去年九月的88%左右提升到目前的🙀99%以上

  FSD′ Betઍa 可能在今年底ø开启全球推送。

  ℑ【Doj☏o੕】

  Dojo的出现主要为两个目的,其一是比市售云计算更便૪宜,≡其二是比市售云计算更强大ƒ。

  Dojo从设计之初就考虑了硬件层面要为深度的神经网络训练做考虑,所以整个Dojo系统从芯片到机组再↔到机房的传输带宽都十分可观,并且特斯拉也将Occupancy网络应用于Dojo系统之中,实现了AI硬件—与AI软件的更佳匹配ભ,最后在降低延迟和性能损失上取得的效果十分惊人。

  电压Ç调节模块可以传输100ω0A电流,具有超高密度,利用多层垂直电源☻管理材料过渡。

  特斯拉未来的目标是减少’54%的CTE,提升3倍性能。提高密度是提ઢ升系统性能的核心和基石π。

  System Tray参数:75mm高度、54 PFLOPλS(BF16/CFP8)、13.4 TB/S(对分带宽)、100+ ઩KW PoweΚr

  Standard Interface Prીocessor参数:32GB(高带宽动态随机存取存储器)、9À00 TB/S(ΗTTP带宽)、50 GB/S(以太网带宽)、32GB/S(第四代PCI带宽)

  High Interface Processor参数:640GB(高带宽动态随机存取存储«器)、1TB/S(以太网带宽)、18 TB/Sö(Aggregate Bandwidth To Til♫es)

ક " 【Dojo系统建立目标:解决很难形&#256e;成规模的约束模型】

  单一的加速器到前向&#ffe1;和后向通道,再到优化器,再到多个加速器上运行多个副本的流程;线性▦扩展的;更大激活度的模型想运行前向通道时会遇到适૜合单个加速器的批量大小往往小于批量规范面的问题;多个加速器上设置同步批量规范模式;通信瓶颈;模型并不是线性扩展的

  高密度集成是为了加速模型的计算约束和延迟约束部分;Dojo网格的一个片断可以被分割出来运行模型(只要分片足够大);统一的低延迟中的细粒度同步原语加速跨集成边界的并行性;TeρnΕsors是以RAM的形式存储Chardon,并在各层执行时及时复制;张量复制的另一个数据传输与计算重叠,编译器也可重新计算层。

 è 稳定扩散模型:编译器以模型并行૜的方式映射;通信阶段从节点计算本地平均值和标准偏差开始;协调后继续并行;期望每个骰子上的350个节点协调是由平均值和标准偏差值ⓛ

  编译器的操作:从编译器中提取通信树;真实硬件的时间节点,中间辐射减少的值由硬件加速;Μ这个操作在25个Dojo编译器上્只需要5微秒,同样的操作在24个GPU上需要150微秒。这是对GPU的一个数量级的ઢ改进。

  峰值内存使用:Dojo是为解决更大的复杂模型而建立的;当前两个GPU集群的使用模式,一个是自动标注网◊络(用于生成地面真相的离线模ⓞ型)第二,î占有率网络(高算术强度的大型模型)。

  测试结果:多模系统上对GPU¯和Dojo进行的测量显示已经可以超越任何100个使用当前硬件运行的老一代P੕RMS的性能;A100的吞吐量翻了一番;关键的编译器优化达到M100的à3倍以上的性能。

  成果:一个Dojo瓦片取代6个GPU盒ϒ子上的ML计算机,而成本θ比一个GPU盒子还低。一个多月时间来训Σ练的网络现在只需要不到一个星期

  问'题:计算&#25bd;量过大导致运行在主å机上的数据加载器根本无法跟上ML硬件。

  扩展传输协议;建立Dojo网络接口卡;添加了装有DINØA卡的数据加载主机;通过以太网交换机重新连接网状结构。优化后占用率从4%જ上升到97%,实际上期望这个数字很快就能达到10੫0%。

  建立高算术强度઱自动标签网络:为单一巨型加▨速器服务;pytorch层完全达到了预期的速度;高性能的密集计算机期望只用4个Dojo就能提供同样的吞吐量…;计划在2023年的第一季度建立。

«  成果展示:π6块芯片密集集成;54 petaflops的计算;640千兆字节的高带宽内存;集群组件新版本并不断改进;下૦一代将实现10倍的改进

 ਜ਼ 【Q&ੇAⓣ】

  1:为什么用肌腱的方法驱动Ǝ机器人,我们都觉得采用肌腱驱动૤的方式可靠性较低?同时为什么用β弹簧?

  A:首先金属线缆做肌૨腱,可靠性还是很高的。同时肌腱方案能૝量消耗较&#266b;低,我们可以在人手上找到用肌腱和弹簧类似的方案。我们用肌腱收缩,用弹簧舒张。

  马斯克ૣ补充:因为我们要快速量产,所以不会等到所有问题都解决后。我们想把机器人部署在工厂,看看机器人有什么用。当然这是我们的第 一版&#25bc;,后面一定会有2.0 、3.0 手部架构会升级。

  2:机器人会有人格吗?会不会后ß面和我们Θ讲笑话⊇ ,成为我们的朋友 ?

ੈ  A:当然,只要解决好核心人工智能和关键执行器的问ⓞ题,人们可能会给机器人穿各种衣服,未来ⓙ会很有趣。

  3:想知道人和机器人之间是否会有干预›措施,比如ਗ਼在←人类不同意正在发生的事情时就行标记?

  A":如果机器人做了坏事Í,我们♧会在远程监控机器人。

  马斯克补充:我们希望我们的机器人变得Ζ比科幻片ੑ里更像人,随着AI 发展,我们可以模仿学习更像人类,它能够→执行简单的指令,甚至可以执行您想要的操作。所以你可以给它一个高级指令,然后它可以把它分解成一系列动作并采取这些动作。

  4:之前你说机器人会显著提升社会经济产出量级。最开બ始的时候你说特◙斯拉的使命是推动世界向可♪持续能源转型。对于机器人来说,依然是这个使命吗?特斯拉会不会把自己的使命改成“推动世界向无限生产力转型”?

♬  A:机器人的出现当然进一步推动世界向可持续能源转型。另外我对于机器人几年઼以后能做的事情,我很激动;你们઩肯定也很想找到一个技术几年以后的发展。对我来说 , 我也很感兴趣。

  ৻î5:机器人后面会具થ备对话能力吗?机器人的终极目标是什么?

  ∈A:当然会有对话能力ઍ,机器人后面肯定会有一个很有意思的终局,也许最后和电影终结者类似吧。不过我们会很注意机器人的安全性,我们会有一个“停止按钮”。机器人里会有一个本地ROM,无法通过网络升级。这对安全性来说很重要。会很有意ઞ思,不会无聊。

  6:Dojo项目的目标是什么?和亚马逊χ云一样出借算力吗?我看用7nm ,那么投入也很大 ?商业化&#25b2;怎么做?

  A:Dojo 是一个大型计算机,和亚马逊一样是合理的,这是最ਪ高效的。这个世界²正在和软件2.0 转型(软件2.0:用神经网络取代逻辑编程),后面一੧个软件会有很多神经网络。这需要Dojo。

  7:机器人会理解我们&#256e;的情感、艺术吗?机器人后续થ如何为我们的创造力服੦务?

  A:如同DallE-2 ,机器人已经可以创造 ²艺术了。未来是很࠷有趣的。⁄

  Ashok 补Æ充:机അ器人可以创造物理艺术,比◯如跳舞。人工智能画画是数字艺术。

🙀  8:特斯拉自动驾驶的模型是受到自然语言处理模型的启发,想知道这方面的历史,为什么这样做,使用语言−模型后提升了૟多少 ?

  A:两个方面:第一个是我们之前用密集的网络训练道Í路,之前的模型搞不定稠密的数据。 同时道路预测是一个多模型问题,有时候&#25a0;我们无法知道马路的另一边是什么,我们希望模型的预测是连贯的,语言模型可以提供。

૩  9:▧FSD的神经网络怎么做单元测试的♪?

  A:除了软件测试以外还有神经网络测试,对于一个神经网络,我们会把之前ν错误的历史数据都丢给他,看他是否会有更好的表现。同时,我们有影子模式,我们把Π神经网◊络静谧地推送给用户,用户也在协助我们做QA测试。在推给用户之前我们会做9轮测试,我们的基础设施保证环节高效。

  10:提一个有关基础模型的问题,我们看到大模型现在都有比较好的表现,比如从GPT-3到Pa↓LM,我们发现大模型都可以做推理了。你³们觉得是否应该提高数据量和参数个数,这样的话可以得到一个可以解决所有问题的教师模型“Teacher Model” ,然后剪裁出一个学生模型,作为在大街上的ਬ基础模型?

  A:我们的标注系统就是这样做的。我们云端标注模型是很大的,我们把一小部分部署在车端。关于基础模型,我们的数据集有好几PB,∗ 模型在这样大的数据集上的表现是很好的。别人说我们用摄像头无法做感知,但你看我们用大数据做的多好。我们在੠这样的模型ੜ上做裁剪,最后出来的就是你们看到的。

Χ  11:最开始老马说特斯拉正在ú做通用人工û智能(AGI),想知道公司如何保证安全性 ?

  A:我觉得应该会有ο一个AI 法律机构,比如管理人形机器人、自动驾驶汽车等等。我们觉得应该有个裁判,就像我们在药物上做的一样☎。机器人到时候上街以后,将会通过摄像头搜集数据,这个数据集会是世界上最大的数据集。到时候⇔公司借助数据集和训练模型,将会对通用人工智能(AGI)有较大的贡献。

  12:S&#263a;emi 卡车的感知和乘用车⊃的感知有什么ⓠ区别 ?

  A: 人类开车就是两个眼ⓡ睛+一个大脑,大脑反应还很慢。车用8个摄像头和高速计算器,肯定能做的更好。ી

  13:机器人能否安装部署ਫ不同的软件和Α硬件?

  ીA੥:我们的神经网络‰不支持,下个问题。

  14:现在就在美国和加拿大有FSD,推广到其他国家的瓶颈是什么?我还注意到你↵们想把低速和高速场景融ø合到同一个神经网络中,现在ⓦ的进展?

  A:技术上年底就可以推广,但不同国家有法规要求。我们在等法规批准。技⊇术上来说,年底就行。我们下个月就会在北美推新版,进步很大૩。之前Autopilot 和FSD 差别很大,但现在੥越来越像了, 几个月前,我们在Autopilot 和 FSD上用了同一个视觉栈。但在道路检测上,Autopilot 和FSD还是不一样的。FSD用更复杂的模型。

  另一位同੐事补充:带泊车功能的FSD年底就能推出来,到时候஻停车场到停车 场的自动驾驶就能实现。

  马斯卡补充:૜每ⓓ英里干预次数是很重要的È指标,我们正在肉眼可见得提高。

  15:ਪ问个ⓢ各人问题,如果老马你回到20岁,想给20岁的自己说什么话,提供什么建议?Ρ

  A:Þ让他加入特斯拉,哈哈。多੍接触聪明人;多看书;压力不要太大,珍惜此刻,停下来闻闻路边玫瑰香也是很好的。我在੖做猎鹰火箭的时候,试验场在一个很美的沙滩边,我们没有在沙滩边喝过一次咖啡, 我应该喝一杯才对。

  હ16:马斯克你现Σ在做机器人的状态和10年前做自动驾ર驶的时候一样,但自动驾驶发展似乎比想象的更难。你有什么办法让机器人和AGI来得更快?

  A:AGI发展很快,AI 现在赢了所有的基于规则的游戏,઩画画、写文章,都能完成。AI 人才也很多,AI的能力Ó是线性增长的。特斯拉有很强的执行器研发能力,和四轮૎机器人相比,双足机器人只要把执行器作对,就能实现。

  17:下一个超级工厂只有&#25a0;机器人吗?什么憨时候我们可以订∪购自己的机器人?

  A:我å们会在工厂里找一些简单的工¼作给机器人,比如装卸的工作。后面在扩展机器人的能力边界。至于什么时候可以买机器人?不知道,3年-5年吧。Η3-5 年后人们就能收到了。

  18:机器੟人软件会开˜源吗⌋?

  A:小心人们用机器人干坏ê事。有些和安全有关的问题需要处理, 所以概率Ä不大。

 ≅ 19:ਫ机器人的û带宽有多大?

  A:需要搞清楚你想让机ⓞ器人做的事情,转换成比如 手臂抬多高这样的问题。之后才能ⓙ回答带宽问题ν。

γ

  20:特斯拉那么伟大,是什么独一无二的东西促成的Φચ?

  A:现在特斯拉很大,各方面专家也很多 。我们从电动车&#260e;做到无人电动车。我觉得我的作用是给伟大的工程师提供环境,让我们发展。有些公司员工的能力是被压制的。在硅谷就有些公司,员工在公司是ý没有发展的。χ特斯拉不是这样的公司,员工加入特斯拉以后 所发挥的能力在其他公司是没有的。

  21:公司如何平衡FSD发生≤碰撞ⓑ的风险和驾驶表现 ? 你们觉得FSD监管是否应该更加透明?&#261c;

  A:首先特斯拉车的被动安全是所有车里⇑∩最强的。另外主动安全,我们公布 没有Autopilot的车、有Autopilot的车、有FSD的车的事故率,有FSD的车事故率最低。另外FSD可以避免事故发生,但被救下来的人是不知道自己被救的。所以我们要看总‘体的事故率。部署FSD 肯定比不部署更安全。

  22:为什么机器人要做到左右平衡?人类有左右撇子,机器人也这样设计,其中一边不会更快损坏吗?另外人类有时候会有一些“神话“的想法,希望自己能有更长的手,&#261c;可以轻易拿到更远地方的ý东西,特斯拉φ以后会做更像 神话故事里的机器人吗?

  A:现在我们还是想尽快生产一个有用的机器人,来帮助人类。生产一个有用的机器人,是最难的,我们会衡量一个东西的效用,比如今天帮助了几个人,怎么帮助的,这回把我们拉回现实。对于一个企业来说,大规模量产一个¨大家ⓖ喜欢的,有用的东西是异常困难的。展望未来,后面如果我们做一个8个手臂的机器人,或者开放一个接口给其他公ë司用。其他公司基于机器人做插件都有可能。

  本文编选‾自“价投帮”微信公众ⓦ号,智通财经编辑:陈雯芳

&#256f;

24小时滚动播报最新的财经资讯§和视频,更多粉丝福利扫描二维码关注(sinafinancਜe)ਜ਼

新浪∠财经意ö见反馈留◈言板

AlΥl Rights Resⓟerved 新浪公司 版♡权所有

关于

发表评论

邮箱地址不会被公开。 必填项已用*标注