安装⇐新浪财经客户端第一时间接收最全面的市场资讯→【下载Χ地址】∨
本次AI日主要展示了人形机器×人Opt–imus、自动驾驶研发进⊗程、以及Dojo超算。
ਲ਼【OptimËus】
特斯拉人形机器人亮相首次亮相,并做了一个舞蹈动作。之后,该公司展¥示了一些机器人做其他任务的视∇频片段,比如捡箱子、浇水等。最后,特斯拉展示了将量产的机器人外形,不过功能还不全,只是进ઢ行简单展示。
Optimus后续的生产规模可能ਊ会达到数百万台,并且因为这台机器人所采用视觉算法、计算芯片、电池均与特斯拉汽车产品线共用,所以它并不是一个完全从零开始的产物,并且可以获得比其他类人型机器人更好的成本控制。未来Υ售价或低于2万美元。
ς最新一代采¼用了2Āe;.3kWh容量的电池,并采用了集成式的设计,能提高52伏特的电压。
ਗ਼░芯片部分则采用了特斯拉的全自动驾驶芯片,但是针对ⓞ具体的软件、硬件适配情况进行了更改。
针对机☺器§人的不同动作,对躯干的28个关节进行受力功耗模拟,并设计了6款单独的模拟肌肉的电机,可以ú在很小的体积以及重量下实现巨大的动力。
૪ⓘ 手掌设计લ部分通过六个致动器完成11个角度的自由动作,并能够举起超过20磅的物体,使用工具。
通过AI计算,该机器人ઝ可以将目标路径和相关的轨迹结合起来,生成最佳的计划,并且当外界存在意外的情况时,还能进行动作上的适应,实现在稳定性¼的基础上,实现机器人动作的自然性,是特ਨ斯拉视觉方案的室内体现。
目前Optimus的研ã发仍然处♦于初级阶段,还有很多需要优化的点。
Π 【→自动驾驶】♪
ú2021年,大概有20ધ00用户使用特斯拉研发的FSD Beta软件,直至202ਯ2年9月,160,000用户使用了该款软件。
🙀 FSD Beta可以实√现自动泊车、根据交通灯或交通标志行驶、在与其他⊗车辆交汇处转弯等功能。
ϑ 通过收集大量的数据,生 成对应的图像,训练强大的神经网络模型▧
特斯拉的推理系统可以在两个独立的计算机上分配单个神经元网络的执ς行,这两个相互独立的计算机与自动驾驶系统相互连接。
轨迹评分系ã统包括碰撞预测、舒适度૪分析、干预可能❄性、拟人鉴别器四个方面。
特斯拉的自动ù驾驶系统利用全方位的3D技术,预测周围环境Ë占用的可能性,识别车、人等、识别路上随机移动的物品⊄,以10毫秒的速度运行。
基Ï于图像处理,车辆&#ffe0 ;可以░识别移动物品与非移动物品,预测物品移动方向,并能够识别路面情况,在下坡路段降低速度行驶。
特斯拉建设了三台超级计算机,拥有14ી,000片GÄPU,其中10,000片用于训练系统及运行,4000Å片用于自动标签。
FDS Laζnes:目标通过神经网络系统产生全面的道路集和不同道路的连接点。该神经网络系统由视觉部分、地图部分、语言部分。视觉部分通过转换器将车辆上的8个摄像头的数据转换为视觉代表数据,传入下一个部分。在地图部分,通过已有的道路导航模型对数据进行处理,对传入数据进行强化,将传入得数据拓扑化。在语言部分,用这些复૮杂的数据集来预测道路情况以及相应的连通情况,并将这些信息编码为一种专属于特斯拉的语言。通过这一系统,可以将所有的操作简单的、完整的编译到训练引擎中。
↓
FDS道路神经系统可以在É9.6毫秒的延迟内处理达Κ7500万参数,并能耗保持在8w左右。
FDS神经系统总共能够同时处理超过10亿的参数,超过15w∴的神经网络层和超过3750万的神经节点。总体算力达到了100TOPS。为了达到这些,需要对每个层面进行ς优化。
ⓜ 特斯拉的自动标注系统也变得效率更高,采集环境信息、重构可用于ⓨ训练的3D模型、再在模型上让系统完成自动标注、再用少量的人工对于特殊标记进行校正的流程。在目前的特斯拉数据标注体系里已经跑通💼,而且效率相比之前有着巨幅提升。
数据引擎是指通过数据来提ï升神经网络性能的过程,使用数据引擎功能,车辆行动的准确率得到了∞快速的提升,从去年九月的88%左右提升到目前的🙀99%以上
FSD′ Betઍa 可能在今年底ø开启全球推送。
ℑ【Doj☏o】
Dojo的出现主要为两个目的,其一是比市售云计算更便૪宜,≡其二是比市售云计算更强大ƒ。
Dojo从设计之初就考虑了硬件层面要为深度的神经网络训练做考虑,所以整个Dojo系统从芯片到机组再↔到机房的传输带宽都十分可观,并且特斯拉也将Occupancy网络应用于Dojo系统之中,实现了AI硬件—与AI软件的更佳匹配ભ,最后在降低延迟和性能损失上取得的效果十分惊人。
电压Ç调节模块可以传输100ω0A电流,具有超高密度,利用多层垂直电源☻管理材料过渡。
特斯拉未来的目标是减少’54%的CTE,提升3倍性能。提高密度是提ઢ升系统性能的核心和基石π。
System Tray参数:75mm高度、54 PFLOPλS(BF16/CFP8)、13.4 TB/S(对分带宽)、100+ KW PoweΚr
Standard Interface Prીocessor参数:32GB(高带宽动态随机存取存储器)、9À00 TB/S(ΗTTP带宽)、50 GB/S(以太网带宽)、32GB/S(第四代PCI带宽)
High Interface Processor参数:640GB(高带宽动态随机存取存储«器)、1TB/S(以太网带宽)、18 TB/Sö(Aggregate Bandwidth To Til♫es)
ક " 【Dojo系统建立目标:解决很难形Āe;成规模的约束模型】
单一的加速器到前向&#ffe1;和后向通道,再到优化器,再到多个加速器上运行多个副本的流程;线性▦扩展的;更大激活度的模型想运行前向通道时会遇到适合单个加速器的批量大小往往小于批量规范面的问题;多个加速器上设置同步批量规范模式;通信瓶颈;模型并不是线性扩展的
∃
高密度集成是为了加速模型的计算约束和延迟约束部分;Dojo网格的一个片断可以被分割出来运行模型(只要分片足够大);统一的低延迟中的细粒度同步原语加速跨集成边界的并行性;TeρnΕsors是以RAM的形式存储Chardon,并在各层执行时及时复制;张量复制的另一个数据传输与计算重叠,编译器也可重新计算层。
è 稳定扩散模型:编译器以模型并行的方式映射;通信阶段从节点计算本地平均值和标准偏差开始;协调后继续并行;期望每个骰子上的350个节点协调是由平均值和标准偏差值ⓛ
编译器的操作:从编译器中提取通信树;真实硬件的时间节点,中间辐射减少的值由硬件加速;Μ这个操作在25个Dojo编译器上્只需要5微秒,同样的操作在24个GPU上需要150微秒。这是对GPU的一个数量级的ઢ改进。
峰值内存使用:Dojo是为解决更大的复杂模型而建立的;当前两个GPU集群的使用模式,一个是自动标注网◊络(用于生成地面真相的离线模ⓞ型)第二,î占有率网络(高算术强度的大型模型)。
测试结果:多模系统上对GPU¯和Dojo进行的测量显示已经可以超越任何100个使用当前硬件运行的老一代PRMS的性能;A100的吞吐量翻了一番;关键的编译器优化达到M100的à3倍以上的性能。
成果:一个Dojo瓦片取代6个GPU盒ϒ子上的ML计算机,而成本θ比一个GPU盒子还低。一个多月时间来训Σ练的网络现在只需要不到一个星期
问'题:计算bd;量过大导致运行在主å机上的数据加载器根本无法跟上ML硬件。
扩展传输协议;建立Dojo网络接口卡;添加了装有DINØA卡的数据加载主机;通过以太网交换机重新连接网状结构。优化后占用率从4%જ上升到97%,实际上期望这个数字很快就能达到10੫0%。
建立高算术强度自动标签网络:为单一巨型加▨速器服务;pytorch层完全达到了预期的速度;高性能的密集计算机期望只用4个Dojo就能提供同样的吞吐量…;计划在2023年的第一季度建立。
« 成果展示:π6块芯片密集集成;54 petaflops的计算;640千兆字节的高带宽内存;集群组件新版本并不断改进;下૦一代将实现10倍的改进
ਜ਼ 【Q&ੇAⓣ】
1:为什么用肌腱的方法驱动Ǝ机器人,我们都觉得采用肌腱驱动的方式可靠性较低?同时为什么用β弹簧?
A:首先金属线缆做肌૨腱,可靠性还是很高的。同时肌腱方案能量消耗较Ċb;低,我们可以在人手上找到用肌腱和弹簧类似的方案。我们用肌腱收缩,用弹簧舒张。
马斯克ૣ补充:因为我们要快速量产,所以不会等到所有问题都解决后。我们想把机器人部署在工厂,看看机器人有什么用。当然这是我们的第 一版bc;,后面一定会有2.0 、3.0 手部架构会升级。
2:机器人会有人格吗?会不会后ß面和我们Θ讲笑话⊇ ,成为我们的朋友 ?
ੈ A:当然,只要解决好核心人工智能和关键执行器的问ⓞ题,人们可能会给机器人穿各种衣服,未来ⓙ会很有趣。
3:想知道人和机器人之间是否会有干预›措施,比如ਗ਼在←人类不同意正在发生的事情时就行标记?
A":如果机器人做了坏事Í,我们♧会在远程监控机器人。
马斯克补充:我们希望我们的机器人变得Ζ比科幻片ੑ里更像人,随着AI 发展,我们可以模仿学习更像人类,它能够→执行简单的指令,甚至可以执行您想要的操作。所以你可以给它一个高级指令,然后它可以把它分解成一系列动作并采取这些动作。
4:之前你说机器人会显著提升社会经济产出量级。最开બ始的时候你说特◙斯拉的使命是推动世界向可♪持续能源转型。对于机器人来说,依然是这个使命吗?特斯拉会不会把自己的使命改成“推动世界向无限生产力转型”?
♬ A:机器人的出现当然进一步推动世界向可持续能源转型。另外我对于机器人几年઼以后能做的事情,我很激动;你们肯定也很想找到一个技术几年以后的发展。对我来说 , 我也很感兴趣。
৻î5:机器人后面会具થ备对话能力吗?机器人的终极目标是什么?
∈A:当然会有对话能力ઍ,机器人后面肯定会有一个很有意思的终局,也许最后和电影终结者类似吧。不过我们会很注意机器人的安全性,我们会有一个“停止按钮”。机器人里会有一个本地ROM,无法通过网络升级。这对安全性来说很重要。会很有意ઞ思,不会无聊。
6:Dojo项目的目标是什么?和亚马逊χ云一样出借算力吗?我看用7nm ,那么投入也很大 ?商业化b2;怎么做?
A:Dojo 是一个大型计算机,和亚马逊一样是合理的,这是最ਪ高效的。这个世界²正在和软件2.0 转型(软件2.0:用神经网络取代逻辑编程),后面一੧个软件会有很多神经网络。这需要Dojo。
7:机器人会理解我们Āe;的情感、艺术吗?机器人后续થ如何为我们的创造力服੦务?
A:如同DallE-2 ,机器人已经可以创造 ²艺术了。未来是很࠷有趣的。⁄
Ashok 补Æ充:机അ器人可以创造物理艺术,比◯如跳舞。人工智能画画是数字艺术。
🙀 8:特斯拉自动驾驶的模型是受到自然语言处理模型的启发,想知道这方面的历史,为什么这样做,使用语言−模型后提升了多少 ?
A:两个方面:第一个是我们之前用密集的网络训练道Í路,之前的模型搞不定稠密的数据。 同时道路预测是一个多模型问题,有时候a0;我们无法知道马路的另一边是什么,我们希望模型的预测是连贯的,语言模型可以提供。
૩ 9:▧FSD的神经网络怎么做单元测试的♪?
A:除了软件测试以外还有神经网络测试,对于一个神经网络,我们会把之前ν错误的历史数据都丢给他,看他是否会有更好的表现。同时,我们有影子模式,我们把Π神经网◊络静谧地推送给用户,用户也在协助我们做QA测试。在推给用户之前我们会做9轮测试,我们的基础设施保证环节高效。
10:提一个有关基础模型的问题,我们看到大模型现在都有比较好的表现,比如从GPT-3到Pa↓LM,我们发现大模型都可以做推理了。你³们觉得是否应该提高数据量和参数个数,这样的话可以得到一个可以解决所有问题的教师模型“Teacher Model” ,然后剪裁出一个学生模型,作为在大街上的ਬ基础模型?
A:我们的标注系统就是这样做的。我们云端标注模型是很大的,我们把一小部分部署在车端。关于基础模型,我们的数据集有好几PB,∗ 模型在这样大的数据集上的表现是很好的。别人说我们用摄像头无法做感知,但你看我们用大数据做的多好。我们在这样的模型ੜ上做裁剪,最后出来的就是你们看到的。
Χ 11:最开始老马说特斯拉正在ú做通用人工û智能(AGI),想知道公司如何保证安全性 ?
A:我觉得应该会有ο一个AI 法律机构,比如管理人形机器人、自动驾驶汽车等等。我们觉得应该有个裁判,就像我们在药物上做的一样☎。机器人到时候上街以后,将会通过摄像头搜集数据,这个数据集会是世界上最大的数据集。到时候⇔公司借助数据集和训练模型,将会对通用人工智能(AGI)有较大的贡献。
12:Sća;emi 卡车的感知和乘用车⊃的感知有什么ⓠ区别 ?
੦
A: 人类开车就是两个眼ⓡ睛+一个大脑,大脑反应还很慢。车用8个摄像头和高速计算器,肯定能做的更好。ી
13:机器人能否安装部署ਫ不同的软件和Α硬件?⊆
ીA:我们的神经网络‰不支持,下个问题。
14:现在就在美国和加拿大有FSD,推广到其他国家的瓶颈是什么?我还注意到你↵们想把低速和高速场景融ø合到同一个神经网络中,现在ⓦ的进展?
A:技术上年底就可以推广,但不同国家有法规要求。我们在等法规批准。技⊇术上来说,年底就行。我们下个月就会在北美推新版,进步很大૩。之前Autopilot 和FSD 差别很大,但现在越来越像了, 几个月前,我们在Autopilot 和 FSD上用了同一个视觉栈。但在道路检测上,Autopilot 和FSD还是不一样的。FSD用更复杂的模型。
另一位同事补充:带泊车功能的FSD年底就能推出来,到时候停车场到停车 场的自动驾驶就能实现。
马斯卡补充:每ⓓ英里干预次数是很重要的È指标,我们正在肉眼可见得提高。
15:ਪ问个ⓢ各人问题,如果老马你回到20岁,想给20岁的自己说什么话,提供什么建议?Ρ
A:Þ让他加入特斯拉,哈哈。多੍接触聪明人;多看书;压力不要太大,珍惜此刻,停下来闻闻路边玫瑰香也是很好的。我在做猎鹰火箭的时候,试验场在一个很美的沙滩边,我们没有在沙滩边喝过一次咖啡, 我应该喝一杯才对。
હ16:马斯克你现Σ在做机器人的状态和10年前做自动驾ર驶的时候一样,但自动驾驶发展似乎比想象的更难。你有什么办法让机器人和AGI来得更快?
A:AGI发展很快,AI 现在赢了所有的基于规则的游戏,画画、写文章,都能完成。AI 人才也很多,AI的能力Ó是线性增长的。特斯拉有很强的执行器研发能力,和四轮机器人相比,双足机器人只要把执行器作对,就能实现。
17:下一个超级工厂只有a0;机器人吗?什么憨时候我们可以订∪购自己的机器人?
A:我å们会在工厂里找一些简单的工¼作给机器人,比如装卸的工作。后面在扩展机器人的能力边界。至于什么时候可以买机器人?不知道,3年-5年吧。Η3-5 年后人们就能收到了。
18:机器人软件会开˜源吗⌋?
→
A:小心人们用机器人干坏ê事。有些和安全有关的问题需要处理, 所以概率Ä不大。
≅ 19:ਫ机器人的û带宽有多大?
A:需要搞清楚你想让机ⓞ器人做的事情,转换成比如 手臂抬多高这样的问题。之后才能ⓙ回答带宽问题ν。
γ
20:特斯拉那么伟大,是什么独一无二的东西促成的Φચ?
A:现在特斯拉很大,各方面专家也很多 。我们从电动车Ąe;做到无人电动车。我觉得我的作用是给伟大的工程师提供环境,让我们发展。有些公司员工的能力是被压制的。在硅谷就有些公司,员工在公司是ý没有发展的。χ特斯拉不是这样的公司,员工加入特斯拉以后 所发挥的能力在其他公司是没有的。
21:公司如何平衡FSD发生≤碰撞ⓑ的风险和驾驶表现 ? 你们觉得FSD监管是否应该更加透明?ąc;
A:首先特斯拉车的被动安全是所有车里⇑∩最强的。另外主动安全,我们公布 没有Autopilot的车、有Autopilot的车、有FSD的车的事故率,有FSD的车事故率最低。另外FSD可以避免事故发生,但被救下来的人是不知道自己被救的。所以我们要看总‘体的事故率。部署FSD 肯定比不部署更安全。
22:为什么机器人要做到左右平衡?人类有左右撇子,机器人也这样设计,其中一边不会更快损坏吗?另外人类有时候会有一些“神话“的想法,希望自己能有更长的手,ąc;可以轻易拿到更远地方的ý东西,特斯拉φ以后会做更像 神话故事里的机器人吗?
A:现在我们还是想尽快生产一个有用的机器人,来帮助人类。生产一个有用的机器人,是最难的,我们会衡量一个东西的效用,比如今天帮助了几个人,怎么帮助的,这回把我们拉回现实。对于一个企业来说,大规模量产一个¨大家ⓖ喜欢的,有用的东西是异常困难的。展望未来,后面如果我们做一个8个手臂的机器人,或者开放一个接口给其他公ë司用。其他公司基于机器人做插件都有可能。
›
本文编选‾自“价投帮”微信公众ⓦ号,智通财经编辑:陈雯芳
Āf;
24小时滚动播报最新的财经资讯§和视频,更多粉丝福利扫描二维码关注(sinafinancਜe)ਜ਼
新浪∠财经意ö见反馈留◈言板
AlΥl Rights Resⓟerved 新浪公司 版♡权所有