在自动驾驶领域,GPU强劲的算力是自动驾驶芯片的一种自由选择,也可谓了享有着最强劲性能GPU的英伟达在这个领域的地位,英伟达Xavier也有可能沦为全球首个通过ISO26262标准的自动驾驶芯片。但是,特斯拉正在研发的这款人工智能芯片,也称作神经网络芯片,则可以在不用于CPU和GPU的情况下,通过用于微处理器设计的芯片,某种程度可以为汽车带给几乎自动驾驶能力,这款芯片将随着Autopilot3.0硬件版本一起公布。
在特斯拉近期公开发表的专利申请中,说明了特斯拉为何要退出CPU和GPU为特斯拉的机器学习系统获取算力:机器学习和人工智能的处置一般来说必须对大量数据展开数学运算,一般来说必须解决问题多个卷积层和池化层,机器学习和人工智能技术一般来说利用矩阵运算和转录函数等非线性函数,机器学习的应用于还包括自动驾驶和辅助驾驶员。在一些场景中,计算机处理器(CPU)被用来继续执行机器学习训练和推理小说。传统的计算机处理器需要十分慢地继续执行单一的数学运算,但一般来说不能同时处置受限数量的数据。
作为一种替代方法,可以用于图形处理单元(GPU),并需要分段地对更大的数据集继续执行完全相同的数学操作者。通过用于多个处理器内核,GPU可以并行执行多个任务,一般来说需要比传统计算机处理器更慢地已完成大型图形处理任务。然而,GPU和传统的计算机处理器最初都不是为机器学习或人工智能操作者而设计的。
机器学习和人工智能操作者,一般来说依赖在十分大的数据集上反复应用于一组特定的机器学习处理器操作者。因此,必须一种微处理器系统来反对在大型数据集上并行执行机器学习和人工智能特定的处置操作者,而不必须每个并行操作的多个处置核心的处理方式。在特斯拉这系列的专利被奖提名的专利人还包括PeterBannon,前苹果芯片架构师,现特斯拉芯片项目负责人;EmilTaples,曾长年兼任AMD芯片架构师;DebjitDasSarma,AMD前首席CPU架构师。
特斯拉一系列的专利,阐释了为解决问题退出GPU问题而设计的微处理器,下面是关于特斯拉全新人工智能芯片专利的讲解:01加快数字引擎特斯拉在专利申请中叙述了该发明者:本发明的各种实行例与加快数学引擎有关:在某些实行例中,所述加快数学引擎应用于图像处理,以便通过用于包括还包括ALU、输入寄存器和阴影寄存器的子电路的二维矩阵处理器加快图像的卷积。这种架构反对一种时钟简化的二维架构,在这种架构中,图像数据和权重以实时的方式相加,从而容许并行执行大量的数学运算。
以下是申请专利时的一些图纸和原理图:02星型延后内存采访计算出来阵列微处理器系统特斯拉在专利申请中叙述了该发明者:微处理器系统还包括计算出来阵列和硬件仲裁器:计算出来阵列还包括多个计算出来单元。多个计算出来单元中的每一个都对从存储器中传输速率的适当值展开操作者。
硬件仲裁程序被配备为掌控对来自计算出来单元的内存的一个或多个对应值收到最少一个内存催促。硬件仲裁器还被配备为根据内存催促的收到调度要收到的掌控信号。以下是申请专利时的一些图纸和原理图:03非倒数数据格式的计算出来阵列微处理器系统特斯拉在专利申请中叙述了该发明者:微处理器系统还包括计算出来阵列和硬件数据格式化器:计算出来阵列还包括多个计算出来单元,每个计算出来单元对从内存中传输速率的对应值展开操作者。由计算出来单元操作者的值作为一组要并行处理的值实时地获取给计算出来阵列。
硬件数据格式化程序配备为搜集值组,其中值组还包括内存中倒数摆放的值的第一个子集和内存中倒数摆放的值的第二个子集。不必须从第二个值子集倒数地在内存中定位第一个值子集。
以下是申请专利时的一些图纸和原理图:04Vertor计算出来单元特斯拉在专利申请中叙述了该发明者:微处理器系统还包括计算出来阵列和向量计算出来单元:计算出来阵列还包括多个计算出来单元。所述矢量计算出来单元与所述计算出来阵列通信,并还包括多个处置元素。
处置元素被配备为接管计算出来数组的输入数据元素,并并行处理接管的输入数据元素。以下是申请专利时的一些图纸和原理图:特斯拉的自动驾驶芯片的设计思路,为解决问题自动驾驶的问题获取了新的方向,这有可能是这个芯片最有一点研究的地方。之所以采行微处理器居多的设计思路,也许是因为这个设计更加合乎特斯拉自动驾驶路线的硬件设备。
本文来源:易币付官方网站-www.etiwari.com