第320章 AI芯片

第二点,也是更关键的。

正如林奇最初所推崇的硬件。

tpu芯片直接封装了种种神经网络计算工具。

诸如矩阵乘法单元,统一缓冲区,激活单元等,它们以后十数个高级指令组成,集中完成神经网络推理所需要的数学计算。

同时它又采用了典型的risc处理器为简单计算提供指令。它的矩阵乘法器单元而不是传统的标量处理器,得以在一个时钟周期内,以矩阵操作,完成数十万个操作。

打个比方,传统cpu是逐行打印,而tpu芯片则能够做到影印效果。

如此种种特性,让它在神经网络计算收敛方面拥有非凡的效果,曾经几天才能训练出的成功,现在一小时不到就能够完成。

林奇不禁感慨万分。

难怪说站在巨人的肩膀上就是爽。

让他自己来设计,如何能够突破看似最简单的加法器这个关卡?

万丈高楼平地起,曾经的林奇开发cpu时,第一步入门选择完成的模块便是加法器,因为它的原理最简单,也是最容易实现的操作。

然而整个tpu芯片,居然本质上也是做加法器?

它的核心便是由乘加器组合形成的256&tis;256的运算器阵列:乘法矩阵。

这种冥冥中的呼应,也让林奇有些哭笑不得。

芯片,本质上便是一个一个模块搭建而成,区别在于有的人是3010片的20周年海德薇限定版,而有的则是630片的普通版。

随着最为核心的乘法矩阵模块成型,它周围的模块也一步一步成型。

林奇这一次彻底看懂这种结构后,也忍不住摇头惊叹,难怪只要4块tpu训练出来的人工智能棋手便能够大杀四方,让人类都在围棋这项技艺上都黯然失色。

要知道一步几千块的旗舰机动辄5n工艺,而tpu的工艺不过是28n!

甚至主频也才700hz,这种频率甚至得去上个世纪的486机子里寻找。

但真的合适的时候,对方便是一切。

由于各种问题地址更改为ida请大家收藏新地址避免迷路