第320章 AI芯片


本站公告

    不得不说,“ai”芯片仿佛某种天谴之物般,哪怕这位神孽不断地高歌“创生圣言”,赋予林奇充足而庞大无比的创造力,甚至让他时刻都有着神明的错觉,那ai芯片在记忆宫殿里依旧艰难难产着。

    这种奥妙至巅峰的作品,一旦出世便能够影响整个魔法文明的存在,林奇脑海里对他的构想,终究是轻微了。

    放在外人看来,林奇的所作所为,就像是将一副从a到k,包括花色顺序排好的扑克牌,随意递给十余位路人切牌洗牌,随即他再接过来随便洗上十余秒,然后将所有的牌序恢复如初一样。

    甚至就像是随手递给一个初学者拧乱的魔方,结果对方随手便复原了出来。

    这些都并非不可能,而是出现的概率太小。

    林奇眼下的“ai芯片”,也是如此。

    就像是无数随意的乱洗牌里,慢慢地揉捏出规律的杰作来,也就大自然的鬼斧神工,才能担得起这一名字。

    很快。

    随着整个芯片大体架构的成型时,林奇也开始陷入一种莫名的震惊之中!

    一种类似谷歌曾经开发来alpha go的人工智能芯片?

    这让林奇忍不住想起博识图书馆地底奎因殿下的试炼,便是以围棋智力压服对手便可以拿到预言的线头。

    曾经的逻辑,仿佛在这一刻重新汇聚起来。

    tpu?

    这款谷歌17年专门为了机器学习而开发定制的专用集成电路(asic)仅仅用了一年便转移到云端作为商用,而它也遵循着cpu与gpu的路线。

    tpu。

    中文名字,张量处理单元。

    说来广大群众第一次接触张量这个名字,可能还是靠着看时间简史之类的科普著作。

    张量,来自于数学,以多线性方式将几何向量、标量和其他类似对象映射到结果张量的几何对象。

    当时林奇第一次也没听懂。

    不过他看了看还是大致明白过来,所谓张量,就是一个广义的矩阵。

    高中学习的向量是一维矩阵,数字的立方体是三维矩阵,甚至耽搁数字也是矩阵。

    这里冥冥中已经和那神经网络算法所切合,而张量之所以与纯矩阵有曲风,便在于他拥有动态特征——生活在结构中,与其他数学实体相互作用。

    而计算机科学里,张量则是一个n纬矩阵。

    林奇默默在纸面上重新打版,刚刚他已经将整个神秘的控制知识拱手托出,与着神孽交换。

    至于对方是否会靠此找到成神的专门要是与切记,他也都无所谓。

    火都烧到眉头了,谁还会估计明天的饭菜热不热。

    而随着书写,林奇的板书笔法也越发飘忽——

    训练后的神经网络以标签或预估值对数据分类,此乃推理。

    因此每个神经元都需要进行计算。

    输入数据乘以权重,表示信号强度。

    结果相加聚合神经元状态。

    使用激活函数调节神经元参数活动。

    如此一步接着一步,连绵不绝。

    按理说,三个输入而只有两个神经元与一个单层神经网络的话,权重与输入便要六次乘法……

    如此一来,矩阵里的乘片与取片,都需要大量的cpu周期与内存,而tpu这种芯片,便是为了减轻这种负荷而生。

    林奇忍不住皱眉看了眼周围。

    某种程度而言,计算量的负荷和电网的负荷很类似,最大的负荷便决定了整体的高峰所在(计算难度),也决定了接下来他完成“ai芯片”后所能够到达的高峰。

    而供与求有需要平衡,不然的话,第一道崩溃的便是自身。

    只是他很快又重新被tpu的构架所吸引而痴迷起来。

    只有深入一个项目,才能彻底体会他的乐趣。

    因此懂是第一步环节。

    这也是棋类活动里,容易入门的象棋比起围棋受众要光,而五子棋又比起象棋还有光。

    林奇越看,越发忍不住啧啧称奇。

    这tpu的架构居然采用了量子技术,在预设的最大值和最小值与八位整数之间的任意值的近似过程里,tpu居然包含了足足六万五千五百三十六个八位整数乘法器,直接将32位或者16位的计算压缩成为8位。

    实现了曲线的离散化。

    完美地减少了神经网络预测的成本。

    第二点,也是更关键的。

    正如林奇最初所推崇的硬件。

    tpu芯片直接封装了种种神经网络计算工具。

    诸如矩阵乘法单元,统一缓冲区,激活单元等,它们以后十数个高级指令组成,集中完成神经网络推理所需要的数学计算。

    同时它又采用了典型的risc处理器为简单计算提供指令。它的矩阵乘法器单元而不是传统的标量处理器,得以在一个时钟周期内,以矩阵操作,完成数十万个操作。

    打个比方,传统cpu是逐行打印,而tpu芯片则能够做到影印效果。

    如此种种特性,让它在神经网络计算收敛方面拥有非凡的效果,曾经几天才能训练出的成功,现在一小时不到就能够完成。

    林奇不禁感慨万分。

    难怪说站在巨人的肩膀上就是爽。

    让他自己来设计,如何能够突破看似最简单的加法器这个关卡?

    万丈高楼平地起,曾经的林奇开发cpu时,第一步入门选择完成的模块便是加法器,因为它的原理最简单,也是最容易实现的操作。

    然而整个tpu芯片,居然本质上也是做加法器?

    它的核心便是由乘加器组合形成的256×256的运算器阵列:乘法矩阵。

    这种冥冥中的呼应,也让林奇有些哭笑不得。

    芯片,本质上便是一个一个模块搭建而成,区别在于有的人是3010片的20周年海德薇限定版,而有的则是630片的普通版。

    随着最为核心的乘法矩阵模块成型,它周围的模块也一步一步成型。

    林奇这一次彻底看懂这种结构后,也忍不住摇头惊叹,难怪只要4块tpu训练出来的人工智能棋手便能够大杀四方,让人类都在围棋这项技艺上都黯然失色。

    要知道一步几千块的旗舰机动辄5工艺,而tpu的工艺不过是!

    甚至主频也才700mhz,这种频率甚至得去上个世纪的486机子里寻找。

    但真的合适的时候,对方便是一切。

    y58xs8.com