谷歌新研究:AI可以在6小时内设计出计算机芯片
作者:翔天盛世
发布时间:2021-05-11 15:00
浏览数:1165

图片出处@华盖创意

文丨学术研究今日头条

当代测算的改革在非常大水平上是由计算机软件和硬件配置的明显发展促使的。伴随着颠覆性创新的变缓和Dennard平均误差的扩张,全球正向着专用型硬件配置发展趋势,以达到指数级增长的测算要求。

殊不知,今日的芯片必须两年的時间来设计,因而大大缩短芯片设计周期时间,使硬件配置融入迅速发展趋势的深度学习行业是当今的一个发展趋向。

假如应用深度学习优化算法替代人为因素设计工作中来试着设计芯片,另外其自身可以出示减少芯片设计周期时间的方式,进而在硬件配置和深度学习中间建立一个更为集成化的关联来推动彼此之间的发展趋势,那又会怎么样呢?

近日,由GoogleAI的首席科学家Jeff Dean领导干部的精英团队一同编写了一份预印毕业论文,该毕业论文叙述了一种根据学习培训的芯片设计方式。

她们将芯片放置视作增强学习(RL)难题,用RL策略来提升芯片放置的品质。与之前方式不一样的是,该方式能够从以往的工作经验中学习培训,并伴随着時间的变化不断完善。尤其是,当训炼大量的芯片块时,该方式更善于为此前未见过的芯片块迅速转化成提升的布局。

她们宣称,该方式进行芯片设计的均值時间不上6个钟头,这比人们权威专家花几个星期時间进行设计要快得多。

芯片布局整体规划困境

在传统式的 “布局走线” 每日任务中,芯片设计工作人员应用手机软件来明确芯片电源电路在芯片中的布局,类似设计房屋建筑的平面设计图。

电子计算机芯片被分为许多块,每一块全是一个独立的控制模块,如运行内存分系统、测算模块或操纵逻辑系统。这种控制模块可以用网表、电源电路部件和标准单元 (如 NAND、NOR 和 XOR 等逻辑门) 的图型来叙述,全部这种部件全是根据输电线联接。

明确一块芯片的布局是一个称之为芯片布局整体规划的全过程,它是芯片设计全过程中最繁杂、最用时的环节之一,牵涉到将网表放置在一个芯片蒙版 (2d 网格图) 上,进而提高输出功率、特性及其地区 (PPA) 降到最低,另外遵循对相对密度和路由时延的限定。为了更好地寻找达到好几个总体目标的最好布局,必须考虑到很多自变量。

虽然这些方面的科学研究早已开展了几十年,可是人们权威专家依然必须花上几个星期的時间来迭代更新,以转化成达到各个方面设计规范的解决方法。这个问题的多元性源于网表图的尺寸,这种图的尺寸范畴从上百万到数十亿个连接点构成数千个群集,一般,评定总体目标指标值必须耗费数小时到一天的時间。

“大部分,在设计全过程中,你能应用一些设计专用工具来开展一些布局,但仍必须人力布局和走线权威专家同这种设计专用工具一起开展很反复多次的迭代更新,”Dean讲到,“从你要想的设计到具体将其物理学布局到芯片上,并在总面积、输出功率和输电线长短上面有适度的限定,并且还要达到全部的设计人物角色或一切已经开展的生产制造全过程,这是一个几个星期的全过程。而根据创建一个深度学习实体模型,能够让它学好玩特殊芯片的部件放置手机游戏。”

深层增强学习实体模型

科学研究工作人员设计了一个深层加强实体模型,该实体模型能够试着各种各样流程来查询什么流程能够产生更强的結果,这种流程并不是游戏中板上放置零件,只是科学研究怎样在全部芯片中设计放置恰当的电源电路布局。

该实体模型能够具体指导历经增强学习训炼的RL策略来提升芯片放置。其键入是芯片网表 (连接点种类和图临接信息内容)、要放置的当今连接点的ID,及其一些网表数据库,如联接数量、宏和标准单元群集。网表图和当今连接点根据一个根据边沿的图神经网络传送,该神经元网络是为编号键入情况而开发设计的,置入转化成一部分放置的图和备选连接点。

图神经网络转化成的置入与数据库置入串连在一起,产生对策略和使用价值互联网的键入

随后将边沿、宏和网表数据库置入相互连接,以产生单独情况置入,并将其传送给前馈控制神经元网络。前馈控制互联网的輸出是一种学习培训表明,它捕捉有效的特点并做为策略和使用价值互联网的键入。策略互联网在全部很有可能的网格图模块上转化成一个概率分布函数,当今连接点能够放置在这种网格图模块上。

在每一次训炼的迭代更新中,宏均依据RL策略先后放置,随后根据力导向性方式放置标准单元簇,该方式将电源电路模型为一个弹黄系统软件,以较大 水平降低输电线长短。RL训炼的具体指导标准是应用类似线长(即自感电动势线长,HPWL)的加权平均和类似时延(路由器資源耗费的占比),为每一个推行RL策略的芯片部位测算一个迅速但类似的奖赏数据信号放置的网表。

在每一次训炼迭代更新期内,一次将一个宏放置一次策略,并根据强制性定项方式放置标准单元簇。奖赏是依据类似输电线长短和时延的权重计算组合计算得到的。

结合实际,RL策略从空的芯片逐渐,按序先后放置部件,直至它进行网格图截止,而且直至最终代理商光波长 (与输出功率和特性有关) 的负权重计算总数和时延为零,才得到奖赏。为了更好地具体指导代理商挑选先放置什么部件,部件按尺寸升序排列,最先放置很大的部件,减少了之后沒有适合部位的概率。

训炼 RL 策略必须建立一个包括10,000 个芯片放置的数据,在其中键入是与给出放置有关的情况,标识是放置的奖赏 (即线长度时延)。科学研究工作人员最先挑选了五个不一样的芯片网表,随后运用AI优化算法为每一个网表建立2000个不一样的部位。

训炼数据信息尺寸与调整特性

虽然此项工作中并不彻底是新奇的,它是根据Google技术工程师在3月份发布的一篇毕业论文中明确提出的一项技术性,但该工作中推动了此项技术性的发展趋势,因为它代表着芯片上晶体三极管的放置能够在非常大水平上完成自动化技术。一旦公布公布,Google科学研究工作人员的技术性能够让资金短缺的新成立公司开发设计出自身的芯片,用以人工智能技术和别的独特主要用途。除此之外,它能够协助减少芯片设计周期时间,使硬件配置能够更好地融入迅速发展趋势的科研。

科学研究工作人员表明,当她们在大量的芯片上训炼架构时,可以加速训炼全过程,并迅速地造成高品质的結果。事实上,她们宣称与领跑的标准对比,它在生产制造中的Google偏微分控制部件 (TPUs)(一款Google订制设计的人工智能技术加快芯片)上完成了好于领跑基准线的PPA。

科学研究工作人员汇总道:“与目前的重新开始提升每一个新芯片的部位方式不一样,大家的工作中运用从放置之前的芯片中得到的专业知识,来使其伴随着時间的变化越来越更强。除此之外,大家的方式能够立即提升总体目标指标值、线长、相对密度和时延,而无须像别的方式那般界定这种作用的自然数。大家的方式不但使新的成本函数在可以用时便于融合,并且还使大家可以依据给出芯片块的要求,比如,时钟频率重要或功能损耗受到限制,来衡量他们的相对性必要性。”

而在Reddit上,这则信息也引起了网民强烈反响。有网民说,当他见到这则信息,他感觉十分酷。由于放置数以亿计的晶体三极管,使其能够联接并一切正常工作中是一项艰巨的任务,在其中布局和走线十分关键的,数据信号沿输电线挪动必须花费时间,而布局总体目标是使输电线长短最少,降低部件中间的等待的时间,这难以保证。可是依然会存有一些难题,比如布线不适合,这就必须人力来处理。而降低设计芯片需要的時间,就可以设计大量的芯片来加速迭代更新速率。

也是有网民表明,它能够协助设计工作人员轻轻松松设计用以神经元网络、深度学习、深度神经网络的芯片,加快AI的发展趋势。

手机软件与硬件配置的发展趋势紧密联系,深度神经网络三巨头Bengio、Hinton、LeCun就曾在AAAI 2交流会上一同讨论将来深度神经网络神经元网络的市场前景,她们均表明用以加快神经元网络训炼和逻辑推理的新式硬件配置能够转化成更高的实体模型,也许有一天有可能使数十万亿神经递质神经元网络变成很有可能,而Google的迅速设计电子计算机芯片也是助推了其发展趋势。

地址:北京珠江摩尔国际大厦
电话:18516882688
邮箱:xcni@qq.com
关注我们
Copyright @ 2010 - 2022 京ICP备11047770号-8 京公网安备11011402012373号