- Cerebras发布新的Monster AI芯片 增加了1.4万亿个晶体管
- 来源:IEEE电气电子工程师
点击蓝字 关注我们
SUBSCRIBE to US
Photo: Cerebras Systems
几乎从Cerebras Systems公司宣布推出一款基于有史以来最大的单芯片计算机的那一刻起,这家硅谷初创公司就宣布了将打造一款更为强大的处理器。就在近日,该公司发布了号称全球最大的芯片 -- Wafer Scale Engine 2 (WSE 2),而且是专门为 AI 计算打造的,将在今年第三季度上市。该处理器为超级计算任务而构建,具有破纪录的 2.6 万亿个晶体管(市场上最大的 GPU 只有 540 亿个晶体管)和 85 万颗 AI 优化内核,大小类似餐盘,采用台积电的 7nm 工艺。WSE 2在物理上和它的前身一样大,但是它的容量却大大增加了。该公司的目标是在用于机器学习的神经网络规模不断扩大的情况下依旧保持领先状态。
“在人工智能计算领域,大芯片是王者,因为它们处理信息的速度更快,可以在更短的时间内产生答案,而时间是人工智能进步的敌人,”硬件工程副总裁Dhiraj Malik在一份声明中如此表示。
Cerebras一直致力于将机器学习问题的逻辑解决方案发挥到极致。2015年,Andrew Feldman与其他人共同创立了这家公司。那时候,对大型公司来说,训练神经网络需要花费还太长 -- 需要几周时间。其中最大的瓶颈是数据必须在处理器和外部DRAM内存之间来回穿梭,消耗时间和精力。最初的Wafer Scale Engine的发明者认为,解决办法是使芯片足够大,能够在AI处理器核心旁边容纳所需的所有数据。随着用于自然语言处理、图像识别和其他任务的巨大网络即将出现,您将需要个非常大的芯片。多大呢?46225平方毫米。
wafer的尺寸是唯一一个从WSE到新版本WSE2没有改变的统计数据,你可以在这里的表格中看到(与更传统的人工智能处理器相比,Cerebras使用了Nvidia的人工智能图表(排名前100位):
这是如何实现的?
最明显和最重要的驱动力是从台积电(TSMC)的16纳米制造工艺(WSE问世时已有5年多的历史)转变为巨型铸造厂的7纳米工艺,超越了10纳米工艺。这样的跃迁基本上使晶体管密度加倍。根据台积电对其技术的描述,这种工艺的改变还将提高大约40%的速度,并降低60%的功率。
Cerebras 表示,如果没有与台积电多年来的紧密合作,公司就不会取得此次破纪录的成就。光是向7纳米的移动就意味着一个很大的改进,但据Feldman说,该公司还对其人工智能核心的微体系结构进行了改进。他不愿透露细节,但他表示,经过一年多与客户的合作,Cerebras已经吸取了一些教训,并将其纳入了新的核心。
这就引出了推动WSE和WSE 2之间变化的下一件事——客户。尽管在推出WSE时有过一些经验(当时都没有披露),但它现在的清单要长得多,为他们服务的经验也要丰富得多。客户名单大量向科学计算倾斜:
最后是公司规模的大幅增长。IEEE Spectrum于2019年访问了Cerebras,当时Cerebras在桑尼维尔有一座小楼。“这个团队的规模基本上已翻了一番,”Feldman说。该公司目前在硅谷、圣地亚哥、多伦多和东京拥有约300名工程师,网站上还列出了十多个空缺职位。
什么没有改变(很多)?
由于相当明显的原因,芯片本身的大小没有改变。300毫米仍然是大规模生产中的最大晶圆尺寸,因此芯片的外形尺寸不能改变。它仍然被划分成一个7×12的矩形网格,但那只是芯片制造过程中的一个伪影。承载WSE 2的计算机系统称为CS-2,实际上也没有太大变化。大多数芯片实际上是在一个 12 英寸的硅晶片上集合许多芯片,并在芯片上进行批量加工。但 Cerebras Systems 开发的这款芯片是连接在一个晶片上的单个芯片。互连接的设计是为了让所有的晶体管都能高速运转,这样 1.2 万亿个晶体管就能像一个整体一样运行。
Photo: Cerebras Systems
CS-2仍占标准机架的三分之一,耗电约20千瓦,依靠闭环液体冷却系统,并有一些相当大的冷却风扇。在为最初的WSE开发主机系统时,热是最大的问题之一。该芯片需要大约20000安培的电流从一百万个铜线连接到晶圆顶部的玻璃纤维电路板。随着晶圆和电路板的热膨胀,所有这些都保持一致,这意味着要发明新材料,而且需要一年多的开发时间。Feldman说,虽然CS-2需要一些新的工程技术,但它不需要大规模的发明(所有这些都没有改变,我们在Cerebras CS-1上所做的深入研究仍然很有意义。)
另一个遗留问题是CS-2如何使用成千上万的内核来训练神经网络。该软件允许用户使用PyTorch和TensorFlow等标准框架编写机器学习模型。然后,它的编译器将WSE 2的不同大小、物理上相邻的部分用于指定神经网络的不同层。它通过解决一个“地点和路线”优化问题来做到这一点,该问题确保所有层都以大致相同的速度完成它们的工作,这样信息就可以在网络中流动而不会停滞。大脑必须确保“软件足够健壮,不仅可以编译40万个内核,还可以编译85万个内核……在2-2.3倍大的东西上进行放置和路由,” Feldman说。
微信号|IEEE电气电子工程师
新浪微博|IEEE中国
· IEEE电气电子工程师 ·
往期推荐
推荐阅读
4-21 IEEE
4-19 Rina Diane Caballar
4-26 Maria Gallucci
4-01 Charles Q. Choi
你“在看”我吗?
科技
-
-
- EXONE已收购“AMClad”工具制造商Freshmade 3D
- Binder jet 3D打印机制造商ExOne宣布,已收购“ AMClad”工具制造商Freshmade 3D的资产。这家初创公司使用ExOne的系统开发了一种获得专利的快速3D打印砂模的方法,该方法可提供耐用的模具,成本降低了30%至5
- 未知大陆
-
-
-
- 一文带你提前快览2021首都网络安全日
- 4月28日,由北京市委网信办、市公安局联合举办的第八届“4.29首都网络安全日”系列活动正式召开。本次活动以“网络安全同担、网络生活共享”为口号,以迎接冬奥为年度主题,贴合时代发展蓝图、行业发展前景,围...
- 安全牛
-
-
-
- 乘势转型,冀往开来:懂行中国行2021·华为河北数字峰会成功举办
- 4月29日,以“转型新局 共育新机”为主题的懂行中国行2021·华为河北数字峰会在河北石家庄成功举办。2021年,数字化转型来到了潮汐交替的一年。来自河北各界的政企代表、专家学者、生态伙伴共聚一处,共话河北数...
- 华为中国政企业务
-
-
-
- 5G强势带动!三大运营商2021年Q1业绩全线飘红
- | 科 | 技 | 杂 | 谈 |中国通信行业第一自媒体本文作者:舒文琼本文来源:通信世界(CWW-weixin)杂谈投稿邮箱:631255063@qq.com从经营收入、通信服务收入、利润,到ARPU值、5G用户规模,三大运营商主要指标几
- 科技杂谈
-
-
-
- 三大运营商2021年“开门红”:中国5G跨过价值增长拐点
- 业绩不会骗人,中国三大运营商最近先后发布今年第一季度财务及运营数据,皆迎来“开门红”,而5G在其中贡献不小,带动效应开始显现。三家发报:5G带动效应显现今年第一季度,中国三大运营商都实现了营收和盈利的...
- C114通信网
-
-
-
- 全新美团无人配送车上路:下次见面就是在你家门口了
- 机器之心原创作者:李泽南这就是未来的收外卖方式,你准备好了吗?最近,在北京市顺义区测试运行的美团无人配送车成为了一些人「调戏」的对象。在被人们广为分享的视频中,一辆和拍摄车辆平行前进的无人配送车在...
- 机器之心
-
-
-
- Cerebras发布新的Monster AI芯片 增加了1.4万亿个晶体管
- SUBSCRIBE to USPhoto: Cerebras Systems几乎从Cerebras Systems公司宣布推出一款基于有史以来最大的单芯片计算机的那一刻起,这家硅谷初创公司就宣布了将打造一款更为强大的处理器。就在近日,该公司
- IEEE电气电子工程师
-
-
-
- RISC-V 能打 50 年!不必期待 RISC-VI —— 对话 RISC-V
- 《程序员》于 2000 年创刊,其理念为「技术改变世界,创新驱动中国」。2021 年,《程序员》2.0 全新起航,首期以「开发者的黄金十年」为主题,以音视频、图文专栏等丰富的多媒体形式为载体,立足当下,放眼未来...
- CSDN
-
-
-
- 个人消费品3D打印定制是伪需求?大转型的Shapeways上市估值4.1亿美元
- 喜讯:【南极熊3D打印】手机APP来了,功能很强大,内容很专业导读:有这么一家历史悠久的个性化定制3D打印服务公司,创始人被踢出公司、传言被亚马逊收购,作为专业垂直平台的南极熊都很久没有听到过它的声音了...
- 南极熊3D打印
-
-
-
- [报告]场景先行,高级别自动驾驶商业化加速落地(附31页PDF文件下载)
- 自动驾驶汽车(Autonomous Vehicles,AV)指通过搭载先进传感器等装置,运用人工智能 等新技术,具有自动驾驶功能的新一代汽车,又称为智能网联汽车、无人驾驶汽车。本篇报告中,我们提出对高级别自动驾驶产业的...
- 汽车之地
-
-
-
- 零信任发展趋势论坛沪上落地,大咖共议网络安全发展新路径
- 关键讯息,D1时间送达!国内外大咖云集,这场零信任高峰论坛等你来在产业数字化升级和业务上云的趋势下,传统基于边界的安全防护理念难以应对企业面临的各类安全风险,以“持续验证,永不信任”为核心的零信任作...
- 企业网D1net
-
-
-
- 特斯拉“数据霸权”两大疑云 调查:最先落成中国数据中心或为自建
- 图源:Unsplash30秒快读1行车数据属个人信息,特斯拉为何不给车主?2特斯拉中国数据中心今年二季度落成,中国车主信息何时全部迁回中国?3特斯拉“数据霸权”两大疑云。从特斯拉女车主车顶维权事件至今,已过去...
- IT时报
-
-
-
- 从VR自行车到VR一体机应用,VirZOOM对虚拟健身的新思路
- Esther|编辑疫情期间想去旅游?想去野外运动、呼吸新鲜空气?或许,现在有了这款VR健身应用,你可以穿越到世界上许多城市,甚至可以模拟在自然景观中高速公路上骑自行车、奔跑的场景。今天要介绍的《VZfit》是...
- 青亭网
-
-
-
- 美国制裁冲击华为业绩:2021年一季度营收下滑16.9%
- 这是华为连续第二个季度出现营业收入负增长,主要原因是美国制裁导致华为手机销量大减,华为被迫出售子品牌荣耀遭美国三轮制裁之后,华为营业收入连续第二个季度出现负增长。4月28日,华为投资控股有限公司向上...
- 财新科技
-
-
-
- 推全新边缘微服务器,浪潮为何继续加码边缘计算?
- 失之东隅,收之桑榆。2020年,虽然我国经济社会发展受去年疫情影响,但原本企业需数年才能完成的数字化转型,被压缩到数天和数周,让数字经济展现出强大活力。如今后疫情时代,自动驾驶、工业质检、智慧社区、智...
- 海峰看科技
-