- Cerebras发布新的Monster AI芯片 增加了1.4万亿个晶体管
- 来源:IEEE电气电子工程师
点击蓝字 关注我们SUBSCRIBE to US
Photo: Cerebras Systems
几乎从Cerebras Systems公司宣布推出一款基于有史以来最大的单芯片计算机的那一刻起,这家硅谷初创公司就宣布了将打造一款更为强大的处理器。就在近日,该公司发布了号称全球最大的芯片 -- Wafer Scale Engine 2 (WSE 2),而且是专门为 AI 计算打造的,将在今年第三季度上市。该处理器为超级计算任务而构建,具有破纪录的 2.6 万亿个晶体管(市场上最大的 GPU 只有 540 亿个晶体管)和 85 万颗 AI 优化内核,大小类似餐盘,采用台积电的 7nm 工艺。WSE 2在物理上和它的前身一样大,但是它的容量却大大增加了。该公司的目标是在用于机器学习的神经网络规模不断扩大的情况下依旧保持领先状态。
“在人工智能计算领域,大芯片是王者,因为它们处理信息的速度更快,可以在更短的时间内产生答案,而时间是人工智能进步的敌人,”硬件工程副总裁Dhiraj Malik在一份声明中如此表示。
Cerebras一直致力于将机器学习问题的逻辑解决方案发挥到极致。2015年,Andrew Feldman与其他人共同创立了这家公司。那时候,对大型公司来说,训练神经网络需要花费还太长 -- 需要几周时间。其中最大的瓶颈是数据必须在处理器和外部DRAM内存之间来回穿梭,消耗时间和精力。最初的Wafer Scale Engine的发明者认为,解决办法是使芯片足够大,能够在AI处理器核心旁边容纳所需的所有数据。随着用于自然语言处理、图像识别和其他任务的巨大网络即将出现,您将需要个非常大的芯片。多大呢?46225平方毫米。
wafer的尺寸是唯一一个从WSE到新版本WSE2没有改变的统计数据,你可以在这里的表格中看到(与更传统的人工智能处理器相比,Cerebras使用了Nvidia的人工智能图表(排名前100位):
这是如何实现的?
最明显和最重要的驱动力是从台积电(TSMC)的16纳米制造工艺(WSE问世时已有5年多的历史)转变为巨型铸造厂的7纳米工艺,超越了10纳米工艺。这样的跃迁基本上使晶体管密度加倍。根据台积电对其技术的描述,这种工艺的改变还将提高大约40%的速度,并降低60%的功率。
Cerebras 表示,如果没有与台积电多年来的紧密合作,公司就不会取得此次破纪录的成就。光是向7纳米的移动就意味着一个很大的改进,但据Feldman说,该公司还对其人工智能核心的微体系结构进行了改进。他不愿透露细节,但他表示,经过一年多与客户的合作,Cerebras已经吸取了一些教训,并将其纳入了新的核心。
这就引出了推动WSE和WSE 2之间变化的下一件事——客户。尽管在推出WSE时有过一些经验(当时都没有披露),但它现在的清单要长得多,为他们服务的经验也要丰富得多。客户名单大量向科学计算倾斜:
最后是公司规模的大幅增长。IEEE Spectrum于2019年访问了Cerebras,当时Cerebras在桑尼维尔有一座小楼。“这个团队的规模基本上已翻了一番,”Feldman说。该公司目前在硅谷、圣地亚哥、多伦多和东京拥有约300名工程师,网站上还列出了十多个空缺职位。
什么没有改变(很多)?
由于相当明显的原因,芯片本身的大小没有改变。300毫米仍然是大规模生产中的最大晶圆尺寸,因此芯片的外形尺寸不能改变。它仍然被划分成一个7×12的矩形网格,但那只是芯片制造过程中的一个伪影。承载WSE 2的计算机系统称为CS-2,实际上也没有太大变化。大多数芯片实际上是在一个 12 英寸的硅晶片上集合许多芯片,并在芯片上进行批量加工。但 Cerebras Systems 开发的这款芯片是连接在一个晶片上的单个芯片。互连接的设计是为了让所有的晶体管都能高速运转,这样 1.2 万亿个晶体管就能像一个整体一样运行。
Photo: Cerebras Systems
CS-2仍占标准机架的三分之一,耗电约20千瓦,依靠闭环液体冷却系统,并有一些相当大的冷却风扇。在为最初的WSE开发主机系统时,热是最大的问题之一。该芯片需要大约20000安培的电流从一百万个铜线连接到晶圆顶部的玻璃纤维电路板。随着晶圆和电路板的热膨胀,所有这些都保持一致,这意味着要发明新材料,而且需要一年多的开发时间。Feldman说,虽然CS-2需要一些新的工程技术,但它不需要大规模的发明(所有这些都没有改变,我们在Cerebras CS-1上所做的深入研究仍然很有意义。)
另一个遗留问题是CS-2如何使用成千上万的内核来训练神经网络。该软件允许用户使用PyTorch和TensorFlow等标准框架编写机器学习模型。然后,它的编译器将WSE 2的不同大小、物理上相邻的部分用于指定神经网络的不同层。它通过解决一个“地点和路线”优化问题来做到这一点,该问题确保所有层都以大致相同的速度完成它们的工作,这样信息就可以在网络中流动而不会停滞。大脑必须确保“软件足够健壮,不仅可以编译40万个内核,还可以编译85万个内核……在2-2.3倍大的东西上进行放置和路由,” Feldman说。
微信号|IEEE电气电子工程师新浪微博|IEEE中国 · IEEE电气电子工程师 ·
往期推荐
推荐阅读 分享科研之美,“我与IEEE的故事”主题分享活动邀你参与4-21 IEEE 语音编程可能成为软件开发的下一个前沿领域4-19 Rina Diane Caballar 太阳能制氢技术的效率显著提高4-26 Maria Gallucci 研究人员推出3D全息图生成新方法 可在智能手机上实时运行4-01 Charles Q. Choi
你“在看”我吗?
几乎从Cerebras Systems公司宣布推出一款基于有史以来最大的单芯片计算机的那一刻起,这家硅谷初创公司就宣布了将打造一款更为强大的处理器。就在近日,该公司发布了号称全球最大的芯片 -- Wafer Scale Engine 2 (WSE 2),而且是专门为 AI 计算打造的,将在今年第三季度上市。该处理器为超级计算任务而构建,具有破纪录的 2.6 万亿个晶体管(市场上最大的 GPU 只有 540 亿个晶体管)和 85 万颗 AI 优化内核,大小类似餐盘,采用台积电的 7nm 工艺。WSE 2在物理上和它的前身一样大,但是它的容量却大大增加了。该公司的目标是在用于机器学习的神经网络规模不断扩大的情况下依旧保持领先状态。
“在人工智能计算领域,大芯片是王者,因为它们处理信息的速度更快,可以在更短的时间内产生答案,而时间是人工智能进步的敌人,”硬件工程副总裁Dhiraj Malik在一份声明中如此表示。
Cerebras一直致力于将机器学习问题的逻辑解决方案发挥到极致。2015年,Andrew Feldman与其他人共同创立了这家公司。那时候,对大型公司来说,训练神经网络需要花费还太长 -- 需要几周时间。其中最大的瓶颈是数据必须在处理器和外部DRAM内存之间来回穿梭,消耗时间和精力。最初的Wafer Scale Engine的发明者认为,解决办法是使芯片足够大,能够在AI处理器核心旁边容纳所需的所有数据。随着用于自然语言处理、图像识别和其他任务的巨大网络即将出现,您将需要个非常大的芯片。多大呢?46225平方毫米。
wafer的尺寸是唯一一个从WSE到新版本WSE2没有改变的统计数据,你可以在这里的表格中看到(与更传统的人工智能处理器相比,Cerebras使用了Nvidia的人工智能图表(排名前100位):
这是如何实现的?
最明显和最重要的驱动力是从台积电(TSMC)的16纳米制造工艺(WSE问世时已有5年多的历史)转变为巨型铸造厂的7纳米工艺,超越了10纳米工艺。这样的跃迁基本上使晶体管密度加倍。根据台积电对其技术的描述,这种工艺的改变还将提高大约40%的速度,并降低60%的功率。
Cerebras 表示,如果没有与台积电多年来的紧密合作,公司就不会取得此次破纪录的成就。光是向7纳米的移动就意味着一个很大的改进,但据Feldman说,该公司还对其人工智能核心的微体系结构进行了改进。他不愿透露细节,但他表示,经过一年多与客户的合作,Cerebras已经吸取了一些教训,并将其纳入了新的核心。
这就引出了推动WSE和WSE 2之间变化的下一件事——客户。尽管在推出WSE时有过一些经验(当时都没有披露),但它现在的清单要长得多,为他们服务的经验也要丰富得多。客户名单大量向科学计算倾斜:
最后是公司规模的大幅增长。IEEE Spectrum于2019年访问了Cerebras,当时Cerebras在桑尼维尔有一座小楼。“这个团队的规模基本上已翻了一番,”Feldman说。该公司目前在硅谷、圣地亚哥、多伦多和东京拥有约300名工程师,网站上还列出了十多个空缺职位。
什么没有改变(很多)?
由于相当明显的原因,芯片本身的大小没有改变。300毫米仍然是大规模生产中的最大晶圆尺寸,因此芯片的外形尺寸不能改变。它仍然被划分成一个7×12的矩形网格,但那只是芯片制造过程中的一个伪影。承载WSE 2的计算机系统称为CS-2,实际上也没有太大变化。大多数芯片实际上是在一个 12 英寸的硅晶片上集合许多芯片,并在芯片上进行批量加工。但 Cerebras Systems 开发的这款芯片是连接在一个晶片上的单个芯片。互连接的设计是为了让所有的晶体管都能高速运转,这样 1.2 万亿个晶体管就能像一个整体一样运行。
CS-2仍占标准机架的三分之一,耗电约20千瓦,依靠闭环液体冷却系统,并有一些相当大的冷却风扇。在为最初的WSE开发主机系统时,热是最大的问题之一。该芯片需要大约20000安培的电流从一百万个铜线连接到晶圆顶部的玻璃纤维电路板。随着晶圆和电路板的热膨胀,所有这些都保持一致,这意味着要发明新材料,而且需要一年多的开发时间。Feldman说,虽然CS-2需要一些新的工程技术,但它不需要大规模的发明(所有这些都没有改变,我们在Cerebras CS-1上所做的深入研究仍然很有意义。)
另一个遗留问题是CS-2如何使用成千上万的内核来训练神经网络。该软件允许用户使用PyTorch和TensorFlow等标准框架编写机器学习模型。然后,它的编译器将WSE 2的不同大小、物理上相邻的部分用于指定神经网络的不同层。它通过解决一个“地点和路线”优化问题来做到这一点,该问题确保所有层都以大致相同的速度完成它们的工作,这样信息就可以在网络中流动而不会停滞。大脑必须确保“软件足够健壮,不仅可以编译40万个内核,还可以编译85万个内核……在2-2.3倍大的东西上进行放置和路由,” Feldman说。
往期推荐
推荐阅读
你“在看”我吗?
科技
-
-
- 线下展会,市民畅享科技大餐
- 5月28日,是2021中国国际大数据产业博览会线下展最后一天,也是免费向市民开放的公众日。趁此机会,记者继续带您探秘国际综合馆(W1馆)、数字应用馆(W2馆)、前沿技术馆(E1馆)、智慧产业馆(E2馆)4...
- 贵阳晚报
-
-
-
- 为何新药研发、基因测序、卫星遥感的发展提速都需要它?
- 人类第一次完整全基因组的测序花了13年,在新技术的加持下,这个时间已经降低到1天以内;没有这项新技术加持,电影《阿凡达》的渲染可能需要上万年;这项新技术还让新药的研发周期大幅缩短,让卫星遥感定位精度...
- 华为
-
-
-
- 大型金属3D打印厂商钢研极光亮相TCT,展示强大的生产服务能力
- 2021亚洲3D打印、增材制造展览会 (TCT Asia)于2021年5月26日-28日在国家会展中心(上海)7.1馆隆重举办。作为官方战略合作媒体,南极熊将会全程现场报道(地址https://www.nanjixiong.com/foru
- 南极熊3D打印
-
-
-
- 美国国家情报委员会《全球趋势2040——竞争更激烈的世界》报告摘译
- 2021年3月,美国国家情报委员会(NIC)发布了每四年一度的全球趋势预测报告《全球趋势2040——竞争更激烈的世界》。NIC是美国最高层级的战略情报机构,该委员会的成员均为来自政府、学术界和私营部门的高级专家...
- 全球技术地图
-
-
-
- 数字让监管更加智慧 上交所成功举办首届全行业技术大会
- 5月28日,上交所成功举办主题为“数字赋能,守正创新”的首届全行业技术大会。中国证监会副主席赵争平出席大会并致辞指出,证监会高度重视资本市场科技化转型与发展,确定了“数字让监管更加智慧”的愿景。...
- 上海证券报
-
-
-
- 湾区智行||中科创达赵鸿飞:汽车“新物种”需要共通的操作系统|中国汽车报
- “我是谁?我来自哪里?我要到哪里去?”这是哲学史上永恒的三大命题,同样也是我们甚至是企业需要不断思考的问题。此次采访对象——中科创达软件股份有限公司就是一家勤于思考、擅于思考的企业。这家企业在不断...
- 中国汽车报
-
-
-
- 广电总局表彰虚拟现实视频、超高清视频等5类96个优秀项目!
- 广电总局共评选出互动视频、沉浸式视频、虚拟现实视频、云游戏、超高清视频等5类96个优秀项目,分获一、二、三等奖和优秀奖,包括《中央广播电视总台5G+VR融合制播系统——春节联欢晚会 (2017- 2021)节目VR制作...
- 广电头条
-
-
-
- 占据市场最新赛道,“中国制造”机器人迎来爆发期
- 【环球时报记者 邢晓婧 杨沙沙】配餐机器人、迎宾机器人、扫地机器人……不知不觉间,中国老百姓对出现在餐馆、医院、火车站、养老院等场景的机器人逐渐习以为常,甚至家中也出现扫地、娱乐等家用机器人。有统计...
- 环球网
-
-
-
- 最受关注展项出炉,2021年北京科技周闭幕不落幕!
- 5月28日下午,2021年北京科技周闭幕式在中关村国家自主创新示范区展示中心举行。北京市科委、中关村管委会相关负责人介绍了本届北京科技周举办情况以及最受关注的展项。市科委、中关村管委会二级巡视员王建新出...
- 科普北京
-
-
-
- 魔高一尺,道高一丈:上交所VPN攻防札记
- 本文选自《交易技术前沿》总第四十二期文章(2020年12月)谢毅 / 上海证券交易所 yxie@sse.com.cn相晓辉 / 上海证券交易所 xhxiang@sse.com.cn虚拟专用网络(以下简称“VPN”)系统、互联网业务系统、外网
- Android编程精选
-
-
-
- 绿色召集令——聚力创赢,共赴绿色能源新征程!
- 申耀的科技观察读懂科技,赢取未来!申耀的科技观察,由科技与汽车跨界自媒体人申斯基创办,18年企业级科技媒体工作经验,专注企业数字化、产业智能化、智慧城市、汽车科技内容的观察和思考。
- 申耀的科技观察
-
-
-
- 汉朔科技和微软(中国)联合推动 IoT+AI 赋能全球零售
- (本文阅读时间:4分钟)2021年5月20日,全球领先的零售数字化解决方案供应商汉朔与微软(中国)在北京举行战略合作备忘录签约仪式,以进一步推动其在零售行业的全球布局和数字化战略。根据战略合作备忘录,汉朔...
- 微软科技
-
-
-
- 关于安全访问服务边缘(SASE),你需要知道的事情
- 在企业纷纷拥抱数字业务的过程中,由于边缘计算、云服务、混合网络的逐渐兴起,使得本就漏洞百出的传统网络安全架构更加岌岌可危,而且远远无法满足企业数字业务的需要。为了应对这种情况,一个全新的模型——安...
- FreeBuf
-
-
-
- [报告]2021年中国新能源汽车行业洞察(附44页PDF文件下载)
- 新能源车大势将至,造车新势力差异化突围。以下为报告节选:......文│Mob研究院本报告共计:44页。如欲获取完整版PDF文件,请扫描下方二维码加入“车友圈”获取。#重磅推荐#需要批量下载和及时更新最新汽车行业...
- 汽车之地
-