770亿晶体管的中国第一算力通用GPU芯片！壁仞科技BR100亮相海外

大千世界 2022年08月24日 05:00 124 0

　　8月9日，国内科技创新企业壁仞科技(Birentech)正式发布了BR100系列通用计算GPU，号称算力国内第一，多向指标媲美甚至超越国际旗舰产品。

　　当地时间8月22日，第34届Hot Chips芯片大会首日演讲，NVIDIA Hopper、AMD Instinct MI200、Intel Ponte Vecchio三大巨头的通用GPU纷纷秀出肌肉，而与之并肩亮相的，就是壁仞科技BR100。

　　会上，壁仞科技联合创始人、CTO洪洲与壁仞科技联合创始人、总裁徐凌杰进行了题为“Biren BR100 GPGPU: Accelerating Datacenter Scale AI Computing”的主题演讲，为来自全球的专业听众介绍了BR100芯片的特点与原创芯片架构的细节。

　　

770亿晶体管的中国第一算力通用GPU芯片！壁仞科技BR100亮相海外-第1张图片-大千世界

　　

770亿晶体管的中国第一算力通用GPU芯片！壁仞科技BR100亮相海外-第2张图片-大千世界

　　根据介绍，作为主要用于加速数据中心规模通用计算的GPGPU芯片，BR100具有极高的算力密度，单卡16位浮点算力达到PFLOPS级别，并具备高速片上与片外互连带宽。

　　BR100采用7nm制程工艺、Chiplet小芯片设计和CoWoS 2.5D封装技术，以OAM模组形态部署，能够在通用UBB主板上形成8卡点对点全互连拓扑。

　　为了支持强大的算力，BR100配备了超过300MB的片上高速缓存，用于数据的暂存和重用，以及64GB的HBM2E高速内存。

　　它的核心计算单元由大量通用流式处理器组成，具备通用计算和2.5D GEMM架构的专用张量加速算力。

　　

770亿晶体管的中国第一算力通用GPU芯片！壁仞科技BR100亮相海外-第3张图片-大千世界

　　在原创架构层面，壁仞科技按照深度学习等通用负载的计算特点，提供一系列针对数据流的增强特性，包括特殊的C-Warp协同并发模式、张量数据存取加速器TDA、NUMA/UMA访存模式、近存储计算等。这些特性是BR100能够在算力和能效比上达到全球领先水准的关键。

　　此外，壁仞科技还介绍了一种新的TF32+数据类型，具备比TF32数据类型更高的精度。

　　

770亿晶体管的中国第一算力通用GPU芯片！壁仞科技BR100亮相海外-第4张图片-大千世界

　　在软件方面，壁仞科技还介绍了BIRENSUPATM软件栈，其核心编程模型具有C/C++编程接口和运行时API，风格与主流的GPGPU开发语言和编程范式类似。

　　它能够使开发者在BR100上非常容易地进行编程开发，同时大幅降低代码迁移工作量，实现从主流编程环境向BIRENSUPA平台的无缝迁移。

　　

770亿晶体管的中国第一算力通用GPU芯片！壁仞科技BR100亮相海外-第5张图片-大千世界

　　

770亿晶体管的中国第一算力通用GPU芯片！壁仞科技BR100亮相海外-第6张图片-大千世界

　　资料显示，壁仞科技BR100集成了多达770亿晶体管，规模上堪比人类大脑神经细胞，已经非常接近800亿个晶体管的NVIDIA GH100计算核心，而且BR100系列芯片一次就点亮成功了!

　　性能方面，INT8整数计算2048 Tops(每秒2048万亿次)、BF16浮点计算1024 TFlops(每秒1024万亿次)、TF32+浮点计算512 TFlops(每秒512万亿次)、FP32双精度浮点256 TFlops(每秒256万亿次)。

　　此外，它的外部IO带宽达2.3TB/s，支持64路编码、512路解码，还支持PCIe 5.0、CXL互连协议。

　　

770亿晶体管的中国第一算力通用GPU芯片！壁仞科技BR100亮相海外-第7张图片-大千世界

标签：壁仞科技

本文地址： https://www.dqsj.net/keji/77333.html

文章来源：快科技

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至23467321@qq.com举报，一经查实，本站将立刻删除;如已特别标注为本站原创文章的，转载时请以链接形式注明文章出处，谢谢！

上一篇中国科幻片《明日战记》获认可票房破5.2亿！古天乐：有考虑拍前传续集

下一篇苹果失算了？准备换iPhone 14的用户比往年少：老CPU+价格上涨是主因

抱歉，评论功能暂时关闭!