爱游戏-摩尔线程万卡GPU集群新进展!性能可提升20倍

[导读]7月18日动静,摩尔线程官方公布,与清华系AI系统软件公司清程极智正式成立计谋合作关系,旨在加快国产年夜范围GPU智算集群的财产化历程,鞭策AI算力生态的快速成长,为年夜模子行业供给更壮大、矫捷且高效的根本举措措施撑持。 7月18日动静,摩尔线程官方公布,与清华系AI系统软件公司清程极智正式成立计谋合作关系,旨在加快国产年夜范围GPU智算集群的财产化历程,鞭策AI算力生态的快速成长,为年夜模子行业供给更壮大、矫捷且高效的根本举措措施撑持。 摩尔线程近期公布了从千卡至万卡的全功能GPU智算集群扩大方案,两边此番合作就将聚焦在万卡级超年夜范围GPU智算集群的开辟与优化。 清程极智是一家致力在构建高效人工智能系统软件,赋能国产算力,支持年夜模子行业成长的公司,自立研发了智能编译器IntelliGen、高效并行练习系统FastMoE,可以或许显著加快Transformer类模子和夹杂专家MoE模子的处置速度,部门模子机能晋升最高可达15-20倍。 今朝,清程极智的焦点产物已周全适配摩尔线程自研的MUSA平台。 摩尔线程还公布,已与北京智源人工智能研究院顺遂完成基在Triton说话的高机能算子库FlagGems的适配工作。 操纵摩尔线程自研的同一系统计较架构MUSA,两边只用了短短一个多礼拜,就成功完成了近60个算子的功能验证,精度合适交付尺度,并实现了对Bert-large模子的周全撑持。 摩尔线程研发团队颠末充实调研论证,还构成了Triton编译器在MUSA架构上适配的完全方案,力图实现开辟者在基在摩尔线程全功能GPU进行Triton开辟算子进程中,也能取得与本来一致的体验,做到CUDA框架、MUSA框架的无缝迁徙。 在摩尔线程MUSA架构上,FlagGems算子库揭示出了接近手写算子的计较机能,并且机能还在延续调优,极年夜加快了开源年夜模子在摩尔线程全功能GPU上的摆设速度。 智源研究院是北京市在2018年11月鞭策成立的新型研发机构,焦点方针是聚焦AI原始立异和焦点手艺,鞭策AI理论、方式、东西、系统和利用获得变化性、倾覆性冲破,支持北京扶植成为全球AI学术思惟、根本理论、顶尖人材、企业立异和成长政策的泉源。 智源研究院的FlagGems算子库是一个利用Triton编程说话实现的高机能通用算子库,旨在为年夜说话模子供给一系列可利用在PyTorch框架的算子,加快模子的推理与练习,下降新算法的开辟门坎。 它以Triton编程说话的易用性和编译器的尺度接口为根本,为多元芯片供给了一套易适配、高机能的算子解决方案,鞭策基在Triton的同一、开源的软硬件生态扶植。

欲知详情,请下载word文档 下载文档

8月9日动静,据媒体报导,英特尔行将推出的Arrow Lake-H系列处置器,将具有Skymont和Crestmont两种E焦点。

要害字: CPU GPU

7月30日动静,摩尔线程、东华软件云筑AI立异中间结合公布,两边已完成AI年夜模子推理测试与适配。

要害字: 摩尔线程 GPU

May 30, 2024 ---- 按照TrendForce集邦咨询研究,NVIDIA Hopper平台H100在本年第一季欠缺景象逐步纾解,属同平台的新品H200在第二季后逐步放量,第三季新江南体育平台Blackwell将进入...

要害字: 数据中间 GPU

5月29日动静,摩尔线程与国内领先的数据智能办事商滴普科技配合公布,摩尔线程“夸娥”(KUAE)千卡智算集群与滴普企业年夜模子Deepexi v1.0已完成练习、推理适配,取得产物兼容互认证实。

要害字: 摩尔线程

5月27日动静,摩尔线程、无问芯穹结合公布,两边已正式完成MT-infini-3B 3B(30亿参数)范围年夜模子的实训,基在摩尔线程国产全功能GPU MTT S4000构成的千卡集群,和无问芯穹的AIStudio P...

要害字: 摩尔线程

上一篇:爱游戏-Ginghwa称重平台火热登场 下一篇:爱游戏-薪班班入选中国信通院《2024大模型典型示范应用案例集》