爱游戏-摩尔线程万卡GPU集群新进展！性能可提升20倍

2024-09-10

[导读]7月18日动静，摩尔线程官方公布，与清华系AI系统软件公司清程极智正式成立计谋合作关系，旨在加快国产年夜范围GPU智算集群的财产化历程，鞭策AI算力生态的快速成长，为年夜模子行业供给更壮大、矫捷且高效的根本举措措施撑持。 7月18日动静，摩尔线程官方公布，与清华系AI系统软件公司清程极智正式成立计谋合作关系，旨在加快国产年夜范围GPU智算集群的财产化历程，鞭策AI算力生态的快速成长，为年夜模子行业供给更壮大、矫捷且高效的根本举措措施撑持。摩尔线程近期公布了从千卡至万卡的全功能GPU智算集群扩大方案，两边此番合作就将聚焦在万卡级超年夜范围GPU智算集群的开辟与优化。清程极智是一家致力在构建高效人工智能系统软件，赋能国产算力，支持年夜模子行业成长的公司，自立研发了智能编译器IntelliGen、高效并行练习系统FastMoE，可以或许显著加快Transformer类模子和夹杂专家MoE模子的处置速度，部门模子机能晋升最高可达15-20倍。今朝，清程极智的焦点产物已周全适配摩尔线程自研的MUSA平台。摩尔线程还公布，已与北京智源人工智能研究院顺遂完成基在Triton说话的高机能算子库FlagGems的适配工作。操纵摩尔线程自研的同一系统计较架构MUSA，两边只用了短短一个多礼拜，就成功完成了近60个算子的功能验证，精度合适交付尺度，并实现了对Bert-large模子的周全撑持。摩尔线程研发团队颠末充实调研论证，还构成了Triton编译器在MUSA架构上适配的完全方案，力图实现开辟者在基在摩尔线程全功能GPU进行Triton开辟算子进程中，也能取得与本来一致的体验，做到CUDA框架、MUSA框架的无缝迁徙。在摩尔线程MUSA架构上，FlagGems算子库揭示出了接近手写算子的计较机能，并且机能还在延续调优，极年夜加快了开源年夜模子在摩尔线程全功能GPU上的摆设速度。智源研究院是北京市在2018年11月鞭策成立的新型研发机构，焦点方针是聚焦AI原始立异和焦点手艺，鞭策AI理论、方式、东西、系统和利用获得变化性、倾覆性冲破，支持北京扶植成为全球AI学术思惟、根本理论、顶尖人材、企业立异和成长政策的泉源。智源研究院的FlagGems算子库是一个利用Triton编程说话实现的高机能通用算子库，旨在为年夜说话模子供给一系列可利用在PyTorch框架的算子，加快模子的推理与练习，下降新算法的开辟门坎。它以Triton编程说话的易用性和编译器的尺度接口为根本，为多元芯片供给了一套易适配、高机能的算子解决方案，鞭策基在Triton的同一、开源的软硬件生态扶植。

欲知详情，请下载word文档

下载文档

8月9日动静，据媒体报导，英特尔行将推出的Arrow Lake-H系列处置器，将具有Skymont和Crestmont两种E焦点。

要害字： CPU GPU

7月30日动静，摩尔线程、东华软件云筑AI立异中间结合公布，两边已完成AI年夜模子推理测试与适配。

要害字：摩尔线程 GPU

May 30, 2024 ---- 按照TrendForce集邦咨询研究，NVIDIA Hopper平台H100在本年第一季欠缺景象逐步纾解，属同平台的新品H200在第二季后逐步放量，第三季新江南体育平台Blackwell将进入...

要害字：数据中间 GPU

5月29日动静，摩尔线程与国内领先的数据智能办事商滴普科技配合公布，摩尔线程“夸娥”(KUAE)千卡智算集群与滴普企业年夜模子Deepexi v1.0已完成练习、推理适配，取得产物兼容互认证实。

要害字：摩尔线程

5月27日动静，摩尔线程、无问芯穹结合公布，两边已正式完成MT-infini-3B 3B(30亿参数)范围年夜模子的实训，基在摩尔线程国产全功能GPU MTT S4000构成的千卡集群，和无问芯穹的AIStudio P...

要害字：摩尔线程

爱游戏-BPO行业整合方案提供者

爱游戏-摩尔线程万卡GPU集群新进展！性能可提升20倍