九九九久久高清无码-哥啊啊啊不想太大了骚逼-大桥未久一区二区在线观看-我要操死你逼视频 午夜成人福利_午夜成人福利视频_午夜成人免费

你的位置:首頁 > EMC安規(guī) > 正文

Day-0支持|摩爾線程率先完成智譜GLM-5.2極速適配

發(fā)布時間:2026-06-17 來源:轉(zhuǎn)載 責(zé)任編輯:lily

【導(dǎo)讀】6月17日,摩爾線程宣布在AI訓(xùn)推一體全功能GPU智算卡MTT S5000上,完成對智譜新一代開源旗艦?zāi)P虶LM-5.2的Day-0極速適配。此次適配延續(xù)了摩爾線程在GLM-5.1長上下文Prefill與P/D異構(gòu)分離推理場景中的優(yōu)化積累,并面向GLM-5.2超長上下文與復(fù)雜推理負(fù)載,進(jìn)一步釋放MTT S5000在長輸入Prefill階段的高吞吐優(yōu)勢。


摩爾線程技術(shù)團隊基于高性能SGLang-MUSA推理引擎及TileLang-MUSA算子編程語言,快速完成模型結(jié)構(gòu)適配、關(guān)鍵算子優(yōu)化、框架拉起與部署驗證,在MTT S5000上實現(xiàn)GLM-5.2的高效、高精度推理。這一成果彰顯了國產(chǎn)全功能GPU算力基礎(chǔ)設(shè)施對前沿SOTA模型的快速響應(yīng)能力,也為軟硬協(xié)同應(yīng)對復(fù)雜AI推理場景提供了可復(fù)制的工程實踐。


1781674314952639.jpg


作為智譜迄今能力最強的開源模型,GLM-5.2專為長程任務(wù)(Long Horizon Task)能力而生。它支持真正可用的1M Solid超長上下文,可穩(wěn)定支撐長達(dá) 8 小時的超長生命周期任務(wù)。在全球百萬用戶參與盲測的前端開發(fā)評估系統(tǒng)Code Arena上,GLM-5.2取得全球可用模型第一的表現(xiàn);相比前代GLM-5.1,新模型在前端、后端及長程開發(fā)場景下的成功率均有長足提升,能夠提供更實用、更具確定性的Coding能力,讓復(fù)雜系統(tǒng)工程與深度調(diào)試更穩(wěn)、更強。


1781674268722412.jpg


為充分釋放GLM-5.2的長上下文與復(fù)雜推理潛能,MTT S5000從硬件算力、軟件棧到開源框架進(jìn)行了全鏈路適配與深度優(yōu)化:


支撐超長上下文:釋放長輸入Prefill階段高吞吐優(yōu)勢


GLM-5.2的Solid 1M上下文與長程任務(wù)能力,使長Prompt編碼、上下文讀入與KV Cache生成成為推理鏈路中的關(guān)鍵環(huán)節(jié)。長輸入請求在進(jìn)入生成階段前,需要先完成大規(guī)模Prefill計算;這一階段高度依賴并行矩陣計算、Attention算子效率、顯存容量與訪存帶寬。MTT S5000憑借硬件級原生FP8加速,單卡稠密算力高達(dá)1000 TFLOPS,配備80GB大容量顯存與1.6TB/s超高帶寬,可在長輸入Prefill階段集中釋放高吞吐優(yōu)勢,為百萬token級上下文處理提供充足緩存空間和穩(wěn)定數(shù)據(jù)吞吐。依托MUSA C++、Triton-MUSA與TileLang-MUSA等工具鏈,GLM-5.2相關(guān)算子結(jié)構(gòu)可快速遷移并針對長序列場景持續(xù)優(yōu)化,幫助降低長上下文請求的首Token等待時間(TTFT),提升AI Coding、RAG和長文檔分析等場景的在線推理效率。


賦能前沿Coding與Agent能力:以算子與調(diào)度優(yōu)化提升推理效率


面向GLM-5.2重點強化的編程、智能體和長程任務(wù)場景,摩爾線程基于GLM家族多代模型的適配與優(yōu)化經(jīng)驗,將模型結(jié)構(gòu)適配、算子優(yōu)化、框架拉起和部署驗證能力快速遷移至GLM-5.2。通過原生算子定制、TileLang-MUSA編程優(yōu)化和SGLang-MUSA推理框架協(xié)同,MTT S5000能夠在保障模型精度的前提下提升推理吞吐、降低響應(yīng)延遲,為客戶提供面向AI Coding、Agent工作流和長文檔分析的高效推理服務(wù)。從GLM-4.7、GLM-5、GLM-5.1到GLM-5.2,摩爾線程已連續(xù)實現(xiàn)對智譜GLM家族前沿大模型的發(fā)布當(dāng)日即時適配,沉淀出高效、可復(fù)用的工程底座。面向以GLM-5.2為代表的新一代長程任務(wù)模型,摩爾線程不僅提供基礎(chǔ)適配,更通過Prefill優(yōu)化與P/D異構(gòu)分離方案,提供從單卡性能、多卡擴展、KV Cache傳輸?shù)郊篢CO(總體擁有成本)優(yōu)化的端到端支撐。


未來,摩爾線程將依托MUSA軟件棧強大的生態(tài)兼容性,持續(xù)第一時間適配前沿模型能力,以高性能、可規(guī)模化的國產(chǎn)全功能GPU基礎(chǔ)設(shè)施,加速大模型應(yīng)用創(chuàng)新落地。



gg_20260512171736_266.png

特別推薦
技術(shù)文章更多>>
技術(shù)白皮書下載更多>>
熱門搜索

關(guān)閉

?

關(guān)閉