首頁 > 技術(shù) > 正文

全棧智能 好事成雙!聯(lián)想問天兩款A(yù)I服務(wù)器新品發(fā)布

2023-08-18 19:00:35來源:中關(guān)村在線  

8月18日,中國算力大會在銀川盛大開幕,在“智算無限全棧智能聯(lián)想AI算力戰(zhàn)略暨AI服務(wù)器新品發(fā)布會”上,聯(lián)想重磅發(fā)布兩款全新AI服務(wù)器產(chǎn)品——聯(lián)想問天WA7780 G3 AI大模型訓練服務(wù)器和聯(lián)想問天WA5480 G3 AI訓推一體服務(wù)器。


(資料圖片)

這兩款服務(wù)器是基于AI導(dǎo)向打造的全新產(chǎn)品,能夠助力構(gòu)建更加綠色高效的人工智能數(shù)據(jù)中心,滿足客戶從訓練到推理等多樣的算力需求。

AI賦智,綠色賦能:打造AI導(dǎo)向的算力基礎(chǔ)設(shè)施,領(lǐng)跑中國智能化變革

近年來,在“建設(shè)數(shù)字中國”的背景下,中國算力基礎(chǔ)設(shè)施的“地基”快速發(fā)展,行業(yè)智能化轉(zhuǎn)型迎來進一步深化。與此同時,據(jù)IDC報告顯示,隨著生成式人工智能應(yīng)用的爆發(fā),各行業(yè)對智算的需求首次超過通用算力1,AI算力已成為算力發(fā)展的主要方向。

今年年初,聯(lián)想發(fā)布了聯(lián)想服務(wù)器的首個本地化品牌“聯(lián)想問天”,以“本地創(chuàng)新、敏捷高效”為品牌內(nèi)涵,更好地滿足中國本土客戶的個性化需求。聯(lián)想通過AI導(dǎo)向的算力基礎(chǔ)設(shè)施,加速人工智能進入千行百業(yè)、覆蓋多元場景,最終實現(xiàn)普適、智慧相融合,引領(lǐng)算力行業(yè)走向普適、智慧和綠色的新未來。

會上,聯(lián)想集團副總裁、聯(lián)想中國區(qū)基礎(chǔ)設(shè)施業(yè)務(wù)群服務(wù)器事業(yè)部總經(jīng)理陳振寬表示:“在通用算力向AI算力發(fā)展的當下,聯(lián)想問天WA7780 G3 AI大模型訓練服務(wù)器和聯(lián)想問天WA5480 G3 AI訓推一體服務(wù)器兩款新品將分別滿足不同類型的AI應(yīng)用場景需求?!?/p>

聯(lián)想問天WA7780 G3 AI大模型訓練服務(wù)器:性能強勁,靈活高效

聯(lián)想問天WA7780 G3是一款專為AI大模型訓練所打造的服務(wù)器。AI算力已成為企業(yè)訓練開發(fā)使用人工智能的硬門檻。聯(lián)想問天WA7780 G3 AI大模型訓練服務(wù)器正是為打破AI算力供給困境而來,為訓練提供強勁的算力支撐。

澎湃算力

聯(lián)想問天WA7780 G3 AI大模型訓練服務(wù)器基于第四代英特爾®至強®可擴展處理器。NVIDIA HGX H800系統(tǒng)配備8顆H800 NVLink GPU,擁有高達640GB的HBM3高速顯存,通過NVLINK,GPU間互聯(lián)帶寬高達400GB/s。將AI算力提升了3.44倍,至高可達32P FLOPS AI算力。NVIDIA H800 GPU匹配第四代TensorCore配合Transformer引擎(FP8精度),與上一代產(chǎn)品相比,可為大模型AI訓練速度帶來高達9倍提升,可將大模型AI推理速度提升高達30倍。

靈活架構(gòu)

聯(lián)想問天WA7780 G3 AI大模型訓練服務(wù)器,為了滿足AI超大模型訓練場景下,GPU服務(wù)器間高速數(shù)據(jù)通信的需求,支持IB、RoCE等多種對外網(wǎng)絡(luò)連接方案。最高可以支持8張RDMA高速網(wǎng)卡,提供3.2Tb/s聚合帶寬。充分滿足了超大模型訓練并行計算時,跨節(jié)點的通信需求。同時,在本地存儲的設(shè)計上,采用了GPU Direct Storage (GDS)技術(shù)。通過GDS技術(shù),GPU與NVMe實現(xiàn)了快速低延遲互聯(lián),能夠有效提高訓練數(shù)據(jù)載入的速度,提升大模型訓練的性能。

節(jié)能高效

聯(lián)想問天WA7780 G3 AI大模型訓練服務(wù)器,在產(chǎn)品設(shè)計中采用了三重獨立風道設(shè)計,針對不同部件的散熱特征,進行了系統(tǒng)性的優(yōu)化,有效降低了由風扇帶來的散熱功耗。相比同級別產(chǎn)品,聯(lián)想問天WA7780 G3 AI大模型訓練服務(wù)器功耗降低約10%。同時,為了滿足未來智算中心對PUE值更低的要求,本產(chǎn)品預(yù)留了液冷冷板設(shè)計,未來將支持液冷,這將大幅度節(jié)省在AI大模型訓練過程中,因系統(tǒng)散熱帶來的額外能耗,PUE值有望低于1.1。

聯(lián)想問天WA5480 G3 AI訓推一體服務(wù)器:多元豐富,穩(wěn)定可靠

從機器視覺、推薦系統(tǒng),自然語言處理,再到更為復(fù)雜的AI大模型,不同AI應(yīng)用場景對于AI服務(wù)器有著不同要求。本次發(fā)布會一同亮相的聯(lián)想問天WA5480 G3 AI訓推一體服務(wù)器,是聯(lián)想問天品牌中的一款4U機架式AI服務(wù)器,支持多元的算力和豐富的生態(tài),能夠為AI模型的訓練推理提供極致可靠的算力,加速人工智能在千行百業(yè)的落地,從而推動各行業(yè)乃至整個社會的智能化變革進程。

多元算力

聯(lián)想問天WA5480 G3 AI訓推一體服務(wù)器采用2顆第四代英特爾至強可擴展處理器,支持最新PCIe5.0。通過PCIe擴展,最多可以支持10張包括最新NVIDIA H800 GPU在內(nèi)的,多類型、多品牌AI加速卡??梢造`活應(yīng)用于AI通用模型訓練、大模型推理、AI生成、云游戲、科學計算等多種應(yīng)用場景,為AI的多樣場景提供多元算力。

靈活拓撲

聯(lián)想問天WA5480 G3 AI訓推一體服務(wù)器在CPU-GPU互聯(lián)的硬件設(shè)計上也充分體現(xiàn)了靈活多變的設(shè)計理念。聯(lián)想問天WA5480 G3 AI訓推一體服務(wù)器基于不同AI工作負載,可以為客戶提供包括直通、Balance、Common多種CPU-GPU互聯(lián)方式,避免了因為CPU-GPU數(shù)據(jù)通信方式單一與工作負載不匹配,帶來的潛在性能瓶頸和系統(tǒng)效率下降。結(jié)合不同種類,不同數(shù)量的加速卡選擇,真正實現(xiàn)了對AI各種復(fù)雜場景的完美匹配。

極致可靠

聯(lián)想問天WA5480 G3 AI訓推一體服務(wù)器充分考慮了設(shè)計冗余,為AI算力提供了安全穩(wěn)定的運行環(huán)境。支持電源N+N冗余,節(jié)點內(nèi)電源間互為備份,對外可以連接雙路市電,保障服務(wù)器24小時在線運行。支持CPU、GPU、內(nèi)存等關(guān)鍵部件的功耗監(jiān)測,整機功耗封頂調(diào)控,動態(tài)保障服務(wù)器運行在合理的功耗區(qū)間,保證性能的穩(wěn)定,以及風扇N+1冗余等多種安全設(shè)計保障高環(huán)溫無間斷運行。

這兩款A(yù)I服務(wù)器新品是“聯(lián)想問天”品牌家族重要的組成部分,傳承了聯(lián)想服務(wù)器高性能、高可靠、高擴展、低功耗“三高一低”的特性,具備“本地創(chuàng)新、敏捷高效”的品牌內(nèi)涵。未來,聯(lián)想問天WA7780 G3 AI大模型訓練服務(wù)器和聯(lián)想問天WA5480 G3 AI訓推一體服務(wù)器將與聯(lián)想其它AI基礎(chǔ)設(shè)施產(chǎn)品組合多向賦能,助力AI算力覆蓋AI全域應(yīng)用。同時,配合聯(lián)想領(lǐng)先的液冷技術(shù),聯(lián)想AI導(dǎo)向的算力基礎(chǔ)設(shè)施,將持續(xù)助力AI算力綠色賦能,為普慧算力鑄造牢固的“基石”。

標簽:

相關(guān)閱讀

精彩推薦

相關(guān)詞

推薦閱讀