英特爾以強(qiáng)大產(chǎn)品力，迎接生成式AI的廣闊機(jī)遇|熱聞

2023-03-31 15:47:21來(lái)源：中關(guān)村在線(xiàn)

生成式AI能夠模仿人類(lèi)生成的內(nèi)容，在改變我們工作和生活方式的諸多方面提供了一個(gè)令人興奮的機(jī)會(huì)。然而，這種快速演進(jìn)的技術(shù)也揭示出，在數(shù)據(jù)中心成功利用AI需要極其復(fù)雜的計(jì)算。

英特爾面向未來(lái)進(jìn)行了大量投資，希望每個(gè)人都能利用這項(xiàng)技術(shù)，并能輕松進(jìn)行大規(guī)模部署。同時(shí)，英特爾正與產(chǎn)業(yè)伙伴接洽，以支持一個(gè)基于信任、透明和多種選擇的開(kāi)放式AI生態(tài)系統(tǒng)。

擁抱具有卓越性能的開(kāi)源生成式AI

【資料圖】

生成式AI例如GPT-3和DALL-E等語(yǔ)言模型已經(jīng)存在一段時(shí)間了，但ChatGPT（一種可以進(jìn)行類(lèi)似人類(lèi)對(duì)話(huà)的生成式AI聊天機(jī)器人）則引發(fā)巨大轟動(dòng)，讓人們開(kāi)始關(guān)注傳統(tǒng)數(shù)據(jù)中心架構(gòu)的瓶頸。ChatGPT還加快了對(duì)硬件和軟件解決方案的需求，這些解決方案使AI能夠充分發(fā)揮其潛力?；陂_(kāi)放方法和異構(gòu)計(jì)算的生成式AI使其更容易獲得，并更經(jīng)濟(jì)地部署最優(yōu)的解決方案。開(kāi)放生態(tài)系統(tǒng)允許開(kāi)發(fā)人員在優(yōu)先考慮功耗、價(jià)格和性能的同時(shí)，隨時(shí)隨地構(gòu)建和部署AI，從而釋放生成式AI的力量。

網(wǎng)絡(luò)研討會(huì)：英特爾將舉辦數(shù)據(jù)中心和人工智能事業(yè)部投資者網(wǎng)絡(luò)研討會(huì)

英特爾正在積極采取措施，并通過(guò)優(yōu)化主流的開(kāi)源框架、庫(kù)和工具來(lái)實(shí)現(xiàn)出色的硬件性能，同時(shí)消除復(fù)雜性，來(lái)確保自身是實(shí)現(xiàn)生成式AI的明智選擇。近日，頂級(jí)機(jī)器學(xué)習(xí)開(kāi)源庫(kù)Hugging Face發(fā)布的結(jié)果顯示了英特爾AI硬件加速器卓越的推理運(yùn)行速度，該結(jié)果基于對(duì)包含1760億個(gè)參數(shù)的BLOOMZ模型（一種基于轉(zhuǎn)換器的多語(yǔ)言大型語(yǔ)言模型（LLM）和包含70億參數(shù)的較小BLOOMZ模型進(jìn)行推理。其中，對(duì)于包含70億參數(shù)的較小BLOOMZ模型，Habana第一代Gaudi具有明顯的性?xún)r(jià)比優(yōu)勢(shì)。此外，Hugging Face Optimum Habana庫(kù)簡(jiǎn)化了大型LLM的部署，用戶(hù)僅需對(duì)代碼進(jìn)行極小的修改。

英特爾研究院的研究人員還使用Habana Gaudi2在LMentry（一種最近提出的語(yǔ)言模型基準(zhǔn)）零次學(xué)習(xí)設(shè)置下評(píng)估BLOOMZ。BLOOMZ的精度與GPT-3模型尺寸相似，如下圖所示，最大的176BBLOOMZ模型的性能優(yōu)于類(lèi)似大小的GPT-3模型。

在100K LMentry提示上，BLOOMZ模型（最多1760億個(gè)參數(shù)）使用HabanaGaudi加速器對(duì)生成的語(yǔ)言輸出進(jìn)行的自動(dòng)評(píng)估。

此外，Hugging Face亦介紹了Stability AI的Stable Diffusion，這是另一個(gè)用于從文本生成圖像的最先進(jìn)生成式AI模型之一，也是流行的 DALL-E圖像生成器的開(kāi)放訪(fǎng)問(wèn)替代方案，Stable Diffusion在內(nèi)置英特爾®高級(jí)矩陣擴(kuò)展（英特爾AMX）的第四代英特爾至強(qiáng)可擴(kuò)展處理器上運(yùn)行的平均速度提高了3.8倍。這種加速是在不更改任何代碼的情況下實(shí)現(xiàn)的。此外，通過(guò)使用英特爾Extension for PyTorch with Bfloat16（一種用于機(jī)器學(xué)習(xí)的自定義格式），自動(dòng)混合精度可以再提速一倍，并將延遲減少到5秒——比初始基線(xiàn)32秒快了近6.5倍。用戶(hù)可在HuggingFace網(wǎng)站上一個(gè)基于英特爾CPU（第四代至強(qiáng)處理器）的實(shí)驗(yàn)性Stable Diffusion演示中進(jìn)行自行嘗試。

Stability AI創(chuàng)始人兼首席執(zhí)行官Emad Mostaque表示：“在Stability AI，我們希望讓每個(gè)人都能構(gòu)建自己的AI技術(shù)。英特爾已經(jīng)使Stable Diffusion模型能夠高效運(yùn)行在他們的異構(gòu)產(chǎn)品上——從第四代Sapphire Rapids CPU一直到像Gaudi這樣的加速器，因此是實(shí)現(xiàn)AI民主化的一個(gè)絕佳合作伙伴。我們期待在下一代語(yǔ)言、視頻和代碼模型等方面與他們合作。”

OpenVINO進(jìn)一步加速了Stable Diffusion推理。結(jié)合使用第四代至強(qiáng)CPU，它的速度幾乎比第三代英特爾至強(qiáng)®可擴(kuò)展CPU提高了2.7倍。Optimum Intel是OpenVINO支持的一個(gè)工具，用于加速英特爾架構(gòu)上的端到端管道，它將平均延遲再降低3.5倍，總共降低近10倍。

解決價(jià)格、性能和效率問(wèn)題

此外，為滿(mǎn)足減少用電量的關(guān)鍵需求及不斷增長(zhǎng)的性能需求，還需要提供更加可持續(xù)的解決方案。一個(gè)開(kāi)放的生態(tài)系統(tǒng)可以消除阻礙進(jìn)步的障礙，使開(kāi)發(fā)人員能夠在每一項(xiàng)工作中都能夠使用最好的硬件和軟件工具進(jìn)行創(chuàng)新。

Gaudi2與第一代Gaudi構(gòu)建在相同的高效架構(gòu)上，可助力大規(guī)模工作負(fù)載的性能和效率達(dá)到全新高度，并在運(yùn)行AI工作負(fù)載時(shí)展現(xiàn)出強(qiáng)大的能效優(yōu)勢(shì)。

大規(guī)模AI工作負(fù)載還需要達(dá)到“一次構(gòu)建、隨處部署”方式，這種方式基于靈活、開(kāi)放的解決方案，能夠?qū)崿F(xiàn)更好的能效。第四代至強(qiáng)處理器是英特爾最具可持續(xù)性的數(shù)據(jù)中心處理器，有著更高的能效和節(jié)能效果。憑借英特爾AMX這樣的內(nèi)置加速器，在廣泛的AI工作負(fù)載和使用案例中，推理和訓(xùn)練性能可提高10倍，同時(shí)其每瓦性能相較英特爾前代產(chǎn)品最多可提升14倍3。

英特爾(Intel) i5-12400F 12代酷睿 CPU處理器 6核12線(xiàn)程單核睿頻至高4.4Ghz 10400F迭代升級(jí)款

[經(jīng)銷(xiāo)商]京東商城

[產(chǎn)品售價(jià)]￥1349元

進(jìn)入購(gòu)買(mǎi)

標(biāo)簽：