摘要:近日,國外權(quán)威的服務(wù)器專業(yè)網(wǎng)站ServeTheHome(簡稱STH)完成了對浪潮高端AI服務(wù)器NF5488M5的首發(fā)評測,稱“浪潮NF5488M5是一款真正獨一無二的產(chǎn)品”。憑借優(yōu)秀的外觀設(shè)計、超強的性能表現(xiàn)、卓越的散熱設(shè)計、獨特的管理特性...
近日,國外權(quán)威的服務(wù)器專業(yè)網(wǎng)站ServeTheHome(簡稱STH)完成了對浪潮高端AI服務(wù)器NF5488M5的首發(fā)評測,稱“浪潮NF5488M5是一款真正獨一無二的產(chǎn)品”。憑借優(yōu)秀的外觀設(shè)計、超強的性能表現(xiàn)、卓越的散熱設(shè)計、獨特的管理特性等,NF5488M5獲得了9.6分的高分評價,一舉成為AI服務(wù)器的8卡“機王”。
如下是完整評測報告第一部分硬件概覽:
浪潮NF5488M5是一款真正獨一無二的產(chǎn)品。盡管許多供應(yīng)商,都可以宣稱擁有搭載8塊NVIDIA Tesla V100的系統(tǒng),但NF5488M5可能是這些系統(tǒng)中,您可以買到的最高端產(chǎn)品。它不僅搭載了8塊Tesla V100 SXM3且支持“Volta Next” GPU,TDP達(dá)350W以上,并且結(jié)構(gòu)方面也有一定的特別之處。這些GPU利用NVSwitch技術(shù)互相連接,這就意味著,每兩個GPU之間都有300GB/s的P2P 通信帶寬。
在本測評中,我們會比平常多花一些時間討論硬件,以及它與市場上其他產(chǎn)品完全不同的獨特設(shè)計。截至2019年4月,浪潮在中國的AI服務(wù)器市場份額穩(wěn)居 51% 以上,而這款產(chǎn)品正是幫助浪潮繼續(xù)擴(kuò)大市場份額的創(chuàng)新設(shè)計之一。
我們將深入測評該服務(wù)器的硬件,因為硬件是解決方案中非常重要的一個方面,也是這款產(chǎn)品的獨特之處所在。
首先,我們將簡要概述服務(wù)器,然后詳細(xì)介紹GPU基板模組。GPU基板的設(shè)計非常獨特并且至關(guān)重要,因此這里我們想要介紹一下。
浪潮NF5488M5是一款4U服務(wù)器,尺寸是448mm x175.5mm x850mm。我們將從機箱前面板開始介紹。這里,我們可以看到兩個主要的分隔倉位,底部是 GPU托盤。下面,我們將從頂部約1U的部分開始介紹,它是服務(wù)器的CPU主板部分。
我們可以看到前面板I/O和一個管理端口、兩個USB 3.0端口、兩個用于10GbE 網(wǎng)絡(luò)的SFP+模塊外殼以及一個VGA連接器。
存儲空間提供8個2.5英寸熱插拔盤位。所有八個盤位都可以使用SATA III SSD,上面四個驅(qū)動器可以選擇使用U.2 NVMe SSD。
在系統(tǒng)內(nèi)部,我們還有更多存儲空間。在這里,內(nèi)存插槽旁邊的轉(zhuǎn)接卡上有兩個 M.2 SATA SSD可以做系統(tǒng)引導(dǎo)盤。這兩個M.2系統(tǒng)引導(dǎo)盤使前面板存儲盤位可以收納更多高價值存儲數(shù)據(jù)。
關(guān)于內(nèi)存方面,這款產(chǎn)品是一個采用完整內(nèi)存配置的雙路Intel Xeon可擴(kuò)展CPU計算系統(tǒng)。也就是說,兩個CPU中,每一個分別支持12個DIMM,一共24個DIMM。在這一系列機器中,我們可以看到全新的高端第二代Intel Xeon可擴(kuò)展CPU。機箱設(shè)計專注于優(yōu)化散熱通道,而這里的每U的TPU甚至比服務(wù)器中其他部分更低,即使是使用高端CPU和內(nèi)存配置也是一樣。
在解決方案中,我們可以看到提供SATA連接的板載SFF-8643連接器。這張照片右邊的散熱器是適用于Lewisburg PCH的。
你可能已經(jīng)注意那些連接器后面的模塊。這個模塊從后面的電源和配電板為 CPU的主板供電。
機箱背面可以看到一組熱插拔模塊陣列。模塊分為三種基本類型:中間是風(fēng)扇模塊,兩側(cè)可以看到電源在上面,I/O 模塊在下面。
NF5488M5采用四個3kW高可靠鉑金數(shù)據(jù)中心級電源,實現(xiàn)2+2冗余運行。
在這樣的系統(tǒng)中,最容易被忽視但又至關(guān)重要的一個特性就是風(fēng)扇模塊。每個模塊由兩個高效率風(fēng)扇組成,風(fēng)扇安裝于一個熱插拔底座上。由于此4U系統(tǒng)的功耗,這些風(fēng)扇模塊需要可靠地將大量空氣排出系統(tǒng),確保系統(tǒng)持續(xù)運行。
這六個風(fēng)扇模塊支持熱插拔,并且配有可顯示狀態(tài)的LED狀態(tài)指示燈。這可以幫助識別可能需要替換的單元。
此外,我們還要重點介紹一下I/O模塊。這里,我們有兩個模塊,每個模塊有兩個Mellanox Infiniband卡。也就是說,每兩個GPU搭配一個Infiniband卡。
模塊本身有自己的風(fēng)扇,還有一個額外的插槽。一個插槽用于后部網(wǎng)絡(luò)連接,如 10/25GbE。另一側(cè)有一個專門用于傳統(tǒng)I/O的插槽。用戶可以安裝一個適配器并連接USB或其他端口來進(jìn)行熱通道本地管理。
在主板和風(fēng)扇墻的后面,可以看到一排PCIe線纜。這些線纜將PCIe信號從機箱頂部的主板傳輸?shù)綑C箱底部的PCB。浪潮擁有線纜管理解決方案,可確保線纜在使用時不會對流向CPU、內(nèi)存和其他主板組件的氣流造成過多阻礙。
接下來這一張是穿過這些線纜向下看到PCIe Switch的俯視圖,可以看到第二個Aspeed AST2520 BMC。主板上也有一個BMC。
每一側(cè)都配有大型散熱器。這些散熱器覆蓋了Broadcom (PLX) PEX9797 97 通道、25端口、PCI Express第3代ExpressFabric Switch。這些都是高端 Broadcom PCIe Switch芯片,用于將系統(tǒng)的各個部分連接在一起。
前面提到的PCIe通道會通過高密度PCIe連接器與GPU基板相連接。
在我們介紹GPU基板之前,您可能已經(jīng)注意到了這里紅色和黑色的粗電線。它們是系統(tǒng)內(nèi)部的輸電線。
后面,我們將更詳細(xì)地了解與這些PCIe Switch板相連的GPU基板模組。