By accepting you will be accessing a service provided by a third-party external to https://www.incgmedia.com/

從 GI 到 AI,華碩大量運算有夠 High! ASUS ESC4000 G4S + NVIDIA Tesla P100

從 2011 年 ESC4000 問世以來, ASUS 在 GPU 運算的技術投入,在國內一直保持領先地位,也幫助許多國內外客戶組建超級電腦,多次入圍 Top 500 與 Green 500,技術能力深得客戶信賴。這次小編很開心有這機會能再次借測到最新一代機型「ESC4000 G4S」,並搭配四張目前地表能買的到( 傳說中有更新的型號,但目前很難看到),堪稱運算能力最強悍的 NVIDIA Tesla P100,許多國外媒體測試數據都令人驚艷,不知道這次在 GPU 算圖是否也能有相對表現,就讓我們一起看下去。

測試平台規格:

CPU
Xeon Gold 6130( 16C32T 2.10 GHz)
RAM
96GB(8GB * 12)
顯示
NVIDIA Tesla P100 * 4
硬盤
512 GB SSD
動力
1 + 1 1600W 80 Plus

不能免俗的讓我們先來看一下硬體配置:

ASUS ESC4000 G4S 能夠搭載 intel 最新 Xeon Scalable 系列 CPU,並支援雙 CPU 配置,RAM 最大能支援 16 條 64GB DDR4 2666,最大可擴充容量達到 2048GB,主機板使用 Intel C621 晶片組,除了前方八個 2.5 吋硬碟槽之外,還可以安裝一片 2280 的M.2 SSD,電源方面延續之前的設計,採用 1+1 1600W 80 PLUS,確保在全功率運轉下能安全無虞。

 

更靈活的資源配置

ASUS ESC4000 G4S 搭配 NVIDIA Tesla P100,除了最直接的用途,使用 GPU 運算之外,也可以搭配 VM 使用 VDI 技術,讓原本一部機架型伺服器,服務更多需要繪圖功能的設計師。讓我們先來模擬一下一般使用者的工作環境。假設有一家知名建築師事務所,擁有七名建築師與十名設計師,為了讓工作能順利在團隊中運作,每一位的工作站配備都必須相同等級,以一部單 CPU 單 GPU 中階工作站來計價,價格帶會落在十到二十萬之間,耗電量約 700 瓦特,十七台工作站以最低金額也要付出一百七十萬,耗電量更是驚人的 11900 瓦特。但是每一位使用者真的都會同時使用到這些資源嗎? A 建築師正努力使用 CAD 軟體繪製平面圖,B 建築師正在上網查資料,C 建築師正與甲設計師討論大圖輸出的細節,乙設計師正在幫 D 建築師算大圖,而 D 建築師工作站開著但不在位置上……..,諸如此類的情況相信大家都不陌生,除非有設定電腦資源閒置時開放當礦工(應該不太可能才對….),不然這些資源與能源正在被浪費掉。但是透過 VDI 的方式就能徹底改變這些狀況,資源能更有效被分配,早期單一使用者無法對應多 GPU 的限制也被解決了,不但能夠讓單一使用者獲得超過原本工作站的運算效能,還能減少軟體授權需要的套數,雖然建置硬體的費用跟原本相差不大,但在安全性、軟硬體資源分配與能源消耗上卻有非常大的優勢,畢竟在這油電雙漲的年代,該省的還是要省啊!!

 VDI (Virtual Desktop Infra- structure)

虛擬桌面架構聽起來很抽象,但實際上就是虛擬主機的意思,透過網路的方式讓各種不同的終端設備,例如手機、平板、筆電或是PC,硬體效能達到工作站等級的一種使用方式,機房配置高規格伺服器,將硬體資源透過虛擬主機系統,模擬成數台或數十台工作站,再搭配vGPU( 虛擬化GPU) 技術,讓每一台虛擬主機都能擁有電腦繪圖能力。

本次測試是使用 V-Ray Next Beta 3 搭配 3ds Max 2018 來進行,為什麼要使用 V-Ray Next Beta 3 呢? 因為 V-Ray 是目前全球設計產業最多人使用的渲染引擎,而這一代的 V-Ray 號稱 CPU 與 GPU 算圖結果會是相同的(小編對於原廠這種說法持保留態度),而且又能夠在同一平台上同時測試兩種不同資源運算效能,所以在結果呈現上會有較為準確的效果。

測試規格:

​型號
​NVIDIA Tesla P100
​CUDA 核心數 3584
記憶體16GB CoWoS HBM2
ECC 支援
​有
功耗
250W

意外小插曲

在剛安裝完軟體後,打開 V-Ray 的硬體配置工具,赫然發現視窗內空空如也,四張 Tesla P100 不知在何處,僅有C++語法支援CPU可使用,原本以為是顯示卡驅動問題造成,後來發現是要安裝 intel OpenCL 驅動程式,安裝後就會看到四張 P100 與OpenCL 語法支援 CPU,看來 intel 對於 CPU 偕同 GPU 運算這方面,算是動作頻頻,NVIDIA 有需要再更加緊研發腳步啊!


 測試一:不同的 GI 引擎表現 - Brute Force

想要考驗硬體運算能力? 那就透過算圖吧! 尤其是 GI 這種光線不停在空間中彈跳、衰減與染色,最終成像美不美,選對 GI 引擎就先贏在起跑點了。第一組測試圖像大小為1400 X 800,CPU 與 GPU 都使用 Progressive 方式演算,最大採樣次數為 20 ( 計算總數為四百次, 但 GPU 每次進位都以 16 為基數,所以 GPU 採樣設定要乘上 16,故總數為 6400 次), GI 採樣使用 Brute Force,完全靠運算實力來成像。 CPU 使用時間為 23 分 44 秒, GPU使用時間為 9 分鐘整,讓我們來比較看看畫質。

 上圖為 CPU Bruce Force 與  CPU Bruce Force + DeNoise ( 23 分 44 秒)

 上圖為 GPU Bruce Force 與  GPU Bruce Force + DeNoise ( 9 分 0 秒)

 
 

 測試二:不同的 GI 引擎表現 - Light Cache

CPU 使用 1 小時 45 分 33 秒,GPU 使用 1 小時 01 分 22 秒,圖像品質跟第一組測試結果差不多,算圖時間也與第一組測試接近,表示 V-Ray 在採樣技術上已趨近成熟,如果還想要更快得到渲染作品,以目前硬體環境配置來看,增加 GPU 這個方案較為可行,因為多 CPU 的設備費用增加速度是非線性的,增加一倍 CPU 所要付出的代價可能是原來的兩三倍,但 GPU 只需要搭配適合硬體就能擴充,面對硬體效能需求越來越高,4K、8K 影像需求越來越多,想要應付生態環境變化,硬體設備提升顯然是條不歸路。

 上圖為 4K 的 CPU Light Cache 與  CPU Light Cache + DeNoise ( 1 時 45 分 33 秒) (點圖觀看大圖)

 上圖為 4K 的 GPU Light Cache 與  GPU  Light Cache + DeNoise (1 時 01 分 22 秒) (點圖觀看大圖)

 

為什麼值得推薦

過去 Render Farm 大多都是由 CPU 硬體所組成,而 VDI 的設計原理是共享 CPU 核心,這兩者理念剛好背道而馳,但是透過 GPU 技術加持之下,運算不再需要大量 CPU 資源,而能夠配置大量 GPU 的伺服器規格,ASUS 正站在這個時代的浪頭上,不論是這次評測的 ESC4000 G4S,或是更高規格的 ESC8000 G4(8 GPU),面對使用環境越來越多元化( VDI 也可以使用手機操作),競爭越來越激烈,趁早規畫讓使用環境這樣一套超強競爭力的,相信才是有遠見的企業家該思考的方向。  


-​本文出自映CG雜誌第三十五期硬體評測

讓光影更真實,25 個照明 HDRI 免費下載中
即時渲染大趨勢-影視產業應用研討會

相關文章

 
還沒有帳號嗎? 點此立即註冊!

登入您的帳號