GPU在ANSYS高性能仿真計算中的應(yīng)用

2017-01-10 by:CAE仿真在線來源:互聯(lián)網(wǎng)

什么是GPU?

首先需要解釋CPU和GPU這兩個縮寫分別代表什么。CPU即中央處理器,GPU即圖形處理器。其次,要解釋兩者的區(qū)別,要先明白兩者的相同之處:兩者都有總線和外界聯(lián)系,有自己的緩存體系,以及數(shù)字和邏輯運算單元。一句話,兩者都為了完成計算任務(wù)而設(shè)計。

兩者的區(qū)別在于存在于片內(nèi)的緩存體系和數(shù)字邏輯運算單元的結(jié)構(gòu)差異:CPU雖然有多核,但總數(shù)沒有超過兩位數(shù),每個核都有足夠大的緩存和足夠多的數(shù)字和邏輯運算單元,并輔助有很多加速分支判斷甚至更復(fù)雜的邏輯判斷的硬件;GPU的核數(shù)遠(yuǎn)超CPU,被稱為眾核(NVIDIA Fermi有512個核)。每個核擁有的緩存大小相對小,數(shù)字邏輯運算單元也少而簡單(GPU初始時在浮點計算上一直弱于CPU)。

從結(jié)果上導(dǎo)致CPU擅長處理具有復(fù)雜計算步驟和復(fù)雜數(shù)據(jù)依賴的計算任務(wù),如分布式計算,數(shù)據(jù)壓縮,人工智能,物理模擬,以及其他很多很多計算任務(wù)等。GPU由于歷史原因,是為了視頻游戲而產(chǎn)生的(至今其主要驅(qū)動力還是不斷增長的視頻游戲市場),在三維游戲中常常出現(xiàn)的一類操作是對海量數(shù)據(jù)進(jìn)行相同的操作,如:對每一個頂點進(jìn)行同樣的坐標(biāo)變換,對每一個頂點按照同樣的光照模型計算顏色值。

GPU的眾核架構(gòu)非常適合把同樣的指令流并行發(fā)送到眾核上,采用不同的輸入數(shù)據(jù)執(zhí)行。在2003-2004年左右,圖形學(xué)之外的領(lǐng)域?qū)＜议_始注意到GPU與眾不同的計算能力,開始嘗試把GPU用于通用計算(即GPGPU)。

GPU 加速計算是指同時采用圖形處理單元(GPU) 和 CPU,以加快科學(xué)、分析、設(shè)計、消費者和企業(yè)應(yīng)用程序的速度。GPU 加速器于 2007 年由 NVIDIA 率先推出,現(xiàn)已在世界各地為政府實驗室、大學(xué)、公司以及中小型企業(yè)的高能效數(shù)據(jù)中心提供支持。GPU 能夠為從汽車、手機和平板電腦到無人機和機器人等平臺的應(yīng)用程序加快速度。

總之,GPU的作用如下:

GPU最早用于提升圖形計算的性能,增加圖形質(zhì)量。

GPU在ANSYS高性能仿真計算中的應(yīng)用fluent分析案例圖片1

現(xiàn)今GPU已經(jīng)不局限于圖形處理,還可以用于并行計算的加速。

GPU在ANSYS高性能仿真模擬中的應(yīng)用

計算機輔助工程(CAE)模擬讓工程師能夠設(shè)計更多的虛擬原型產(chǎn)品,因而在打造物理原型產(chǎn)品上花費的時間更少。更多次的反復(fù)設(shè)計可以成就更高質(zhì)量的產(chǎn)品,通過加速模擬,GPU 能夠進(jìn)一步提高生產(chǎn)率,從而有助于縮短產(chǎn)品開發(fā)時間,為企業(yè)帶來更具競爭力的優(yōu)勢。

ANSYS與 NVIDIA密切合作,以確保在 ANSYS 并行軟件上運行的模擬能夠達(dá)到性能。NVIDIA GPU 支持下列產(chǎn)品:

結(jié)構(gòu):ANSYS Mechanical 17.0支持全套特性,其中包括在多顆 GPU上運行。
流體:ANSYS Fluent 17.0能夠為基于壓力的耦合解算器和輻射傳熱模型提供GPU支持。
電磁:ANSYS HFSS 17.0支持瞬態(tài)流動仿真計算瞬時求解器。

現(xiàn)在利用 NVIDIA GPU 加速 ANSYS 模擬比以往任何時候都更加容易。在 17.0 版本中,所有的 HPC 許可產(chǎn)品(HPC、HPC Pack、HPC Workgroup)均支持 GPU。具體而言,在許可證要求這方面,每一路 GPU 被視為一個 CPU 核心。如此一來,利用現(xiàn)有 HPC 許可證再加上 NVIDIA GPU,即可大幅提升模擬生產(chǎn)率,從而能夠完成更多模擬工作。

GPU在ANSYS高性能仿真模擬中的成功應(yīng)用案例

案例1

當(dāng)使用 NVIDIA Tesla K20 或的 Tesla K40 GPU 時,ANSYS Mechanical 17.0 可實現(xiàn)大幅性能提升。在下面的標(biāo)準(zhǔn) ANSYS Mechanical 基準(zhǔn)測試中看一看性能結(jié)果。

利用工作站中的 NVIDIA Tesla K40,ANSYS Mechanical 用戶在大型模型上可實現(xiàn)更高的吞吐量。單塊 K40 計算卡可加速 12M 自由度的大型模型,與單純使用CPU相比可實現(xiàn)2倍性能提升。

案例2

ANSYS Fluent 17.0 現(xiàn)已支持多 GPU,能夠在 CFD 模擬中實現(xiàn)更高的生產(chǎn)率。這種性能增強歸功于創(chuàng)新的 GPU 加速求解器和 ANSYS 17.0 中全新的許可方案,該求解器(叫做 AmgX)由 NVIDIA 和 ANSYS 合作開發(fā)。Fluent 17.0 中的當(dāng)前軟件能夠加速基于壓力的耦合流體求解器,從而可加快 CFD 模擬的流體部分。只要為現(xiàn)有的 HPC 基礎(chǔ)架構(gòu)添加 Tesla K20、Tesla K20X 或 Tesla K40 GPU,即可享受到這些好處。它經(jīng)專門設(shè)計,可在集群配置中具備多顆 GPU 的多個節(jié)點上運行,就像在 CPU 系統(tǒng)上運行一樣。

下列圖表對比了Tesla K40 GPU與CPU在ANSYS Fluent 15.0中的性能,軟件是在集群上運行的,所模擬的是一種大型空氣動力學(xué)情形。

GPU在ANSYS高性能仿真計算中的應(yīng)用fluent培訓(xùn)課程圖片2