GPU在ANSYS高性能仿真計算中的應(yīng)用
2017-01-10 by:CAE仿真在線 來源:互聯(lián)網(wǎng)
首先需要解釋CPU和GPU這兩個縮寫分別代表什么。CPU即中央處理器,GPU即圖形處理器。其次,要解釋兩者的區(qū)別,要先明白兩者的相同之處:兩者都有總線和外界聯(lián)系,有自己的緩存體系,以及數(shù)字和邏輯運算單元。一句話,兩者都為了完成計算任務(wù)而設(shè)計。
兩者的區(qū)別在于存在于片內(nèi)的緩存體系和數(shù)字邏輯運算單元的結(jié)構(gòu)差異:CPU雖然有多核,但總數(shù)沒有超過兩位數(shù),每個核都有足夠大的緩存和足夠多的數(shù)字和邏輯運算單元,并輔助有很多加速分支判斷甚至更復(fù)雜的邏輯判斷的硬件;GPU的核數(shù)遠超CPU,被稱為眾核(NVIDIA Fermi有512個核)。每個核擁有的緩存大小相對小,數(shù)字邏輯運算單元也少而簡單(GPU初始時在浮點計算上一直弱于CPU)。
從結(jié)果上導(dǎo)致CPU擅長處理具有復(fù)雜計算步驟和復(fù)雜數(shù)據(jù)依賴的計算任務(wù),如分布式計算,數(shù)據(jù)壓縮,人工智能,物理模擬,以及其他很多很多計算任務(wù)等。GPU由于歷史原因,是為了視頻游戲而產(chǎn)生的(至今其主要驅(qū)動力還是不斷增長的視頻游戲市場),在三維游戲中常常出現(xiàn)的一類操作是對海量數(shù)據(jù)進行相同的操作,如:對每一個頂點進行同樣的坐標變換,對每一個頂點按照同樣的光照模型計算顏色值。
GPU的眾核架構(gòu)非常適合把同樣的指令流并行發(fā)送到眾核上,采用不同的輸入數(shù)據(jù)執(zhí)行。在2003-2004年左右,圖形學(xué)之外的領(lǐng)域?qū)<议_始注意到GPU與眾不同的計算能力,開始嘗試把GPU用于通用計算(即GPGPU)。
GPU 加速計算是指同時采用圖形處理單元(GPU) 和 CPU,以加快科學(xué)、分析、設(shè)計、消費者和企業(yè)應(yīng)用程序的速度。GPU 加速器于 2007 年由 NVIDIA 率先推出,現(xiàn)已在世界各地為政府實驗室、大學(xué)、公司以及中小型企業(yè)的高能效數(shù)據(jù)中心提供支持。GPU 能夠為從汽車、手機和平板電腦到無人機和機器人等平臺的應(yīng)用程序加快速度。
總之,GPU的作用如下:
GPU最早用于提升圖形計算的性能,增加圖形質(zhì)量。
現(xiàn)今GPU已經(jīng)不局限于圖形處理,還可以用于并行計算的加速。
計算機輔助工程(CAE)模擬讓工程師能夠設(shè)計更多的虛擬原型產(chǎn)品,因而在打造物理原型產(chǎn)品上花費的時間更少。更多次的反復(fù)設(shè)計可以成就更高質(zhì)量的產(chǎn)品,通過加速模擬,GPU 能夠進一步提高生產(chǎn)率,從而有助于縮短產(chǎn)品開發(fā)時間,為企業(yè)帶來更具競爭力的優(yōu)勢。
ANSYS與 NVIDIA密切合作,以確保在 ANSYS 并行軟件上運行的模擬能夠達到性能。NVIDIA GPU 支持下列產(chǎn)品:
-
結(jié)構(gòu):ANSYS Mechanical 17.0支持全套特性,其中包括在多顆 GPU上運行。
-
流體:ANSYS Fluent 17.0能夠為基于壓力的耦合解算器和輻射傳熱模型提供GPU支持。
-
電磁:ANSYS HFSS 17.0支持瞬態(tài)流動仿真計算瞬時求解器。
現(xiàn)在利用 NVIDIA GPU 加速 ANSYS 模擬比以往任何時候都更加容易。在 17.0 版本中,所有的 HPC 許可產(chǎn)品(HPC、HPC Pack、HPC Workgroup)均支持 GPU。具體而言,在許可證要求這方面,每一路 GPU 被視為一個 CPU 核心。如此一來,利用現(xiàn)有 HPC 許可證再加上 NVIDIA GPU,即可大幅提升模擬生產(chǎn)率,從而能夠完成更多模擬工作。
案例1
當(dāng)使用 NVIDIA Tesla K20 或的 Tesla K40 GPU 時,ANSYS Mechanical 17.0 可實現(xiàn)大幅性能提升。 在下面的標準 ANSYS Mechanical 基準測試中看一看性能結(jié)果。
利用工作站中的 NVIDIA Tesla K40,ANSYS Mechanical 用戶在大型模型上可實現(xiàn)更高的吞吐量。單塊 K40 計算卡可加速 12M 自由度的大型模型,與單純使用CPU相比可實現(xiàn)2倍性能提升。
案例2
ANSYS Fluent 17.0 現(xiàn)已支持多 GPU,能夠在 CFD 模擬中實現(xiàn)更高的生產(chǎn)率。 這種性能增強歸功于創(chuàng)新的 GPU 加速求解器和 ANSYS 17.0 中全新的許可方案,該求解器(叫做 AmgX)由 NVIDIA 和 ANSYS 合作開發(fā)。Fluent 17.0 中的當(dāng)前軟件能夠加速基于壓力的耦合流體求解器,從而可加快 CFD 模擬的流體部分。 只要為現(xiàn)有的 HPC 基礎(chǔ)架構(gòu)添加 Tesla K20、Tesla K20X 或 Tesla K40 GPU,即可享受到這些好處。它經(jīng)專門設(shè)計,可在集群配置中具備多顆 GPU 的多個節(jié)點上運行,就像在 CPU 系統(tǒng)上運行一樣。
下列圖表對比了Tesla K40 GPU與CPU在ANSYS Fluent 15.0中的性能,軟件是在集群上運行的,所模擬的是一種大型空氣動力學(xué)情形。
高性能計算(HPC&GPU)是未來仿真計算的發(fā)展趨勢,將作為國家競爭力的重要標志之一。
GPU 作為推動高性能計算的驅(qū)動力,是高性能、低功耗的完美結(jié)合。
ANSYS一直致力于多物理場耦合的研究與開發(fā),高性能(HPC&GPU)計算將助力ANSYS幫助企業(yè)實現(xiàn)”中國智造”。
相關(guān)標簽搜索:GPU在ANSYS高性能仿真計算中的應(yīng)用 Fluent培訓(xùn) Fluent流體培訓(xùn) Fluent軟件培訓(xùn) fluent技術(shù)教程 fluent在線視頻教程 fluent資料下載 fluent分析理論 fluent化學(xué)反應(yīng) fluent軟件下載 UDF編程代做 Fluent、CFX流體分析 HFSS電磁分析