GP100率最新Ouadro,Pascal家族亮相,NVIDIA高端顯卡劍指制造業(yè)應用
發(fā)布時間:2018-06-25 來源: 美文摘抄 點擊:
2017年4月12~14日,NVIDIA攜全新發(fā)布的Pascal架構Quadro新品,亮相InfoComm China 2017展會。在展會首日,NVIDIA在國家會議中心的大會現(xiàn)場召開媒體發(fā)布會,公開展示了GP100、P6000、P5000等全新Quadro Pascal架構高端專業(yè)級顯卡。會上,NVIDIA專業(yè)可視化業(yè)務高級總監(jiān)Sandeep Gupte及英偉達中國區(qū)銷售總監(jiān)何猶卿向記者展示了全新Quadro顯卡家族的強大性能和多種應用場景。
Pascal架構的Quadro顯卡主要定位于專業(yè)級工作站,完成包括仿真分析、VR模擬以及視頻渲染等工作。與上一代相比,全新Quadro產(chǎn)品的運算速度提升了兩倍(基于SPECviewperf 12基準的計算結果),且具有超快速內存。新NVIDIA專業(yè)可視化業(yè)務高級總監(jiān)Sandeep Gupte說:“NVIDIA的愿景是希望用戶憑借Quadro產(chǎn)品家族的這些新產(chǎn)品,簡化設計的工作流程,從傳統(tǒng)的工作站與工作方式中解脫出來,把工作站打造成個人的超級計算機!
全新Ouadro旗艦顯卡GP100
Sandeep Gupte對Quadro家族的旗艦產(chǎn)品GP100進行了重點介紹。GP100基于Pascal核心,單精度CUDA核心數(shù)3584個,雙精度CUDA核心數(shù)1792個,具有16 GB HBM2高帶寬顯存,半精浮點運算性能達到20.7TFLOPS、單精浮點運算性能為10.3 TFLOPS、雙精浮點運算性能為5.2 TFLOPS。同時,支持4K、5K以及VR顯示。
GP100具有以下特點:
◎統(tǒng)一仿真、HPC、渲染和設計:GP100將雙精度性能(5 TFLOPS以上,比Quadro K6000快將近3倍)與16GB的高帶寬內存(HBM2)相結合,因此用戶可以在設計過程中進行仿真,并以前所未有的速度采集逼真的多物理場仿真?蛻裟軌驅蓚GP100 GPU與NVLinkTM技術相結合,并擴展到32GB的HBM2,以在單一工作站上創(chuàng)建龐大的可視化計算解決方案。
◎探索深度學習:GP100提供超過20 TFLOPS的半精度計算(單精度(FP32)性能為10 TFLOPS,以半精度(FP16)模式運行可使吞吐量翻倍至20 TFLOPS),可謂在Windows和Linux環(huán)境中進行深度學習的理想開發(fā)平臺
◎將VR集成到設計和仿真工作流程中:VR認證的Quadro GP100和P4000具有創(chuàng)建詳細、逼真、沉浸式環(huán)境的能力,能夠大規(guī)模實現(xiàn)更加宏大、更加復雜的設計體驗。
◎盡享照片級真實感設計的優(yōu)勢:基于PascalTM架構的Quadro GPU渲染照片級真實感圖像的速度為CPU的18倍(基于采用Iray渲染技術的內部測試,在720p場景中,比Intel Xeon E5 2697 V3 2.6 GHz 14核CPU快18倍)。
◎創(chuàng)建廣闊的可視化工作區(qū):可在多達四個5K顯示器上以高分辨率和HDR顏色顯示數(shù)據(jù)。
◎經(jīng)濟高效地構建超高分辨率及多顯示屏配置:通過將多達8個P4000 GPU和兩個Quadro Sync Ⅱ顯卡(Quadro驅動程序目前支持使用單個Sync Ⅱ顯卡配置多達16個4K顯示器。未來驅動程序更新中還將添加配置多達32個4K顯示器的功能)相結合,可通過單一機箱實現(xiàn)多達32個4K顯示器的配置。
GP100在仿真與渲染領域的應用
GP100在CAE方面表現(xiàn)突出,可以幫助工程師快速完成包括結構力學、流體動力學和電磁學等方面的雙精度計算。同時,GP100可以兼顧設計與仿真工作的需要,在同一個工作站中一卡兩用。Sandeep Gupte介紹說,在Simulia和ANSYS的CAE分析過程中,利用GP100加速比之只使用CPU進行運算仿真效率得到了大幅提高,Simulia的仿真速度提高了3倍,ANSYS則提高了2倍。除了性能提升之外,GPU加速還可以在軟件許可采購方面幫助用戶節(jié)省開支,用戶可以利用GPU取代部分CPU運算,從而減少在軟件多核節(jié)點方面的開支。
在軟件應用方面,NVIDIA與達索系統(tǒng)、西門子PLM、PTC等多家軟件公司合作,在軟件中開發(fā)專門針對GPU加速的功能。例如,NVIDIA與達索系統(tǒng)的深度合作,在CATIA的渲染模塊中,采用了Iray技術,在SOLIDWORKS Visualize中,也可以應用GPU加速,把渲染時間從5小時縮短到30分鐘。
Sandeep Gupte表示,NVIDIA在全球組建了一個由軟件工程師組成的技術團隊叫做Def Tech,他們的工作就是與本地企業(yè)的軟件工程師開展技術合作,確保用戶的應用軟件可以在硬件上流暢運行。
Quadro顯卡在娛樂影音渲染方面的應用更為廣泛,英偉達中國區(qū)銷售總監(jiān)何猶卿表示,GPU加速對電影渲染來說非常重要。他以《變形金剛3》的一幀4K畫面為例比較,只用雙核CPU渲染需要288個小時的畫面,GPU加速大概只需要3個小時。
QUEST計劃
在本次媒體會上,Sandeep Gupte還提到了NVIDIA的QUEST(Quadro Embedded System Program)計劃,即基于Quadro的嵌入式系統(tǒng)計劃。目前,NVIDIA已經(jīng)面向全球開放了針對高性能嵌入式系統(tǒng)的開發(fā)者計劃,開發(fā)企業(yè)可以申請加入此項計劃,與NVIDIA共同設計適用于不同軟件解決方案的GPU。除此之外,NVIDIA還為這些開發(fā)者提供設計包(Design Kit)、SDK、樣本代碼以及培訓課程等。
Sandeep Gupte強調說:“要打造嵌入式的解決方案,對品質、可靠性和性能的要求都非常高。因此我們關注的焦點是找到能夠在不同行業(yè)中實現(xiàn)這三點的合作伙伴,不拘數(shù)量。QUEST計劃不收取費用,但是我們在遴選合作伙伴的時候也會認真考慮,因為我們在技術團隊方面要與這些企業(yè)開展密切地合作。因此,我們要針對目標市場選對合作伙伴。”
熱點文章閱讀