




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
FPGA與GPU計算存儲加速對比:單位功耗性能考量因素為了提升計算基礎(chǔ)設(shè)施的性能,并緊跟數(shù)據(jù)分析與AI不斷攀升的需求,眾多企業(yè)將硬件加速視為主要的解決方案。在大多數(shù)情況下,先進(jìn)的可編程硬件(主要是指GPU和FPGA)是加速的主要方式。通過使用這種先進(jìn)的硬件,企業(yè)正在贏得計算優(yōu)勢;然而,對于編程難度,他們?nèi)匀淮嬖诤侠淼膿?dān)憂。圖1:分析/AI流水線組件硬件制造商正在將加速方法應(yīng)用于計算存儲,這是專門設(shè)計用于包含內(nèi)嵌計算元素的存儲。這種方法已經(jīng)被證明可以為分析和AI應(yīng)用提供優(yōu)異的性能(圖1)。使用或者不使用機(jī)器學(xué)習(xí)輔助的分析以及驗(yàn)證,都可以借助計算存儲器件進(jìn)行加速。這些器件提供了一個關(guān)鍵的優(yōu)勢,使得成本高昂的計算被卸載到存儲器件上,而不必在服務(wù)器CPU上完成。與標(biāo)準(zhǔn)的存儲/CPU方法相比,通過計算存儲獲得的優(yōu)勢包括:1.借助應(yīng)用專用編程定制可編程硬件,獲得更高性能2.將計算任務(wù)從服務(wù)器卸載到存儲器件,釋放CPU資源3.數(shù)據(jù)與計算共址,降低數(shù)據(jù)傳輸需求這種新穎的方法前景光明。不過,您應(yīng)根據(jù)具體用例評估這種方法,考量性能、成本、功耗和易用性。性價比和單位功耗性能在選擇加速硬件評估時,占據(jù)主要比率。在本文中,我們將研討單位功耗性能(另一篇文章則專門研討性價比)。計算存儲功耗比較3種系統(tǒng)在這個場景中,我們將比較以CSV數(shù)據(jù)讀取用例為主的三種工具:英偉達(dá)GPUDirect存儲和RAPIDS存儲,以及基于賽靈思技術(shù)的三星SmartSSD存儲。CSV讀取在計算密集型流水線中起著重要的作用(參見圖1)。在下文中,我們將性能定義成CSV的處理速率,或處理“帶寬”。我們先快速回顧一下三種系統(tǒng)的運(yùn)行方式。英偉達(dá)GPUDirect存儲·端到端滿足分析和AI需求·將GPU用作計算單元,緊貼基于NVMe的存儲器件布局(GPUDirect)·使用CUDA進(jìn)行編程(RAPIDS)英偉達(dá)用其CSV數(shù)據(jù)讀取技術(shù)衡量相對于標(biāo)準(zhǔn)SSD的性能提升。結(jié)果如圖1所示。使用1到8個加速器時,對應(yīng)的吞吐量是4到23GB/s。三星SmartSSD驅(qū)動器·將賽靈思FPGA用作計算單元·與存儲邏輯內(nèi)嵌駐留在同一個內(nèi)部PCIe互聯(lián)上·通過編程在存儲平臺上開展運(yùn)算賽靈思數(shù)據(jù)分析解決方案合作伙伴Bigstream與三星合作,為ApacheSpark設(shè)計加速器,包括用于CSV和Parquet處理的IP。SmartSSD的測試使用單機(jī)模式的CSV解析引擎,以便開展比較。結(jié)果如圖2所示,使用1到12個加速器時,對應(yīng)的吞吐量是4到23GB/s,同時也給出英偉達(dá)的結(jié)果(使用1到8個加速器)。請注意,本討論中的所有結(jié)果都按x軸上的加速器數(shù)量進(jìn)行參數(shù)化。這些結(jié)果令人振奮,但在選擇您的解決方案時,請務(wù)必將功耗情況納入考慮。圖2:SmartSSD驅(qū)動器的CSV解析性能結(jié)果單位功耗性能比較圖3顯示了將功耗考慮在內(nèi)后的分析結(jié)果。它們代表單位功耗達(dá)到的性能水平,根據(jù)上述討論中引用的相關(guān)材料,給出了以下假設(shè):·TeslaV100GPU:最大功耗200瓦·SmartSSD驅(qū)動器FPGA:最大功耗30瓦圖3:CSV解析的每瓦功耗帶寬比較在這個場景下,計算表明,在全部使用8個加速器的情況下,SmartSSD的單位功耗性能比GPUDirectStorage高25倍。FPGA與GPU對比:有關(guān)單位功耗性能的最終思考計算存儲的優(yōu)勢在于能增強(qiáng)數(shù)據(jù)分析和AI應(yīng)用的性能。然而,要讓這種方法具備可實(shí)際部署的能力和實(shí)用性,就必須在評估時將功耗納入考慮。針對用于CSV數(shù)據(jù)解析的兩種不同的計算存儲方法,我們已經(jīng)提出按功耗參數(shù)化的吞吐量性能曲線。結(jié)果顯示,在使用相似數(shù)量的加速器進(jìn)行比較時,SmartSSD驅(qū)動器的單位功耗性能優(yōu)于GPUDirect存儲方法。GPUDirect是英偉達(dá)通過NVIDIADGX-2應(yīng)用平臺提供的研究系統(tǒng)。三星SmartSSD驅(qū)動器是一種可部署的量產(chǎn)型PCIe可插拔平臺,現(xiàn)在已經(jīng)通過賽靈思及分銷商供貨。如需了解更多信息,請查看:·有關(guān)Bigstream與SmartSSD計算存儲器件結(jié)合使用,加速
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 江西省撫州市宜黃縣2025年四下數(shù)學(xué)期末學(xué)業(yè)質(zhì)量監(jiān)測模擬試題含解析
- 咖啡機(jī)銷售合同協(xié)議
- 死亡責(zé)任協(xié)議書模板
- 商場業(yè)主收租合同協(xié)議
- 商場采購定金合同協(xié)議
- 橄欖青果購銷合同協(xié)議
- 母嬰產(chǎn)品合作合同協(xié)議
- 戀愛合同分手一個月協(xié)議
- 櫥柜門板采購合同協(xié)議
- 苗木合同效力終止條件
- 分集水器選型計算
- GB/T 8314-2013茶游離氨基酸總量的測定
- GB/T 1410-2006固體絕緣材料體積電阻率和表面電阻率試驗(yàn)方法
- 工業(yè)廠房土方回填施工方案1215
- 鮮肉切片機(jī)設(shè)計說明書
- 2018年USB數(shù)據(jù)線檢驗(yàn)規(guī)范資料
- 瀝青混凝土拌合站吊裝計算書
- 第4章單回路控制系統(tǒng)設(shè)計-zhm
- 視覺形象設(shè)計VIS清單
- LLC諧振半橋的主電路設(shè)計指導(dǎo)
- 工具鉗工技能操作鑒定要素細(xì)目表09版
評論
0/150
提交評論