英偉達AI之路遇打擊 微軟實時AI云平臺為啥選擇了英特爾的FPGA?
預計英特爾的FPGA將減緩英偉達數(shù)據(jù)中心/汽車業(yè)務板塊的增長速度。
英特爾收購Altera時豪擲的167億美金終于見到回報了?,F(xiàn)在,Altera的FPGA(現(xiàn)場可編程門陣列)產(chǎn)品成為英特爾對抗英偉達基于GPU的深度學習神經(jīng)網(wǎng)絡平臺的利器。與CPU(中央處理單元)相比,GPU(圖形處理單元)在并行計算方面存在優(yōu)勢,GPU專家英偉達借此躋身為深度學習計算領域的公認領導者。
然而,英偉達的投資者們應該注意到,微軟新的實時人工智能云平臺“BrainWave項目”搭載了英特爾的Stratix 10 FPGA。微軟在選擇深度神經(jīng)網(wǎng)絡[DNN]處理單元或DPU時,沒有選擇英偉達的Tesla或者Volta GPU,反而選擇了Stratix 10。 英特爾將從微軟在全球各個數(shù)據(jù)中心大規(guī)模部署“BrainWave”項目中獲得顯著的經(jīng)濟效益。英特爾沒有任何獨立的GPU產(chǎn)品,但它擁有的FPGA足以加強其未來在超大型深度神經(jīng)網(wǎng)絡中的作用。
為什么這很重要
現(xiàn)在,以人工智能為中心的數(shù)據(jù)中心和汽車業(yè)務板塊為英偉達貢獻的季度收入已經(jīng)超過5億美金。微軟在向Azure客戶提供的Brainwave項目中使用FPGA后,也可以為英特爾貢獻同等規(guī)模的季度收入。我估計,除了微軟之外,其它涉足人工智能的公司也會在其GPU加速的深度學習平臺中使用英特爾的FPGA。
英偉達股價上升到目前的高度,部分原因來自于它在深度學習計算方面的先發(fā)優(yōu)勢。微軟采用英特爾的FPGA加速其深度神經(jīng)網(wǎng)絡也可以幫助提升其股價表現(xiàn)。專注AI的投資者們現(xiàn)在應該正視英特爾,它的Stratix 10產(chǎn)品讓英特爾一躍成為深層神經(jīng)網(wǎng)絡的硬件供應商巨頭。
過去三年中,英偉達的股票大幅跑贏了英特爾。未來,應用在微軟Azure服務業(yè)務中的Stratix FPGA將成為英特爾進入企業(yè)AI市場的遲到的船票。
通過GPU加速的Azure產(chǎn)品,微軟與英偉達公司建立了合作伙伴關系。另一方面,BrainWave項目是微軟使用FPGA加速器推進其實時人工智能商業(yè)服務的舉措。
訓練深度學習計算機是一個需要高吞吐量的計算密集型過程,GPU優(yōu)異的并行計算性能使其成為理想選擇。然而,GPU能夠并行處理復雜的訓練輸入,F(xiàn)PGA則對加速推理很有效。
加速推理的主要目的是改善服務器與最終用戶之間的延遲。 微軟對“BrainWave”項目的推廣定位是實時(零延遲)AI平臺。因此,英特爾的FPGA比英偉達的GPU更加適合做微軟BrainWave項目的DPU。
BrainWave項目最終可能用在微軟為百度自主駕駛汽車定制的云框架/解決方案上。微軟是百度自主駕駛汽車業(yè)務上的合作伙伴。和微軟一樣,百度也在其數(shù)據(jù)中心上使用FPGA?;贔PGA的BrainWave項目被標榜為針對計算機視覺、機器學習和深度學習,它可以滿足未來自動駕駛汽車的云基礎設施需求。
GPU和FPGA是目前雖小但正在快速增長的人工智能服務行業(yè)的關鍵元件。 根據(jù)Tractica的報告,到2025年,與AI相關的產(chǎn)品和服務市場規(guī)模將增長到368億美元。FPGA可以幫助英特爾在這個利基市場上更好地競爭。
未來,英特爾真的需要更多FPGA產(chǎn)品客戶。它需要這塊收入來幫助支付它在以167億美元收購Altera時發(fā)行的70億美元債券。每個新收入來源都可以幫助英特爾恢復因大舉投資Altera而拉下的饑荒。
為什么英特爾的FPGA對微軟至關重要
Stratix 10的F32峰值性能仍然明顯低于英偉達的Pascal GPU。 然而,市場正日趨采用緊湊型低精度數(shù)據(jù)類型(低于32位或FP32)。 TensorFlow和Caffe等DNN軟件框架支持低精度FP16(16位)和FP8(8位)數(shù)據(jù)類型。在這些不需要FP32級性能的深入學習/機器學習任務中,F(xiàn)PGA可以大行其道。
對于非常低精度的2位和1位DNN的持續(xù)改進和FPGA在FP8和FP9 DNN框架上的出色表現(xiàn)相輔相成。人工智能/深度學習并不完全依賴于英偉達GPU所擅長的傳統(tǒng)密集FP32和FP64運算。微軟的Brainwave項目并沒有使用GPU,是因為它還希望能夠通過低精度FPGA實現(xiàn)更節(jié)能的DNN。不像可以深度定制的FPGA,當涉及到低精度、稀疏、不規(guī)則的DNN時,GPU的表現(xiàn)很差。
在早期測試中,基于Stratix 10的Brainwave項目中的FPGA硬件持續(xù)計算性能達到39.5萬億次每秒,這個測試是微軟在定制的低精度8位浮點格式下完成的。隨著繼續(xù)優(yōu)化完善Brainwave項目,預計性能還可以進一步提高。
結論
微軟長期以來對FPGA的興趣是英特爾大舉押注Altera的原因之一。BrainWave項目是微軟2011年推出的 Catapult項目的延續(xù)。六年前,微軟就已經(jīng)在其數(shù)據(jù)中心中配備了Altera FPGA加速板?,F(xiàn)在,微軟正在使用英特爾最新的Stratix 10 FPGA來加速基于云的深度學習任務,而不僅僅是傳統(tǒng)的企業(yè)計算工作負載。
微軟早在2011年就知道,傳統(tǒng)的Xeon CPU無法勝任AI計算任務。英特爾迅速收購Altera的舉措表明,它已準備好適應微軟轉向FPGA加速超大型數(shù)據(jù)中心的巨大轉變。我認為,英特爾從來都沒有考慮過購買英偉達這樣的GPU廠商,它看中的是微軟大力推動FPGA加速云計算背后的趨勢,投資的是Altera的潛力和FPGA的未來。
在數(shù)據(jù)中心硬件產(chǎn)品上,英特爾不需要拿出自己的GPU來與英偉達競爭,它手中的利器是基于14nm工藝、面向數(shù)據(jù)中心加速應用的Stratix 10。英特爾將繼續(xù)向數(shù)據(jù)中心運營商兜售Xeon處理器,同時也會努力爭取為其FPGA獲得新的訂單。