阿里達(dá)摩院發(fā)布新一代自研語音AI芯片技術(shù) 有望率先落地天貓精靈

發(fā)布于: 2019-08-22
?來源:DoNews? 2019-8-21
? ? ? ?8月21日消息(記者 趙晉杰)在8月21日美國舊金山舉行的芯片行業(yè)頂級學(xué)術(shù)會議HOTCHIPS上,阿里巴巴達(dá)摩院發(fā)布了新一代AI語音FPGA芯片技術(shù)——Ouroboros,該技術(shù)能將語音生成算法的計算效率提高百倍以上。這是業(yè)界首款專用于語音合成算法的AI FPGA芯片結(jié)構(gòu)設(shè)計。

(阿里達(dá)摩院科學(xué)家在HOTCHIPS大會現(xiàn)場發(fā)布自研語音芯片技術(shù))

? ? ? ?針對ASIC實現(xiàn)的性能仿真預(yù)估表明,Ouroboros的設(shè)計可以實時運行WaveNet等業(yè)界先進(jìn)的文字轉(zhuǎn)語音(TTS,Text-to-Speech)算法 ,實現(xiàn)實時語音合成。

? ? ? ?算法很好但難以進(jìn)行實時計算是語音芯片的行業(yè)難題。Ouroboros的突破在于它使用了端上定制硬件加速技術(shù),替代云端服務(wù)器,有效避免了對網(wǎng)絡(luò)連接和云端服務(wù)的強依賴性,解決了這一問題。以計算量最大的AI 語音合成算法WaveNet為例,為了生成1秒的語音,CPU和GPU需要消耗50秒的計算時間,但Ouroboros在FPGA環(huán)境下只需要 0.3秒,大大提升計算效率,同時將整體服務(wù)成本降低 10 倍以上。

? ? ? 阿里用戶在使用天貓精靈、高德導(dǎo)航、智能點餐機等服務(wù)時,將率先得到媲美真人語音交互的體驗。

? ? ?自研算法與自研AI芯片設(shè)計的結(jié)合,也意味著阿里在語音生成領(lǐng)域?qū)崿F(xiàn)了真正的“軟硬一體化”計算結(jié)構(gòu)的落地。

? ? ?據(jù)了解,Ouroboros芯片技術(shù)除了語音合成之外,還將支持AI語音識別?;贠uroboros研發(fā)完整的語音AI芯片,有望率先在天貓精靈上落地。(完)

分享