阿里云天池發(fā)布“科研加速計(jì)劃”,助力科研創(chuàng)新發(fā)展腳步全面提速
近日,阿里云天池重磅發(fā)布“天池科研加速計(jì)劃”。該計(jì)劃將面向國(guó)內(nèi)外科研人員,提供在線訓(xùn)練的天池實(shí)驗(yàn)室工具以及免費(fèi)AI算力資源,賦能學(xué)術(shù)科研相關(guān)創(chuàng)新工作全面提速,加快科研成果落地進(jìn)程。
作為大賽場(chǎng)景的重要升級(jí),天池這一舉措將幫助TOP高校及科研院所實(shí)現(xiàn)在線使用阿里云的算力資源,進(jìn)一步賦能高校開展人工智能學(xué)科建設(shè),助力學(xué)術(shù)研究和科研創(chuàng)新快速發(fā)展,夯實(shí)技術(shù)創(chuàng)新升級(jí)基礎(chǔ),進(jìn)一步賦能我國(guó)相關(guān)技術(shù)領(lǐng)域培養(yǎng)AI進(jìn)階人才。
聚焦認(rèn)知智能領(lǐng)域,天池首發(fā)兩大熱門課題
“天池科研加速計(jì)劃”初期聚焦于“短視頻highlight檢測(cè)”與“電商搜索相關(guān)性”兩大首發(fā)課題,圍繞當(dāng)下互聯(lián)網(wǎng)熱門課題進(jìn)行深入研究。
近幾年,短視頻內(nèi)容形態(tài)快速崛起,相比傳統(tǒng)長(zhǎng)視頻,短視頻更符合移動(dòng)化、社交化的趨勢(shì),用戶規(guī)模迅速擴(kuò)大。此次天池開展的“短視頻highlight檢測(cè)”課題正是通過對(duì)電商場(chǎng)景的短視頻(10s-5min)進(jìn)行深度語義內(nèi)容理解,結(jié)合深度學(xué)習(xí)、多模態(tài)融合分析、機(jī)器學(xué)習(xí)等手段,代替原本手動(dòng)操作截取視頻的繁瑣,自動(dòng)為用戶截取并生成時(shí)長(zhǎng)在5s左右的視頻highlight片段作為視頻動(dòng)態(tài)封面,有效幫助用戶在有限時(shí)間內(nèi)全方位展現(xiàn)商品信息,提升用戶體驗(yàn),促進(jìn)點(diǎn)擊等關(guān)鍵業(yè)務(wù)指標(biāo)。
而“電商搜索相關(guān)性”課題將更為深入的研究電商搜索引擎相關(guān)性模塊,通過人工智能算法從商品標(biāo)題文本計(jì)算與查詢文本的語義相關(guān)性,判斷查詢文本和商品標(biāo)題語義是否相關(guān)。一般采用深度模型,以查詢和商品標(biāo)題文本作為輸入,輸出0/1的相關(guān)類別標(biāo)簽或者0-1之間的相關(guān)性分?jǐn)?shù),從評(píng)估商品和查詢的語義相關(guān)性層面,提升用戶使用過程中的體感。
該課題涉及計(jì)算查詢文本和商品標(biāo)題文本語義匹配程度,在學(xué)術(shù)界也有類似的研究方向。但不同之處在于,除了人工標(biāo)注樣本以外,通常的方案是采用搜索日志中的點(diǎn)擊數(shù)據(jù)訓(xùn)練相關(guān)性模型。但在電商搜索領(lǐng)域,用戶的點(diǎn)擊行為受到相關(guān)性、商品價(jià)格、展現(xiàn)位置、用戶個(gè)性化偏好等多方面因素的綜合影響,其推算過程與結(jié)果更為復(fù)雜?!半娚趟阉飨嚓P(guān)性”課題是一個(gè)有價(jià)值并且有挑戰(zhàn)的研究課題,其研究結(jié)果也將對(duì)整個(gè)電商領(lǐng)域的搜索推薦算法有深遠(yuǎn)影響。
隨著短視頻、直播等各種新模式的出現(xiàn),消費(fèi)者對(duì)于推薦系統(tǒng)有著更多元化以及更高的要求,對(duì)于消費(fèi)者需求的認(rèn)知推理工作也就必須獲得更系統(tǒng)化的解決方案。正是基于此,天池在全球月活用戶和流量最大的電商平臺(tái)手機(jī)淘寶的推薦系統(tǒng)上,不斷打磨和落地第二代AI系統(tǒng)認(rèn)知智能計(jì)算平臺(tái)。
該平臺(tái)主要包括三個(gè)模塊:基礎(chǔ)數(shù)據(jù)層、推理引擎層和用戶交互層。數(shù)據(jù)基礎(chǔ)層專注跨領(lǐng)域知識(shí)圖譜的構(gòu)建,打通跨域跨場(chǎng)景各類行為數(shù)據(jù),全方位建模經(jīng)濟(jì)體內(nèi)行為,差異化理解多模態(tài)行為數(shù)據(jù)背后的含義,在意圖感知的實(shí)時(shí)性與認(rèn)知深度間做平衡,層次化強(qiáng)化消費(fèi)者理解。推理引擎層則聚焦多模態(tài)預(yù)訓(xùn)練和理解,對(duì)商品理解和進(jìn)行全域召回,加強(qiáng)手淘生態(tài)建設(shè),利用超大規(guī)模圖神經(jīng)網(wǎng)絡(luò)系統(tǒng)進(jìn)行消費(fèi)者意圖推理。用戶交互層,則會(huì)通過用戶交互的視覺智能和文本智能,通過短視頻改變和引導(dǎo)購(gòu)后消費(fèi)者心智,理解消費(fèi)者意圖,助力消費(fèi)者決策,同時(shí)填補(bǔ)目前學(xué)界和業(yè)界空白的基于用戶交互的弱監(jiān)督內(nèi)容理解方向。
以科研加速計(jì)劃為契機(jī),逐步上線數(shù)據(jù)集開放計(jì)劃
云計(jì)算的逐步普及為各高校和科研院所大大降低了計(jì)算能力的成本負(fù)擔(dān),優(yōu)質(zhì)數(shù)據(jù)的稀缺成為了科研機(jī)構(gòu)和個(gè)人開發(fā)者在研究過程中的較大阻礙,很大程度上影響了學(xué)術(shù)研究的前瞻性與先進(jìn)性。
作為一名研二海洋遙感領(lǐng)域研究生,越天驕在疫情期間除了上網(wǎng)課,還需要完成畢業(yè)論文初步研究。但目前能夠搜索到的開源數(shù)據(jù)在精度和實(shí)效性上,顯然不能滿足越天驕的研究需要。如何獲取數(shù)據(jù)成為越天驕論文完成階段的最大問題。在天池平臺(tái)上活躍著大量類似越天驕這樣的學(xué)生。他們希望能夠有優(yōu)質(zhì)的開源數(shù)據(jù)集幫助他們論文的完成與發(fā)表。
為了更好的滿足開發(fā)者科研場(chǎng)景需求,天池將在未來推出三方合作的垂類數(shù)據(jù)集開放,陸續(xù)推出海洋、天文、醫(yī)療、農(nóng)業(yè)、工業(yè)、交通、新零售等垂類開放入口,致力于打造業(yè)界數(shù)量和質(zhì)量雙領(lǐng)先的AI數(shù)據(jù)集開放門戶。告別過去數(shù)據(jù)滯后單一等問題,為各科研機(jī)構(gòu)和AI開發(fā)者們提供海量?jī)?yōu)質(zhì)數(shù)據(jù)集。通過深層次的資源共享開放,推進(jìn)人工智能相關(guān)學(xué)科的建設(shè)與研發(fā),吸引各環(huán)境中的潛在AI開發(fā)者,賦能AI領(lǐng)域人才培養(yǎng),進(jìn)一步加速我國(guó)人工智能領(lǐng)域相關(guān)工作向更高層次發(fā)展。
當(dāng)然,優(yōu)質(zhì)的數(shù)據(jù)集離不開大量用戶共同參與內(nèi)容生成共享。未來,天池還將聯(lián)合數(shù)據(jù)合作方發(fā)布數(shù)據(jù)集創(chuàng)新大賽、數(shù)據(jù)集長(zhǎng)期英雄榜等活動(dòng),通過一系列賽事活動(dòng),號(hào)召全球AI領(lǐng)域人才關(guān)注加入,豐富數(shù)據(jù)集的數(shù)據(jù)多樣性與準(zhǔn)確性,同時(shí)為各開發(fā)團(tuán)隊(duì)提供數(shù)據(jù)助力,在更廣范圍內(nèi)形成人工智能領(lǐng)域的共贏生態(tài)效應(yīng)。