行業(yè)新焦點|上訊信息:以深度學(xué)習(xí)技術(shù)為核心,打造企業(yè)級數(shù)據(jù)搜索引擎
在美國東海岸微軟云數(shù)據(jù)中心,代碼總量超350G的ChatGPT正飛速推衍,開啟人工智能應(yīng)用新時代。那么,技術(shù)人員如何看待ChatGPT?如何將相關(guān)技術(shù)應(yīng)用于企業(yè)服務(wù)?
從量變到質(zhì)變,深度學(xué)習(xí)技術(shù)是關(guān)鍵
近期,由ChatGPT引發(fā)的話題長期霸屏。在李玉亮看來,ChatGPT的爆火并非一蹴而就,而是經(jīng)歷多年積累,相關(guān)技術(shù)實現(xiàn)了從量變到質(zhì)變突破的必然成果。
算法、算力和數(shù)據(jù)是人工智能的三要素,缺一不可。算法是人工智能的基礎(chǔ),ChatGPT背后的框架則是深度學(xué)習(xí)技術(shù)。2017年,谷歌發(fā)布全新自然語言處理模型架構(gòu)Transformer,取代此前主流的卷積神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò),并逐漸衍生出新的深度學(xué)習(xí)模型訓(xùn)練機制,即預(yù)訓(xùn)練+微調(diào)模型。這一模型使得深度學(xué)習(xí)技術(shù)應(yīng)用效果實現(xiàn)質(zhì)的飛躍。在算法一步步迭代革新、全球算力水平大幅提升以及大量數(shù)據(jù)訓(xùn)練的加持下,ChatGPT最終進化到令人驚嘆的程度。
值得一提的是,深度學(xué)習(xí)技術(shù)不僅能讓對話變得更加智能,在其他領(lǐng)域的應(yīng)用成效也十分突出,數(shù)據(jù)治理便是其中之一。早在企業(yè)成立前,上訊信息團隊已在IT領(lǐng)域深耕多年。2010年,上訊信息在上海浦東軟件園注冊創(chuàng)立,并設(shè)立研發(fā)中心,逐漸形成自主研發(fā)產(chǎn)品、國外一線安全產(chǎn)品增值分銷、安全服務(wù)三大主營業(yè)務(wù)體系。李玉亮正是在這一時期加入上訊信息,開始基于領(lǐng)先技術(shù)研發(fā)數(shù)據(jù)治理、數(shù)據(jù)智能產(chǎn)品。
打通關(guān)鍵節(jié)點,打造企業(yè)級數(shù)據(jù)搜索引擎
數(shù)據(jù)是數(shù)字經(jīng)濟時代的關(guān)鍵生產(chǎn)要素。2023年初,《數(shù)字中國建設(shè)整體布局規(guī)劃》(簡稱《規(guī)劃》)印發(fā),首次對數(shù)字中國建設(shè)提出宏觀規(guī)劃。李玉亮說道:“《規(guī)劃》提及要夯實數(shù)字基礎(chǔ)設(shè)施和數(shù)據(jù)資源體系兩大基礎(chǔ),數(shù)據(jù)在數(shù)字中國建設(shè)中的重要性不言而喻。在企業(yè)的經(jīng)營中,數(shù)據(jù)同樣被視為新時代的‘石油’,其價值的開發(fā)利用是企業(yè)數(shù)字化轉(zhuǎn)型成功與否的關(guān)鍵,但恰恰在數(shù)據(jù)搜索這一關(guān)鍵環(huán)節(jié),難點頗多。”
企業(yè)數(shù)據(jù)量龐大且增長快速,往往分散在不同的部門、數(shù)據(jù)庫甚至數(shù)據(jù)中心,數(shù)據(jù)分析師查找所需數(shù)據(jù)時無異于大海撈針。在此背景下,上訊信息著力打造企業(yè)級數(shù)據(jù)搜索引擎——數(shù)據(jù)智能平臺DIP。該平臺以深度學(xué)習(xí)技術(shù)為核心,通過數(shù)據(jù)目錄、數(shù)據(jù)服務(wù)和數(shù)據(jù)訪問三大功能組件,提供企業(yè)數(shù)據(jù)資產(chǎn)目錄自動化梳理、智能數(shù)據(jù)分類分級保護、全局數(shù)據(jù)搜索推薦、統(tǒng)一數(shù)據(jù)申請審批和安全數(shù)據(jù)訪問等一站式服務(wù),讓數(shù)據(jù)使用既安全合規(guī)又便捷高效。
李玉亮特別提到:“借助業(yè)界先進的AI算法,在上訊信息數(shù)據(jù)智能平臺DIP中,數(shù)據(jù)消費者不僅可以通過關(guān)鍵字進行數(shù)據(jù)查找,還可以通過數(shù)據(jù)查找數(shù)據(jù),甚至通過智能推薦查看關(guān)聯(lián)數(shù)據(jù)?!詳?shù)搜數(shù)’是上訊信息的一項革命性技術(shù)?!?/span>
探索永無止境,加速數(shù)據(jù)消費時代到來
隨著《數(shù)據(jù)安全法》和《個人信息保護法》的陸續(xù)頒布和實施,數(shù)據(jù)分類分級保護成為重要的監(jiān)管要求。企業(yè)中的重要數(shù)據(jù)和個人信息存在于不同的字段里,利用人工打標簽的方式進行數(shù)據(jù)分類分級,成本高且耗時長,即便使用自動化分類分級工具,也僅僅只有20%-30%的準確率。李玉亮表示,使用DIP后,數(shù)據(jù)分類分級準確率可提升至80%-90%,在重點數(shù)據(jù)分類分級中,準確率還將更高,幫助企業(yè)節(jié)省大量的人力和時間成本。
在談及DIP相較于傳統(tǒng)數(shù)據(jù)治理產(chǎn)品的領(lǐng)先之處時,李玉亮說道:“DIP摒棄了物理歸集模式,采用邏輯歸集方式實現(xiàn)數(shù)據(jù)高效利用,具有輕量化、成本低、易于部署等優(yōu)勢?!币詳?shù)據(jù)消費者而非數(shù)據(jù)管理者為服務(wù)對象,DIP始終以解決數(shù)據(jù)查找難題為目標,在AI技術(shù)與深度學(xué)習(xí)技術(shù)的創(chuàng)新應(yīng)用方面處于國內(nèi)領(lǐng)先地位。目前,DIP已在制造業(yè)、金融業(yè)和大型國企、央企中落地應(yīng)用。
李玉亮認為,未來是數(shù)據(jù)消費時代,數(shù)據(jù)搜索則是數(shù)據(jù)消費的第一步,DIP的使命是讓數(shù)據(jù)消費更高效、更便捷。探索之路永無止境,上訊信息將持續(xù)深化深度學(xué)習(xí)、知識圖譜等技術(shù)在數(shù)據(jù)搜索引擎中的研發(fā)應(yīng)用,讓數(shù)據(jù)搜索更精準、智能推薦更全面,助力企業(yè)釋放數(shù)據(jù)價值。