在未受關注領域開展研究才有更多可能
◎本報記者 張佳星
不久前,因收到的郵件標注著紅色字體“外部郵件、注意安全”,京東集團副總裁、京東探索研究院院長何曉冬博士并沒打開來看。幾天后他才得知,這是國際學術會議CIKM(國際信息和知識管理會議)通知他因十幾年前DSSM模型(雙塔模型)相關成果獲得“最佳時間檢驗獎”。
一篇論文,為什么10年后仍能被學術界記起并授予殊榮?它憑什么在獲得學術界超5000次引用的同時,成為產(chǎn)業(yè)界搜索推薦和人工智能領域的“基礎設施”?
人工智能已成為驅(qū)動新質(zhì)生產(chǎn)力的重要引擎,但我國一直被認為應用發(fā)展快速,原創(chuàng)模型成果不足。科技日報記者10月31日采訪了何曉冬,請他就我國如何以基礎模型推動新質(zhì)生產(chǎn)力可持續(xù)發(fā)展談談看法。
從“不被關注”中找到AI基礎架構
盡管2024年諾貝爾物理學獎頒給了人工神經(jīng)網(wǎng)絡的研究,但如果把時間倒回十幾年,人工神經(jīng)網(wǎng)絡甚至還沒躋身主流算法行列。
彼時,圈內(nèi)主流模型比如拓撲模型等已被研究得十分充分,但在賦予機器學習能力、揣度人類意圖上仍未解決算法復雜、效率不夠高的問題。人工神經(jīng)網(wǎng)絡架構剛剛進入業(yè)內(nèi),卻因?qū)嶒炓?guī)模小、難以體現(xiàn)優(yōu)勢而未受到關注。
當時還在微軟研究院的何曉冬第一時間對新架構產(chǎn)生了極大興趣。他說:“相比一個充分研究過的領域,在新領域探索意味著會有更多機會。如果能在微軟廣告這種大規(guī)模的應用上檢驗人工神經(jīng)網(wǎng)絡奏不奏效,將為整個人工智能行業(yè)給出證明,甚至明確發(fā)展路徑。”
“利用傳統(tǒng)模型,‘蘋果手機’和‘蘋果’的意思對于機器來說非常接近,而‘iPhone Pro’又與‘蘋果手機’相去甚遠!焙螘远忉,為了讓機器精準揣度人類意圖,要改變模型“度量”語義的方式,不著力于絕對含義而是度量含義的“相對距離”。
如何做到呢?DSSM模型(雙塔模型)研究人員最早進行語義向量化研究,用這種模型描述語義向量的距離相對值。這是整個互聯(lián)網(wǎng)搜索推薦技術發(fā)展脈絡的起點,也是大模型發(fā)展的重要基礎之一。
由于解決了語義相似度計算問題,DSSM模型成為深度語義學習方向最基礎的模型結構。圖靈獎得主等行業(yè)大咖2016年共同編撰的深度學習領域奠基性教材《Deep Learning(深度學習)》將DSSM模型列為推薦使用的基礎架構之一。
基礎研究被廣泛應用也需“流量密碼”
“和其他學者一樣,讓成果在長時間跨度中推動行業(yè)進步,經(jīng)受住時間檢驗是我的研究目標!焙螘远f,要讓基礎研究“固化”為基礎設施的“流量密碼”,首先應“大道至簡”,簡單的架構往往更友好,更易被理解、接納和發(fā)揚。其次,它還必須具備可以無限放大的包容性。
例如DSSM模型用簡單的“雙塔”設計分離了原本交織的計算,為用戶和物品匹配了獨立子網(wǎng)絡(“塔”),計算出結果后再匹配,解決計算復雜性問題。
好用的模型要具有反映復雜世界的能力,基本計算單元的設計是關鍵,例如生命的單元是細胞、神經(jīng)網(wǎng)絡的單元是神經(jīng)元。設計廣泛適用的基本單元,匹配“萬能”函數(shù),即可高效執(zhí)行大規(guī)模計算。何曉冬介紹,基于此,他們團隊在2013年用一臺八卡服務器,實現(xiàn)了千萬數(shù)量級語料的深度學習訓練。
強大的分析能力、更高的計算效率,使得這一模型在過去10余年被頭部搜索引擎、電商平臺等大量采用,產(chǎn)生了百億元量級的經(jīng)濟價值。
何曉冬告訴記者,做基礎研究很像在林子里打獵,很難說在哪里一定能打到,但如果獵人有驅(qū)動力、持續(xù)探索,打到的機會就能更多。計算機領域有著基礎研究也要推動快速應用的傳統(tǒng),比如密碼學這類純數(shù)學的科學也會發(fā)展出“電子簽名”等應用。因此,產(chǎn)業(yè)界的壓力和驅(qū)動將帶來更多基礎研究突破。
近年來,人工智能領軍企業(yè)對于基礎研究的重視程度不斷增加,京東、騰訊、阿里等均為科研人員創(chuàng)造開展原創(chuàng)性基礎研究的條件,且不以論文發(fā)表為考核標準。
“我進入京東后愈加意識到,技術在不同場景可產(chǎn)生不同價值。從產(chǎn)業(yè)角度看,搜索推薦、智能客服、數(shù)字人等技術都在產(chǎn)業(yè)界產(chǎn)生了以產(chǎn)品驅(qū)動的人工智能基礎設施的飛快突破!焙螘远硎,基礎模型研發(fā)和基礎理論創(chuàng)新是新質(zhì)生產(chǎn)力發(fā)展的長效“引擎”之一,將在豐富的場景土壤和產(chǎn)業(yè)需求中取得更多突破。
(責任編輯:歐云海)