AI新工具解決全新任務(wù)表現(xiàn)媲美人類
科技日?qǐng)?bào)北京2月1日電 (記者劉霞)一般而言,人工智能(AI)需要進(jìn)行特定訓(xùn)練才能勝任某項(xiàng)任務(wù)。英國(guó)“深度思維”公司開發(fā)出一款新型AI工具AdA,其能像人類一樣快速準(zhǔn)確地解決全新任務(wù),最新研究或是科學(xué)家朝著最終開發(fā)出通用AI邁出的重要一步。相關(guān)研究近日刊發(fā)于論文預(yù)印本網(wǎng)站。
人類擅長(zhǎng)在不同環(huán)境,包括全新環(huán)境中解決新問題,但AI系統(tǒng)往往只能解決被訓(xùn)練要解決的特定問題,當(dāng)游戲規(guī)則改變時(shí),它們可能會(huì)陷入困境。
“深度思維”在開發(fā)下棋游戲AI方面取得的成功很大程度上源于強(qiáng)化學(xué)習(xí),這種方式能讓AI學(xué)著如何在環(huán)境中拿到高分,表現(xiàn)出優(yōu)秀的成績(jī)。但即便如此,AI也必須再次接受訓(xùn)練,才能玩不同的游戲。
為克服這一限制,該公司一直在開發(fā)一種可在全新游戲中取得成功的AI。2021年,公司發(fā)布了新AI模型XLand,其可解決虛擬3D世界中的新任務(wù)。該虛擬環(huán)境包含70多萬個(gè)游戲,這些游戲都是自動(dòng)生成的,且只存在于虛擬世界中。
在最新研究中,“深度思維”團(tuán)隊(duì)通過在一組難度緩慢增加的數(shù)十億個(gè)任務(wù)上訓(xùn)練不同版本的XLand,開發(fā)出了AdA工具。
當(dāng)“深度思維”團(tuán)隊(duì)在30個(gè)全新的定制任務(wù)上測(cè)試ADA時(shí),其解決問題的表現(xiàn)和速度可與100名人類參與者相媲美,且能解決一些人們無法完成的任務(wù)。在規(guī)模更大、自動(dòng)化程度更高的1000項(xiàng)任務(wù)中,它可解決90%的任務(wù)。此外,該系統(tǒng)還可控制多個(gè)代理,讓其相互協(xié)調(diào)合作。
研究團(tuán)隊(duì)指出,能在不斷變化的環(huán)境中解決任務(wù)的AI,有望在人形機(jī)器人、自動(dòng)駕駛汽車等多個(gè)領(lǐng)域大顯身手。
(責(zé)任編輯:歐云海)