機器學(xué)習(xí)模型 助力探尋新冠病毒新變種
據(jù)新華社北京5月29日電 《參考消息》29日登載阿根廷布宜諾斯艾利斯經(jīng)濟新聞網(wǎng)報道。報道摘要如下:
麻省理工學(xué)院-哈佛大學(xué)布羅德研究所以及美國馬薩諸塞大學(xué)醫(yī)學(xué)院的科學(xué)家開發(fā)了一種機器學(xué)習(xí)模型,可以分析來自新冠病毒樣本的數(shù)百萬個基因組,并預(yù)測哪些病毒變體將占主導(dǎo)地位并可能引發(fā)新的浪潮。該模型被稱為PyR0,可以幫助研究人員確定病毒基因組的哪些部分最不可能發(fā)生突變,從而為可對抗未來變體的疫苗提供目標(biāo)。研究結(jié)果日前發(fā)表在美國《科學(xué)》周刊上。
研究人員使用截至2022年1月在流感數(shù)據(jù)共享全球倡議數(shù)據(jù)庫中的600萬個新冠病毒基因組訓(xùn)練了機器學(xué)習(xí)模型。
自新冠大流行開始以來,世界各地的研究人員一直致力于預(yù)測新冠病毒不同變體的適應(yīng)性。但以前的模型無法同時比較所有變體,或者僅處理幾千個基因組就需要數(shù)天時間。
相反,PyR0可以在大約1小時內(nèi)分析數(shù)百萬個基因組——所有公開可用的新冠病毒數(shù)據(jù)。它將相似的序列組合在一起,并通過它們共享的突變?nèi)簛矶x基因組的“組別”。通過聚焦可能出現(xiàn)在多個變體中的突變,PyR0比僅關(guān)注病毒變體的模型具有更強大的統(tǒng)計能力。
隨后,該模型可以確定哪些突變將越來越普遍,并估計每種突變導(dǎo)致病毒傳播的速度。它還可根據(jù)其基因組成估計不同變體的病例數(shù)量增加的速度。
通過確定哪些突變對哪些變體的適應(yīng)性很重要,該模型還提供了關(guān)于新冠病毒如何傳播和發(fā)展的生物學(xué)觀點。
(責(zé)任編輯:支艷蓉)