新藥研發(fā)風(fēng)險大、周期長、成本高,如何在海量的化學(xué)分子中快速找到適合成藥的分子結(jié)構(gòu),是長期以來困擾科研人員的難題。西安交通大學(xué)第一附屬醫(yī)院劉冰教授團(tuán)隊在研發(fā)抗菌藥“肉桂酰菌素”的過程中,不僅研發(fā)周期大幅縮短,研發(fā)成本也降低了70%左右。原來,通過引入華為云與中科院上海藥物研究所共同訓(xùn)練的“盤古”藥物分子大模型,劉冰團(tuán)隊實(shí)現(xiàn)了針對小分子藥物全流程的人工智能輔助藥物設(shè)計,不僅減少了小分子化合物篩選的計算量,還通過篩選后的小分子化合物進(jìn)行定向優(yōu)化,降低了新藥可能產(chǎn)生的毒副作用。
當(dāng)前,以大模型為代表的人工智能技術(shù)飛速發(fā)展,改變著許多領(lǐng)域的科研范式和模式。“預(yù)訓(xùn)練大模型在大量圖像、文本等數(shù)據(jù)的基礎(chǔ)上將數(shù)據(jù)中蘊(yùn)含的知識‘提取’出來,存儲在具有大量參數(shù)的神經(jīng)網(wǎng)絡(luò)模型中。遇到特定任務(wù)時,只需調(diào)用規(guī)范化的流程,就能釋放預(yù)訓(xùn)練大模型的能力,并且與行業(yè)經(jīng)驗結(jié)合,解決實(shí)際業(yè)務(wù)問題。”華為云人工智能領(lǐng)域首席科學(xué)家田奇介紹。
“傳統(tǒng)人工智能算法落地存在‘碎片化’問題,往往要針對不同場景獨(dú)立完成模型選擇、數(shù)據(jù)處理、模型優(yōu)化、模型迭代等一系列開發(fā)環(huán)節(jié)。不同領(lǐng)域的數(shù)據(jù)差異巨大、微調(diào)技巧也有所不同,無法積累通用知識,開發(fā)效率也比較低。”田奇介紹,為解決這一難題,華為云“盤古”研發(fā)團(tuán)隊以預(yù)訓(xùn)練大模型為基礎(chǔ),通過結(jié)合行業(yè)知識,找到了一種“工業(yè)化開發(fā)”新模式,助力人工智能在多個行業(yè)落地應(yīng)用。
據(jù)田奇介紹,“盤古”大模型有3層架構(gòu),在不同層面構(gòu)建不同的能力。“最底層的是基礎(chǔ)模型,要做好海量基礎(chǔ)知識的學(xué)習(xí),相當(dāng)于‘讀萬卷書’;在此之上,針對不同的行業(yè)、不同的場景,進(jìn)行專項知識和經(jīng)驗的訓(xùn)練,打造好用、易用的行業(yè)模型和場景模型,相當(dāng)于‘行萬里路’。”
“盤古”大模型的定位,是為各行各業(yè)賦能:各行各業(yè)的開發(fā)者只需在“云”上找到自己所需的模型,然后針對行業(yè)場景進(jìn)行“小數(shù)據(jù)”微調(diào),即可獲得滿足使用需求的模型。目前,華為云已在各行業(yè)落地人工智能創(chuàng)新項目超過1000個,陸續(xù)推出了礦山、藥物分子、氣象、制造等大模型,為產(chǎn)業(yè)提供先進(jìn)的算法和解決方案。
以煤礦領(lǐng)域為例,“盤古”礦山大模型已覆蓋采、掘、機(jī)、運(yùn)、通、洗、選等環(huán)節(jié)的1000多個細(xì)分場景,有效提升了井下巡檢效率。目前,這項技術(shù)已在山東能源集團(tuán)的七大業(yè)務(wù)系統(tǒng)、21個業(yè)務(wù)場景落地應(yīng)用。
如何讓人工智能大模型真正賦能千行百業(yè)?華為輪值董事長胡厚崑認(rèn)為,發(fā)展人工智能關(guān)鍵是要腳踏實(shí)地、做深向?qū)?,真正為行業(yè)和科技創(chuàng)新服務(wù),助力產(chǎn)業(yè)升級。中國工程院院士鄔賀銓表示,要深入思考大模型的應(yīng)用方向,將大模型切實(shí)投入城市發(fā)展、生物醫(yī)藥、工業(yè)制造、科學(xué)研究等領(lǐng)域,為產(chǎn)業(yè)轉(zhuǎn)型升級創(chuàng)造實(shí)實(shí)在在的價值。