歡迎訪問北京大學(xué)干部培訓(xùn)網(wǎng)站!
24小時(shí)咨詢熱線
點(diǎn)擊數(shù):2360 時(shí)間:2021-11-02 16:55 來源:北京大學(xué)
應(yīng)北京大學(xué)“大學(xué)堂”頂尖學(xué)者講學(xué)計(jì)劃的邀請,芝加哥豐田計(jì)算技術(shù)研究所許錦波教授于2021年10月27日作題為“人工智能與蛋白質(zhì)折疊”的學(xué)術(shù)講座。
10月27日上午,許錦波參觀北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心(BIOPIC),并與中心研究員們進(jìn)行了深入交流討論,下午在燕京學(xué)堂報(bào)告廳進(jìn)行學(xué)術(shù)報(bào)告。報(bào)告由北京大學(xué)李兆基講席教授謝曉亮主持。
許錦波作報(bào)告
準(zhǔn)確描述蛋白質(zhì)結(jié)構(gòu)和功能是理解生命過程的基礎(chǔ)。許錦波簡要介紹了人工智能預(yù)測蛋白質(zhì)結(jié)構(gòu)的背景知識(shí)。根據(jù)Anfinsen法則,蛋白質(zhì)“正常折疊”出的三維結(jié)構(gòu)由它的一級(jí)結(jié)構(gòu)所決定,因此知曉氨基酸序列便可以預(yù)測出蛋白質(zhì)結(jié)構(gòu)。傳統(tǒng)的預(yù)測方法主要是基于模板結(jié)構(gòu)的建模方法,該類方法的缺點(diǎn)是不確定在PDB(Protein Data Bank)中能找到對應(yīng)的模板(例如膜蛋白),且預(yù)測出的結(jié)構(gòu)更像模板而不是真實(shí)的結(jié)構(gòu)。許錦波表示,蛋白質(zhì)中包含上千個(gè)原子,自由度高而且能量圖景不光滑難以優(yōu)化,這給傳統(tǒng)預(yù)測方法帶來了很大挑戰(zhàn)。
許錦波回顧了蛋白質(zhì)結(jié)構(gòu)預(yù)測的發(fā)展歷史。2016年前,預(yù)測蛋白質(zhì)結(jié)構(gòu)方法(例如片段拼接方法等)需要消耗大量計(jì)算資源,且成功率低。為了解決這一難題,科學(xué)家轉(zhuǎn)變研究思路:從需要預(yù)測的蛋白質(zhì)氨基酸序列出發(fā),檢索相關(guān)數(shù)據(jù)庫得到其多序列比對數(shù)據(jù)(multiple-sequence alignments,MSAs),進(jìn)而得到氨基酸殘基對的關(guān)系矩陣(如接觸矩陣和距離矩陣),最終預(yù)測出結(jié)構(gòu)。
2016年,許錦波團(tuán)隊(duì)開發(fā)出基于ResNet的RaptorX-Contact方法。該方法將蛋白質(zhì)中所有氨基酸殘基對相互作用作為Image Map處理,同時(shí)預(yù)測全部的氨基酸殘基相互作用,將結(jié)構(gòu)預(yù)測問題轉(zhuǎn)換為圖像處理中的圖像語義分割問題,并結(jié)合深度卷積殘差網(wǎng)絡(luò)(ResNet)進(jìn)行預(yù)測。許錦波表示,在CASP12(Critical Assessment of protein Structure Prediction)蛋白質(zhì)結(jié)構(gòu)預(yù)測競賽中,RaptorX-Contact方法得分具首位,第一次證明了深度學(xué)習(xí)方法預(yù)測蛋白質(zhì)結(jié)構(gòu)的可行性。值得一提的是,此方法對膜蛋白結(jié)構(gòu)預(yù)測及蛋白相互作用的結(jié)構(gòu)預(yù)測依然有效。他特別舉例介紹到,5f5pH蛋白質(zhì)與其同源蛋白質(zhì)3thfA具有部分結(jié)構(gòu)相似性,傳統(tǒng)方法因使用模板結(jié)構(gòu),預(yù)測的結(jié)果更接近同源蛋白3thfA,而RaptorX-Contact方法無需拷貝模板結(jié)構(gòu),因此能預(yù)測出與模板結(jié)構(gòu)不同的正確結(jié)構(gòu)。
2017—2019年間,許錦波團(tuán)隊(duì)成功實(shí)現(xiàn)從接觸矩陣預(yù)測到距離矩陣預(yù)測的飛躍,使蛋白質(zhì)結(jié)構(gòu)預(yù)測準(zhǔn)確度更加精準(zhǔn)。其團(tuán)隊(duì)2021年發(fā)表在Nature Machine Intelligence雜志上的最新成果證明了機(jī)器學(xué)習(xí)不僅僅是對共進(jìn)化信息的去噪與信號(hào)放大,還可以學(xué)到更深層的系列-結(jié)構(gòu)關(guān)聯(lián)及預(yù)測人工設(shè)計(jì)的蛋白質(zhì)結(jié)構(gòu)。
對于人工智能預(yù)測蛋白質(zhì)結(jié)構(gòu)未來的發(fā)展趨勢,許錦波認(rèn)為將主要集中在更好的使用序列與結(jié)構(gòu)信息以及新型的深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)等方向上。他還簡要介紹了目前剛剛發(fā)表的AlphaFold2。他認(rèn)為在殘基層面上,AlphaFold2要優(yōu)異于其它算法,但對于高分子量、具有多個(gè)結(jié)構(gòu)域的蛋白質(zhì)來說,準(zhǔn)確預(yù)測它們結(jié)構(gòu)域之間的空間位置關(guān)系依然存在挑戰(zhàn)。
謝曉亮主持
現(xiàn)場提問
報(bào)告結(jié)束后,許錦波與現(xiàn)場師生們就人工智能預(yù)測蛋白質(zhì)結(jié)構(gòu)相關(guān)問題進(jìn)行了熱烈的交流討論。
本次活動(dòng)由北京大學(xué)主辦,北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心(BIOPIC)、國際合作部承辦,并得到了光華教育基金會(huì)、北京大學(xué)教育基金會(huì)的支持。講座同步在燕云直播平臺(tái),北京大學(xué)微信公眾號(hào)、視頻號(hào)、快手、抖音、嗶哩嗶哩等官方賬號(hào)直播,播放量達(dá)14.5萬人次。
當(dāng)前頁面鏈接:http://www.huan66.cn/s-show/14922.html