
在分子靶向藥物設計中,打分函數(shù)(scoring function)可以定量計算藥物-靶標之間的相互作用,具有適用性好,計算速度快、精度良好等優(yōu)點,廣泛地應用于分子對接、虛擬篩選、從頭設計等各種用途。因此,發(fā)展性能更加優(yōu)良的打分函數(shù)一直是該領域中一個競爭激烈的課題。發(fā)展打分函數(shù)需要大量已知親合性實驗數(shù)據(jù)的蛋白-配體復合物樣本作為知識基礎。但是這樣的知識散布在海量的文獻中,無法被研究者有效地利用。另外,人們往往更關注研究理論方法本身,而對收集支持理論研究的相關數(shù)據(jù)缺乏熱情。“巧婦難為無米之炊”,這種局面在很大程度上制約了理論方法的進一步發(fā)展。
我室王任小研究員課題組多年來對蛋白-配體相互作用打分函數(shù)有系統(tǒng)的研究。他們敏銳地抓住了這一瓶頸問題,投入極大的精力構建了PDBbind-CN數(shù)據(jù)庫,致力于系統(tǒng)地收集Protein Data Bank數(shù)據(jù)庫中各類生物大分子復合物的親合性實驗數(shù)據(jù)(Bioinformatics,2015; 31(3), 405-412)。他們逐步發(fā)展了一套程序流程,能夠以比較高的準確率從整個PDB數(shù)據(jù)庫中辨別出各種類型復合物,并人工查閱了大量的原始文獻,收集實驗測定的親合性數(shù)據(jù),并將這些復合物的三維結構信息和它們的親合性數(shù)據(jù)整合在一個可以通過Web界面訪問的數(shù)據(jù)庫中(http://www.pdbbind-cn.org/)。自2007年公開發(fā)布以來,該課題組每年定期對PDBbind-CN數(shù)據(jù)庫進行更新,數(shù)據(jù)量每年增長幅度超過10%(見下表)。迄今累計已經(jīng)查閱了近30000篇原始文獻,最新的2016版本中收錄了16179種復合物的親合性實驗數(shù)據(jù)和三維結構信息。
表1、PDBbind-CN數(shù)據(jù)庫歷年版本的簡要情況

PDBbind-CN數(shù)據(jù)庫是國際上首例系統(tǒng)地歸納PDB數(shù)據(jù)庫中復合物結構信息和親合性實驗數(shù)據(jù)的數(shù)據(jù)庫,為打分函數(shù)研究提供了豐富的素材,一舉打破了該領域中曾經(jīng)存在的瓶頸。就數(shù)據(jù)庫的規(guī)模、數(shù)據(jù)的質(zhì)量以及更新的及時性而言,PDBbind-CN數(shù)據(jù)庫均明顯優(yōu)于競爭對手,是我國科學家在藥物分子設計領域中取得的一項標志性成果。該數(shù)據(jù)庫提供的高質(zhì)量信息在國際上得到了大量的應用,不僅服務于打分函數(shù)研究,也被廣泛地應用于藥物構效關系分析、藥物-靶標作用網(wǎng)絡等研究。該數(shù)據(jù)庫目前擁有來自60多個國家的3600余名注冊用戶,其中許多來自國際一流大學、研究機構以及醫(yī)藥公司。網(wǎng)站訪問總量已超過470萬次,而且在持續(xù)快速增長中。根據(jù)我們的文獻調(diào)研,國內(nèi)外已有190余項應用PDBbind-CN數(shù)據(jù)庫進行的各種研究得以公開發(fā)表。
近日,王任小研究員受美國化學會Accounts of Chemical Research雜志邀請,撰寫文章介紹了這部分工作。該文章已經(jīng)在線發(fā)表:Liu, Zhihai; Su, Minyi; Han, Li; Liu, Jie; Yang, Qifan; Li, Yan; Wang, Renxiao *, "Forging the Basis of Scoring Function Development",?Accounts of Chemical Research,?2017, DOI:?10.1021/acs.accounts.6b00491
上述研究工作得到國家重大科學研究計劃、中國科學院戰(zhàn)略性先導科技專項、國家自然科學基金委、生命有機化學國家重點實驗室及中國科學院上海有機化學研究所的大力支持與資助。
附件下載: