密碼:

從24小時到7分鐘——社員于浩澎帶領(lǐng)團隊刷新基因分析“中國速度”


基因測序是一種新型基因檢測技術(shù),基因測序和分析技術(shù)現(xiàn)已應用于生育健康、腫瘤個體化診斷和治療、遺傳病、傳染病檢測、疫苗研發(fā)等領(lǐng)域。人類首次完成人類基因組測序耗費了13年,隨著技術(shù)的不斷發(fā)展,到了2019年,測序時間被縮短到了1天,但這些測序數(shù)據(jù)的分析卻額外還需要1天。這樣的分析速度仍不足以支撐基因測序真正廣泛推廣到臨床應用上。想要提升分析效率,繼續(xù)縮短該階段的時間,這是一個世界級的難題。

近日,四川大學華西醫(yī)院生物醫(yī)學大數(shù)據(jù)中心將人類全基因組分析時間從24小時縮短至7分鐘,刷新了基因分析的“中國速度”,具有跨時代的意義。這也意味著,該項研究成果直接加速了基因測序從科研到臨床的進程,未來將有更多精準的基因數(shù)據(jù)輔助于醫(yī)療診斷及治療。

九三學社成都市委社員、華西生物醫(yī)學大數(shù)據(jù)中心于浩澎副研究員負責的這項突破性的研發(fā)成果發(fā)布后,引起了央視新聞的關(guān)注,并進行了專題報道。于浩澎在接受采訪中分享了在基因分析領(lǐng)域追求極致的探索。

于浩澎介紹,按照傳統(tǒng)方案,我們獲取一個人的遺傳變異信息,大概需要24小時。現(xiàn)在經(jīng)過我們方案優(yōu)化,在7分鐘內(nèi)就可以完成,因為我們進行了兩個方面的突破,一個是計算算力的瓶頸打破,一個是存儲性能的瓶頸打破。之所以能實現(xiàn)時間上質(zhì)的突破,根本在于打破計算算力和儲存性能的瓶頸。他將其形象地比喻為吃得快的“大嘴巴”和裝得下的“大肚子”:“大嘴巴”實現(xiàn)了大文件的直通讀取和小文件的聚合讀取,數(shù)據(jù)讀取的效率更高,“大肚子“可以對數(shù)據(jù)分析的各個作業(yè)流程進行融合調(diào)度的優(yōu)化,I/O流更加順暢,從而實現(xiàn)了“吃得更多、消化更快”。

研發(fā)團隊在全基因組數(shù)據(jù)分析加速上,以GATK流程為基礎(chǔ),經(jīng)過不斷的流程拆分與重組改寫、不斷的分布式存儲軟硬優(yōu)化打磨,最終完成了速度的飛躍,實現(xiàn)了30X人類全基因組測序胚系變異分析時間從24小時到7分鐘的極限壓縮,同時保證了分析結(jié)果的準確性:和GATK結(jié)果高度一致。

于浩澎是九三學社成都市社員,四川大學華西醫(yī)院副研究員,華西生物醫(yī)學大數(shù)據(jù)中心數(shù)據(jù)科學家,主要從事生物信息學、醫(yī)療大數(shù)據(jù)和腎臟疾病相關(guān)研究。先后主持國家自然科學基金青年基金、四川省重點研發(fā)面上項目,骨干參研國家重點研發(fā)計劃、國家自然科學基金重點項目等國家、省、部級重大科技項目6項。近十年在Cell Stem Cell, Nature Communication, Nucleic Acids Research等國際著名學術(shù)期刊上發(fā)表SCI論著20余篇,其中以第一及通訊作者發(fā)表論文5篇,平均影響因子10.7。任四川省生物信息學會委員,F(xiàn)rontiers in Genetics、Genomics Protomeics Bioinformatics等SCI期刊審稿編輯。

于浩澎表示,將繼續(xù)努力做好科學研究,揭開基因的神秘面紗,用更精準的基因數(shù)據(jù)輔助醫(yī)療診斷及治療,為醫(yī)學進步發(fā)展做出更大的貢獻,促進人類的健康福祉。