密碼:

兩會 | 全國人大代表蔣太交:布局建設(shè)國家生物數(shù)據(jù)中心體系粵港澳大灣區(qū)節(jié)點(diǎn)


20240307223738075T0017.png

生命健康科學(xué)研究已進(jìn)入數(shù)據(jù)密集型大模型時代,而生物數(shù)據(jù)庫主要由美國國家生物技術(shù)信息中心(NCBI)和歐洲生物信息學(xué)研究所(EBI)兩個中心領(lǐng)導(dǎo),中國在這個方面缺乏國際影響力。EBI負(fù)責(zé)人Rolf Apweiler指出兩個問題:中國缺少一個明確的代表性科學(xué)中心可以代表中國接軌國際;中國科學(xué)家使用了歐洲生物信息學(xué)研究所超過三分之一的資源,但在數(shù)據(jù)和數(shù)據(jù)庫維護(hù)上缺乏貢獻(xiàn)。黨中央高度重視生物大數(shù)據(jù)資源發(fā)展,提出了國家生物數(shù)據(jù)中心“1+N”體系建設(shè)思路。國家發(fā)改委先期聚焦組學(xué)數(shù)據(jù)立項(xiàng)了“1”國家生物信息中心,“N”僅聚焦文獻(xiàn)數(shù)據(jù)立項(xiàng)了國家生物醫(yī)學(xué)文獻(xiàn)信息中心,尚缺乏以疾病為核心的系統(tǒng)全面的數(shù)據(jù)資源。

粵港澳大灣區(qū)建設(shè),是習(xí)近平總書記親自謀劃、親自部署、親自推動的重大國家戰(zhàn)略,也是我國經(jīng)濟(jì)發(fā)展重要區(qū)域與對外經(jīng)貿(mào)交流的南大門,GDP超全國總量12%,其中,大健康產(chǎn)業(yè)是粵港澳大灣區(qū)核心支柱產(chǎn)業(yè)之一。通過大數(shù)據(jù)的匯聚和關(guān)聯(lián)分析能夠更快、更直接地發(fā)現(xiàn)新知識、新機(jī)制、新規(guī)律,驅(qū)動新技術(shù)、新成果的快速誕生與產(chǎn)業(yè)應(yīng)用。據(jù)文獻(xiàn)報(bào)道,以“臨床+多組學(xué)”為主的生物醫(yī)學(xué)數(shù)據(jù)基礎(chǔ)設(shè)施支持了2/3以上FDA獲批的原研藥研發(fā)工作,每年獲得巨額產(chǎn)業(yè)回報(bào)。因此,建設(shè)支撐生命健康科學(xué)研究與生物醫(yī)藥產(chǎn)業(yè)創(chuàng)新發(fā)展的生物醫(yī)學(xué)數(shù)據(jù)節(jié)點(diǎn),既是粵港澳大灣區(qū)經(jīng)濟(jì)持續(xù)繁榮的必然要求,也是落實(shí)粵港澳大灣區(qū)國家戰(zhàn)略的重要支撐。

近百年來,對人類生命健康產(chǎn)生深遠(yuǎn)影響的重大突發(fā)公共衛(wèi)生事件無一不是由呼吸系統(tǒng)傳染病導(dǎo)致的?;浉郯拇鬄硡^(qū)地處亞熱帶,氣候溫和適合病毒傳播,同時還是我國對外經(jīng)貿(mào)交流的南大門,入境人數(shù)占全國90%以上,常住人口超8000萬人,是傳染病“外防輸入、內(nèi)防傳播”的重點(diǎn)區(qū)域。在粵港澳大灣區(qū)建立支撐呼吸系統(tǒng)傳染病監(jiān)測預(yù)警與快速主動應(yīng)對的生物醫(yī)學(xué)數(shù)據(jù)節(jié)點(diǎn),是及時了解疫情動態(tài)、制定科學(xué)有效防控策略的必要手段。通過收集并加以整理分析區(qū)域內(nèi)生物醫(yī)學(xué)數(shù)據(jù)與境內(nèi)外呼吸道傳染病的病例數(shù)據(jù)、病毒基因序列、人體多組學(xué)數(shù)據(jù)、流行病學(xué)信息等重要數(shù)據(jù),可及時了解全球范圍內(nèi)呼吸道傳染病疫情的頻發(fā)和傳播速度、疫情動態(tài)與防控策略,發(fā)現(xiàn)疫情的時空分布規(guī)律、預(yù)測疫情的爆發(fā)趨勢,為公共衛(wèi)生防控決策提供決策支持和科學(xué)依據(jù),最大程度地保護(hù)我國人民群眾的健康安全。

因此,廣州國家實(shí)驗(yàn)室作為國家戰(zhàn)略科技力量,以解決新發(fā)突發(fā)病原重大疫情預(yù)測預(yù)警、呼吸系統(tǒng)疾病及其防控領(lǐng)域關(guān)鍵核心為己任,有意愿、有能力承建與長期運(yùn)行國家生物數(shù)據(jù)中心體系粵港澳大灣區(qū)節(jié)點(diǎn),助力我國生命健康科學(xué)研究與生物醫(yī)藥產(chǎn)業(yè)高質(zhì)量發(fā)展。

在廣東省廣州市的支持下,廣州國家實(shí)驗(yàn)室開展了前期工作,在軟硬件、數(shù)據(jù)資源和管理模式上已形成完善的小試到中試的技術(shù)能力,獲得了一系列初步成果,并具備清晰可落地的技術(shù)和市場轉(zhuǎn)化服務(wù)路徑。比如自主研發(fā)了支撐大規(guī)模算力資源管理、智能工具開發(fā)與集成、大模型驅(qū)動到跨平臺資源共享的市場化工業(yè)軟件系統(tǒng)—“生物醫(yī)學(xué)大數(shù)據(jù)操作系統(tǒng)(Bio-OS)”;接入了50萬余全球人類基因組數(shù)據(jù)集、10000余算子鏡像;匯聚了15PB數(shù)據(jù);建成了27億參數(shù)垂直領(lǐng)域大模型;啟動了百萬呼吸健康人群隊(duì)列研究,以及生物醫(yī)學(xué)科研與數(shù)據(jù)治理大模型建設(shè);與全國近1000家醫(yī)院達(dá)成戰(zhàn)略合作協(xié)議,與多所港澳科研機(jī)構(gòu)建立戰(zhàn)略合作關(guān)系;建設(shè)了5年可產(chǎn)出約400PB高質(zhì)量多組學(xué)數(shù)據(jù)與基礎(chǔ)實(shí)驗(yàn)數(shù)據(jù)的全鏈條科研平臺。

建議充分發(fā)揮國家實(shí)驗(yàn)室“總平臺總鏈長”作用,以及廣州國家實(shí)驗(yàn)室在生物醫(yī)藥領(lǐng)域深厚積淀,建設(shè)面向呼吸系統(tǒng)疾病領(lǐng)域的“國家生物數(shù)據(jù)中心體系粵港澳大灣區(qū)節(jié)點(diǎn)”。