想必各位生物學(xué)家們已經(jīng)用慣了歐美的基因數(shù)據(jù)庫,那今天小編就為大家介紹一個(gè)由我國中科院打造的國產(chǎn)基因數(shù)據(jù)庫!
2024年2月28日,美國總統(tǒng)拜登正式簽署了《關(guān)于防止關(guān)注國家獲取美國公民大量敏感個(gè)人數(shù)據(jù)和美國政府相關(guān)數(shù)據(jù)的行政命令》,限制中國、俄羅斯、伊朗等六個(gè)“關(guān)注國家”訪問和利用包括基因組數(shù)據(jù)、生物識別數(shù)據(jù)等“敏感數(shù)據(jù)”。
因此,為應(yīng)對NCBI的“卡脖子”,構(gòu)建和發(fā)展中國人自己的生物基因數(shù)據(jù)庫已經(jīng)迫在眉睫。我國已成立了國家基因組科學(xué)數(shù)據(jù)中心(https://ngdc.cncb.ac.cn/)數(shù)據(jù)庫,包括原始測序數(shù)據(jù)歸檔庫GSA、基因組歸檔數(shù)據(jù)庫GWH、基因組變異數(shù)據(jù)庫GVM、非編碼RNA等。
一、數(shù)據(jù)庫建立
根據(jù)科技部、財(cái)政部2019年6月聯(lián)合發(fā)布的通知,國家基因組科學(xué)數(shù)據(jù)中心正式啟動建設(shè),其依托單位為中國科學(xué)院北京基因組研究所,同時(shí)聯(lián)合了生物物理研究所及上海營養(yǎng)與健康研究所共同參與。
該中心的建設(shè)旨在應(yīng)對我國基因組學(xué)領(lǐng)域在數(shù)據(jù)存儲、管理、應(yīng)用方面的實(shí)際需求,并著力解決“數(shù)據(jù)孤島”與“數(shù)據(jù)主權(quán)”等核心挑戰(zhàn)。中心聚焦人、動物、植物和微生物等基因數(shù)據(jù)資源,核心任務(wù)包括構(gòu)建國家級數(shù)據(jù)庫體系、持續(xù)擴(kuò)充數(shù)據(jù)資源規(guī)模、提供專業(yè)數(shù)據(jù)服務(wù)、保障系統(tǒng)穩(wěn)定運(yùn)行、推進(jìn)關(guān)鍵技術(shù)創(chuàng)新及深化數(shù)據(jù)挖掘應(yīng)用。
目標(biāo)是建成國際領(lǐng)先的基因組科學(xué)數(shù)據(jù)平臺,推動科學(xué)數(shù)據(jù)開放共享,確保數(shù)據(jù)安全可控,有力支撐國家科技創(chuàng)新體系與經(jīng)濟(jì)社會發(fā)展戰(zhàn)略。
目前,中心配備了一支90余人的專業(yè)團(tuán)隊(duì),擁有超過5000個(gè)CPU計(jì)算核心及總量逾8PB的數(shù)據(jù)存儲能力,并已研發(fā)部署多個(gè)多組學(xué)數(shù)據(jù)庫系統(tǒng)。
二、數(shù)據(jù)庫工作
中心的工作重點(diǎn)集中于三個(gè)核心方向:
1. 構(gòu)建中國人群精準(zhǔn)醫(yī)學(xué)信息庫: 聚焦普惠健康目標(biāo),整合中國人群精準(zhǔn)醫(yī)學(xué)相關(guān)組學(xué)數(shù)據(jù)資源,系統(tǒng)構(gòu)建其基因組遺傳變異圖譜。
2. 打造國家級原始組學(xué)數(shù)據(jù)共享平臺: 基于高通量測序產(chǎn)生的超大規(guī)模原始數(shù)據(jù),建設(shè)符合國際規(guī)范的組學(xué)數(shù)據(jù)歸檔庫,促進(jìn)國內(nèi)原始數(shù)據(jù)的開放共享。
3. 建立綜合性多組學(xué)數(shù)據(jù)庫體系: 圍繞國家關(guān)鍵戰(zhàn)略生物資源,整合海量組學(xué)數(shù)據(jù),發(fā)展數(shù)據(jù)挖掘與應(yīng)用技術(shù),形成支持科研與轉(zhuǎn)化的綜合體系。
國家基因組科學(xué)數(shù)據(jù)中心(NGDC)建成了涵蓋九大類別、共計(jì)112項(xiàng)的數(shù)據(jù)資源體系,包括原始測序數(shù)據(jù)、基因組與變異信息、基因表達(dá)譜、非編碼RNA、表觀基因組圖譜、單細(xì)胞組學(xué)數(shù)據(jù)、生物多樣性與生物合成、健康與疾病關(guān)聯(lián)數(shù)據(jù)以及文獻(xiàn)與教育資源。其核心平臺——基因組序列歸檔庫(GSA),作為生命科學(xué)組學(xué)數(shù)據(jù)的匯交、存儲與共享中樞,已獲得國際權(quán)威認(rèn)可,并于2023年入選“全球核心生物數(shù)據(jù)資源”(Global Core Biodata Resources, GCBR),成為我國目前唯一入選的生物數(shù)據(jù)庫。
NGDC整合的多元數(shù)據(jù)資源廣泛覆蓋基因組學(xué)、轉(zhuǎn)錄組學(xué)、表觀遺傳學(xué)、單細(xì)胞研究、人類健康與疾病機(jī)制解析、動植物資源多樣性等多個(gè)前沿領(lǐng)域。這些高度集成的數(shù)據(jù)庫群為全球科研界提供了關(guān)鍵數(shù)據(jù)支撐,顯著促進(jìn)了基礎(chǔ)研究成果向?qū)嶋H應(yīng)用的深度轉(zhuǎn)化。
依托強(qiáng)大的多組學(xué)數(shù)據(jù)整合能力,NGDC有效驅(qū)動了個(gè)性化醫(yī)療實(shí)踐、疾病機(jī)理探索、農(nóng)作物遺傳改良以及動物健康管理等領(lǐng)域的突破性進(jìn)展,同時(shí)在藥物靶點(diǎn)發(fā)現(xiàn)、重大疾病防控及精準(zhǔn)診療策略開發(fā)中奠定了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。尤其在人類健康研究、疾病相關(guān)基因組變異解析、腫瘤學(xué)研究以及衰老與長壽機(jī)制探索等領(lǐng)域,NGDC提供的資源與服務(wù)有力加速了科研成果的臨床轉(zhuǎn)化與產(chǎn)業(yè)應(yīng)用。
此外,NGDC提供的開放數(shù)據(jù)訪問接口與先進(jìn)可視化工具,顯著增強(qiáng)了跨學(xué)科、跨機(jī)構(gòu)間的協(xié)作效率與交流深度,已成為支撐全球生命科學(xué)創(chuàng)新研究與技術(shù)發(fā)展的重要基礎(chǔ)設(shè)施。
三、數(shù)據(jù)內(nèi)容與數(shù)據(jù)上傳
NGDC包含以下類型的數(shù)據(jù)內(nèi)容:
基因組數(shù)據(jù):涵蓋各種生物(包括植物、動物、微生物等)的基因組序列數(shù)據(jù),這些數(shù)據(jù)對于理解生物的遺傳多樣性和進(jìn)化歷史至關(guān)重要。
轉(zhuǎn)錄組數(shù)據(jù):提供RNA測序數(shù)據(jù),這些數(shù)據(jù)有助于研究基因表達(dá)模式、轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)以及在不同條件下的基因活性變化。
蛋白質(zhì)組數(shù)據(jù):包括蛋白質(zhì)的結(jié)構(gòu)、功能和相互作用信息,對于理解生物分子機(jī)制和開發(fā)新藥物具有重要意義。
代謝組數(shù)據(jù):涉及生物體內(nèi)的代謝途徑和代謝產(chǎn)物,對于研究生物的生理功能和代謝疾病有重要作用。
表觀遺傳數(shù)據(jù):包括基因變異和表型數(shù)據(jù),這些數(shù)據(jù)對于理解遺傳疾病、育種和進(jìn)化適應(yīng)具有重要作用。
環(huán)境數(shù)據(jù):涉及生物與其環(huán)境相互作用的數(shù)據(jù),如環(huán)境壓力響應(yīng)、生態(tài)位點(diǎn)分布等。
NGDC接受以下類型的數(shù)據(jù)上傳:
原始測序數(shù)據(jù):包括但不限于Illumina、PacBio等平臺生成的原始測序數(shù)據(jù),這些數(shù)據(jù)可以是基因組、轉(zhuǎn)錄組或蛋白質(zhì)組數(shù)據(jù)。
分析結(jié)果:用戶可以上傳自己分析得到的結(jié)果,如差異表達(dá)基因列表、聚類結(jié)果、功能注釋等。
元數(shù)據(jù):如樣本信息、實(shí)驗(yàn)設(shè)計(jì)、測序參數(shù)等,這些數(shù)據(jù)有助于其他研究者理解數(shù)據(jù)的來源和背景。
出版物相關(guān)數(shù)據(jù):與已發(fā)表或即將發(fā)表的研究相關(guān)的數(shù)據(jù),這些數(shù)據(jù)可以增加研究的透明度和可重復(fù)性。
第三方數(shù)據(jù):其他數(shù)據(jù)庫或研究團(tuán)隊(duì)共享的數(shù)據(jù),這些數(shù)據(jù)可以豐富NGDC的數(shù)據(jù)資源。
此篇文章只是簡單介紹NGDC的基本情況,關(guān)于該數(shù)據(jù)庫的使用方法及功能我們會持續(xù)介紹,敬請期待!
【免責(zé)聲明】發(fā)布內(nèi)容來源于互聯(lián)網(wǎng)、業(yè)內(nèi)人士投稿以及微信公眾號等公開資源,我們對文中觀點(diǎn)持中立態(tài)度,文中觀點(diǎn)不代表本平臺的立場。所有文章僅供讀者參考和交流使用。轉(zhuǎn)載的文章版權(quán)歸原作者所有,如有侵權(quán)行為,請及時(shí)與我們聯(lián)系以便刪除。