在COVID-19大流行爆發(fā)后不到1年,專業(yè)人員從診斷第一例病例到接種疫苗。除其他突破外,基因組學(xué)進步被廣泛認為是對疾病的快速理解和疫苗的快速部署。
自2003年對第一個全人類基因組進行測序以來,基因組學(xué)在醫(yī)療保健和生命科學(xué)行業(yè)已經(jīng)變得司空見慣,導(dǎo)致基因組數(shù)據(jù)呈指數(shù)級增長。每個人類基因組包含的數(shù)據(jù)足以填滿200本電話簿。這些數(shù)據(jù)中蘊含著改變生活的發(fā)現(xiàn),包括對疾病原因的了解,這些發(fā)現(xiàn)可以導(dǎo)致治療。但是疾病原因 - 通常是“錯別字”或基因序列突變 - 可能很難找到;基因組數(shù)據(jù)受到高度監(jiān)管并存儲在孤立的數(shù)據(jù)湖中,進一步阻礙了研究。
面臨這一挑戰(zhàn)的是Lifebit Biotech Ltd.(Lifebit瑞威生物科技有限公司),這是亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)的精選咨詢合作伙伴。Lifebit與生物樣本庫、研究機構(gòu)和制藥公司合作,提供分析臨床基因組數(shù)據(jù)集的解決方案,以加速藥物發(fā)現(xiàn)、診斷、疾病監(jiān)測、藥物反應(yīng)預(yù)測和健康模型。
解鎖對孤立基因組數(shù)據(jù)的訪問
Lifebit CloudOS 是一個完全聯(lián)合的云操作系統(tǒng),它使用 AWS 解鎖臨床基因組數(shù)據(jù),用于藥物和生物標志物的發(fā)現(xiàn)。這促進了更大的研究合作,使藥物開發(fā)和疾病預(yù)防迅速增加。在COVID-19大流行開始時,Genomics England(GEL)轉(zhuǎn)向Lifebit CloudOS。作為群體基因組學(xué)的先驅(qū),GEL負責(zé)監(jiān)督100,000個基因組計劃,這是一個癌癥和罕見病全基因組的隊列。
早期的基因組學(xué)研究依賴于更少,更小的數(shù)據(jù)集,該行業(yè)可以依靠集中式技術(shù)來分析這些數(shù)據(jù)。因此,數(shù)據(jù)保護法規(guī)更加寬松,協(xié)作更易于管理。但由于基因組數(shù)據(jù)已成為歷史上最大的數(shù)據(jù)來源,該系統(tǒng)無法支持今天的研究。“數(shù)據(jù)集中化不再可行或負擔(dān)得起,”Lifebit商業(yè)副總裁Thorben Seeger說。“數(shù)據(jù)太大,無法有效移動,許多法規(guī)禁止數(shù)據(jù)離開組織、州或國家。因此,這些數(shù)據(jù)集中有80-90%無法用于研究。“GEL被廣泛稱為基因組學(xué)的'諾克斯堡',”Seeger說。“但是當你鎖定數(shù)據(jù)時,幾乎不可能訪問或與其他數(shù)據(jù)組合。
Lifebit 重新設(shè)計了用于保護數(shù)據(jù)的傳統(tǒng)模型,將其計算引擎和分析功能引入數(shù)據(jù)本身。這種新模型由 Amazon Elastic Compute Cloud (Amazon EC2) 提供支持,Amazon Elastic Compute Cloud (Amazon EC2) 是一種 Web 服務(wù),可在云中提供安全、可調(diào)整大小的計算容量。“我們正在 AWS 上的客戶自己的環(huán)境中部署我們的尖端研究,”Seeger 說。“每個用戶都會收到一個潔凈室環(huán)境,以分別訪問和分析數(shù)據(jù)。完全托管的服務(wù)在不犧牲安全性或控制力的情況下提供了最大的研究效用。”
Lifebit 使用 AWS 高度可擴展的云功能來獲得所需的計算能力,以適應(yīng)數(shù)據(jù)集大小與結(jié)果之間的指數(shù)關(guān)系。該公司處理存儲數(shù)據(jù)超過 100 PB 的項目,需要數(shù)十億個虛擬 CPU 小時。“我們使用整個 AWS 計算流程來更快、更高效地運行生產(chǎn)管道,”Seeger 說。“這一點至關(guān)重要,因為GEL需要快速的數(shù)據(jù)處理才能更快地獲得見解。
建立安全、強大的協(xié)作服務(wù)
在COVID-19大流行期間,GEL與英國政府啟動了一項計劃,向八家領(lǐng)先的制藥公司以及研究機構(gòu)提供隊列,以推動疫苗,治療和早期檢測研究。該隊列包括來自20,000名COVID-19重癥病例患者和15,000名輕度病例患者的測序基因組,以及來自100,000個基因組計劃的數(shù)據(jù)。然而,GEL需要一個聯(lián)合數(shù)據(jù)分析系統(tǒng)來使該隊列可供多方使用。“我們正在建立一個新的研究環(huán)境,我們需要一家能夠在7-8周內(nèi)上線的公司,”GEL首席商務(wù)官Parker Moss說。
Lifebit 基于 GEL 現(xiàn)有的 AWS 架構(gòu)構(gòu)建,可在 3 個月內(nèi)交付完全實時的系統(tǒng)。如今,制藥公司和研究人員可以訪問隊列并連接自己的私有數(shù)據(jù)集。“用戶的外部數(shù)據(jù)不會進入GEL環(huán)境,”Moss說。“但是,通過聯(lián)合鏈接,您可以像研究數(shù)據(jù)在一個地方一樣進行研究。這是一個非常強大的價值主張。該系統(tǒng)可節(jié)省時間并提供額外的保護。“數(shù)據(jù)保留在客戶的環(huán)境中,所有 AWS 安全功能都能確保數(shù)據(jù)安全,”Seeger 說。
在系統(tǒng)上,研究人員使用自動化工具在幾秒鐘內(nèi)安全地查詢、分析和協(xié)作處理大型數(shù)據(jù)集。“我們正在彌合安全性和可用性之間的二分法,”Seeger說。“這促進了GEL等公共機構(gòu),其他領(lǐng)先群體,研究機構(gòu)和私人機構(gòu)之間的全球合作。
在 AWS 上以基因組學(xué)的速度進行擴展
Lifebit CloudOS使基因組研究更容易獲得。“云與我們的數(shù)據(jù)環(huán)境相結(jié)合,是偉大的民主化者,”Seeger解釋說。“數(shù)以百萬計的研究人員可以按需訪問和執(zhí)行大數(shù)據(jù)分析 - 只有少數(shù)訓(xùn)練有素的高性能計算專家以前可以做到這一點。
至關(guān)重要的是,Lifebit 客戶及其用戶使用 Amazon Simple Storage Service (Amazon S3) 獲得幾乎無限的存儲,該服務(wù)可提供行業(yè)領(lǐng)先的可擴展性、數(shù)據(jù)可用性、安全性和性能。一個完整的人類基因組相當于120-300 GB的數(shù)據(jù),Lifebit正在對超過1000萬名患者運行數(shù)據(jù)庫進行模擬,這些患者具有數(shù)千個臨床和表型變量。“連接全球數(shù)據(jù)集正在推動種族基因組多樣性,”Seeger說。“這有助于我們了解一般的疾病,但也使我們能夠迎合以前服務(wù)不足的人群。
在 AWS 上,Lifebit 提供了一個系統(tǒng),該系統(tǒng)促成了生命科學(xué)史上最重要的云計算交易之一。“AWS 在醫(yī)療保健和生命科學(xué)市場的普及非常有幫助,”Seeger 說。“我們已經(jīng)從 AWS 看到了難以置信的靈活性,它在倫敦地區(qū)幫助我們設(shè)置了 GEL 聞名遐邇的安全。AWS 的規(guī)模和全球影響力對于我們追求大型政府計劃具有巨大的戰(zhàn)略意義。
加速藥物研究和疾病預(yù)防方面的全球合作
通過使用 AWS,Lifebit 使 GEL 能夠快速為 COVID-19 數(shù)據(jù)和分析提供研究環(huán)境?,F(xiàn)在,Lifebit正在與各國討論如何結(jié)合數(shù)據(jù)集以促進研究成果并加快癌癥和罕見疾病的藥物開發(fā)。“我們的聯(lián)合分析系統(tǒng)不僅只是為了服務(wù)一個國家或一個疾病隊列的單一目的而存在,”Seeger說。“它與世界各地的其他隊列合作,使這個科學(xué)領(lǐng)域成為有史以來最具協(xié)作性的領(lǐng)域。
Lifebit Biotech是人口基因組學(xué)軟件和人工智能藥物發(fā)現(xiàn)的全球領(lǐng)導(dǎo)者。它在北美,歐洲,中東,非洲和亞太地區(qū)開展業(yè)務(wù),為人口基因組學(xué)計劃,生物銀行,研究和制藥公司提供支持。
◊ 在不到3個月的時間內(nèi)推出聯(lián)合數(shù)據(jù)分析系統(tǒng)
◊ 處理超過 100 PB 的項目數(shù)據(jù)
◊ 支持對全球不同數(shù)據(jù)集的協(xié)作研究
◊ 遵守數(shù)據(jù)隱私法規(guī)
◊ 在客戶自己的環(huán)境中執(zhí)行分析
◊ 高效編排數(shù)十億個 CPU 小時
◊ 使生物信息學(xué)分析的可及性民主化
◊ 實現(xiàn)可持續(xù)的自籌資金商業(yè)模式
(內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系刪除)