2023-09-07 14:46:17
9月7日,2023騰訊全球數字生態大會于深圳成功舉辦。會上,騰訊集團副總裁、政企業務總裁李強提到,針對傳染病和癌癥等疾病領域面臨的耐藥性問題,騰訊量子實驗室構建了一個海量的 MdrDB 耐藥性數據庫,樣本量達到 10 萬。
豐富的數據量,能夠為 AI 進行藥物的耐藥性測試提供足夠的訓練樣本,使用 MdrDB 的 AI 耐藥性預測精準度提升 30%。目前,MdrDB 已向行業和學術機構全面開放,已有來自 6 個大洲的 43 個國家和地區的 3000 多名用戶和機構訪問和調用 MdrDB 耐藥性數據庫。
對于一款新藥來說,研發投入大、周期長、失敗率高,注定是一個向死而生的過程。數據顯示,藥物從最初的實驗研究到最終上市,平均要花費12年時間、60多億美元、6000多個實驗,才能最終得到1個新藥。
數據樣本不足,更是成為全世界研發新藥面臨的最大問題。基于此,騰訊量子實驗室此前推出了全球領先的耐藥性數據庫MdrDB,相關內容已經收錄于Nature 旗下的 Communications Chemistry 期刊。
耐藥性是醫藥領域面臨的一大挑戰,突變誘導耐藥性是導致藥物治療失效的重要原因之一。騰訊量子實驗室構建的MdrDB耐藥性數據庫致力于提供大量與蛋白質結構突變誘導的耐藥性相關的數據。
該數據庫包括了野生型和突變型蛋白質-配體復合物的結構信息,以及突變前后的結合親和力變化等生化特征。通過MdrDB,科學家可以更好地理解突變誘導的耐藥性機制,開發聯合治療策略,并發現全新的藥物。
數據庫目前包含了來自240種蛋白質、2503個突變和440種藥物組合的100537個樣本。與現有公開的耐藥性數據庫相比,具有多項優勢。首先,它是目前最大的蛋白質突變誘導耐藥數據庫,涵蓋了各種蛋白質家族的突變信息。其次,提供了結構化的數據,有助于研究蛋白質突變和耐藥性建模。此外,還包含多種突變類型,包括單點突變和復雜的多位點突變,進一步豐富了數據庫的內容。
通過使用MdrDB數據庫,研究人員在耐藥性預測方面取得了顯著進展。此前,由于數據少、不平衡以及缺乏結構信息等問題,耐藥性的精確預測一直是一個巨大的挑戰。在構建了MdrDB數據庫后,作者也考察了該數據庫對耐藥性預測的AI算法的幫助。結果發現,幾乎所有使用MdrDB作為訓練數據的經典機器學習模型在酪氨酸激酶抑制劑耐藥性預測問題上都取得了顯著的性能提升。這為開發更精準的耐藥性預測方法提供了更強大的底層工具。
的發布為科學家們提供了寶貴的資源,將推動更多的研究人員共同開展耐藥性研究。通過更全面、更方便地獲取蛋白質結構和配體結合親和力數據,我們可以加深對突變誘導的耐藥性機制的理解,提高對全新突變的預測能力,并為耐藥性預測提供更有效的計算方法。
的發布標志著耐藥性研究邁出了重要一步,有望為未來藥物開發和治療方案的優化帶來新的希望。騰訊量子實驗室負責人張勝譽表示,“AI for Science的一個常見困難是數據的數量不足,內容和標準也各異。這項工作在幫助補齊AI科學中數據短板的方向邁出堅實的一步,緩解了相關問題中AI算法過擬合和泛化差的普遍性問題。通過提供更大規模的數據集,我們致力于幫助改善AI算法的性能,提高其在科學研究中的泛化能力,進一步推動AI在醫藥領域的發展和應用,以更好地服務人類健康。”
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP