亚洲欧美在线人成|亚洲国产日韩欧美综合久久|亚洲国产精品综合久久网络|精品福利日韩欧美综合天天网

    <strike id="msocu"><fieldset id="msocu"></fieldset></strike>
  • <th id="msocu"></th>
    <table id="msocu"></table>
  • <button id="msocu"><dd id="msocu"></dd></button><option id="msocu"><dd id="msocu"></dd></option>
  • <wbr id="msocu"></wbr>
  • <pre id="msocu"></pre>
    您當(dāng)前的位置 :熱點(diǎn) >
    助力新藥研發(fā) 騰訊推全球最大耐藥性數(shù)據(jù)庫(kù)
    2023-07-06 10:53:20   來源:科技頭條  分享 分享到搜狐微博 分享到網(wǎng)易微博

    7月5日消息,騰訊公司5日宣布,已搭建一個(gè)海量的 MdrDB 耐藥數(shù)據(jù)庫(kù),提供最全的數(shù)據(jù)信息,為 AI 研發(fā)新藥提供耐藥預(yù)測(cè)測(cè)試的「練兵場(chǎng)」。

    【資料圖】

    據(jù)悉,這是騰訊量子實(shí)驗(yàn)室的最新研究成果,相關(guān)研究論文已登上了國(guó)際學(xué)術(shù)期刊 Nature 的子刊 Communications Chemistry。

    看過電影《我不是藥神》就知道:癌癥患者后期,使用的靶向藥物經(jīng)常出現(xiàn)耐藥,需要尋找新的替代藥物。不止癌癥,艾滋和抗生素藥物都會(huì)產(chǎn)生耐藥。這是由于癌細(xì)胞和病原體的蛋白突變所導(dǎo)致的。

    打個(gè)比方,關(guān)鍵蛋白是解決癌細(xì)胞/病原體的「門鎖」,但由于細(xì)胞進(jìn)化和藥物刺激,蛋白突變幾乎不可避免。而無法預(yù)知蛋白的突變方向,就無法定向研發(fā)能夠解決疾病的藥物來做“鑰匙”。

    AI 學(xué)習(xí),可以為預(yù)測(cè)蛋白、研制新藥提速。但全世界都面臨的最大問題是——蛋白突變的數(shù)據(jù)樣本不足,對(duì)耐藥測(cè)試造成了很大的數(shù)據(jù)缺口。

    針對(duì)數(shù)據(jù)量不足,騰訊發(fā)布的 MdrDB 耐藥數(shù)據(jù)庫(kù),首先在量上做到第一:從包括 GDSC、DepMap 等公開的行業(yè)數(shù)據(jù)集內(nèi),搜集了接 10萬個(gè)樣本,總共收納了 240 種蛋白質(zhì)(總共 5119 個(gè) PDB 結(jié)構(gòu))、2503 個(gè)突變和 440 種藥物,涵蓋了各種蛋白質(zhì)家族的突變信息。

    這個(gè)樣本量總共達(dá)到了 10 萬,是行業(yè)第二名的 100 倍。豐富的數(shù)據(jù)量,能夠?yàn)?AI 進(jìn)行藥物的耐藥測(cè)試提供足夠的訓(xùn)練樣本。

    為了讓 AI 更好消化數(shù)據(jù),量子實(shí)驗(yàn)室耗時(shí)半年,搭建了一套數(shù)據(jù)的加工流程:通過細(xì)胞系的數(shù)據(jù)清洗,數(shù)據(jù)庫(kù)內(nèi)將野生型蛋白、突變蛋白等蛋白質(zhì)類型,單點(diǎn)突變、刪除突變等突變類型分門別類,方便AI隨時(shí)「調(diào)閱」。

    最后,通過自研的 Mutfold 蛋白質(zhì)突變預(yù)測(cè)臺(tái)和蛋白質(zhì)折疊算法,能就生成一個(gè)可視化的蛋白質(zhì)三維結(jié)構(gòu)「鎖孔」樣本,可供進(jìn)行藥物分子的結(jié)合模擬,提供耐藥數(shù)據(jù)。

    新藥研發(fā),必須經(jīng)過大量的測(cè)試,以確認(rèn)能夠匹配突變蛋白。更全面、更多維的數(shù)據(jù)庫(kù),能更有效助力進(jìn)行突變誘導(dǎo)耐藥的預(yù)測(cè)、聯(lián)合治療策略的開發(fā)以及創(chuàng)新藥物的研發(fā)。

    在海量數(shù)據(jù)的加持下,MdrDB 也實(shí)現(xiàn)了能的突破:在就 MdrDB 與其它行業(yè)公開耐藥數(shù)據(jù)庫(kù)作為訓(xùn)練數(shù)據(jù)、分別在10種經(jīng)典機(jī)器學(xué)習(xí)模型上進(jìn)行測(cè)試的實(shí)驗(yàn)中,與其它數(shù)據(jù)庫(kù)相比,模型的預(yù)測(cè)值與真實(shí)值的均方根誤差從 0.907 下降至 0.656,相關(guān)從 0.094 提升至 0.607,耐藥的分類能則從 0.243 提升至 0.538。

    經(jīng)過測(cè)試,使用 MdrDB 的AI耐藥預(yù)測(cè)精準(zhǔn)度提升30%。這也是自2020年打造 AI 藥物研發(fā)臺(tái)云深智藥(idrug)以來,騰訊又一次探索前沿技術(shù)助力藥物研發(fā)。

    目前,MdrDB 已向行業(yè)和學(xué)術(shù)機(jī)構(gòu)全面開放。未來,MdrDB 還將持續(xù)更新耐藥數(shù)據(jù)。



    [責(zé)任編輯:ruirui]





    關(guān)于我們| 客服中心| 廣告服務(wù)| 建站服務(wù)| 聯(lián)系我們
     

    中國(guó)焦點(diǎn)日?qǐng)?bào)網(wǎng) 版權(quán)所有 滬ICP備2022005074號(hào)-20,未經(jīng)授權(quán),請(qǐng)勿轉(zhuǎn)載或建立鏡像,違者依法必究。