基礎醫學

人工智能算法——基因組研究的“瑞士軍刀”

作者:佚名 來源:生物穀 日期:2019-12-02
導讀

         每個分子遺傳學家都希望找到一個易於使用的程序,可以比較來自不同細胞條件的數據集,識別增強子區域,然後將其分配給目標基因。

        每個分子遺傳學家都希望找到一個易於使用的程序,可以比較來自不同細胞條件的數據集,識別增強子區域,然後將其分配給目標基因。

        如今,柏林馬克斯·普朗克分子遺傳學研究所的馬丁·溫格隆(Martin Vingron)領導的研究小組現已開發出一個掌握所有這些內容的程序。 “ DNA非常無聊,因為它在每個細胞中幾乎都一樣。如果將基因組比作生命之書,那麼我對旁注則更感興趣。”這些“旁注”是指附著在DNA分子上的小化學標記,它們不會改變遺傳信息本身,但會影響相應位點上DNA發生的變化。換句話說,這些標記具有表觀遺傳作用。它們充當負責啟動子和增強子等基因激活和失活的基因組區域的調節劑。

        在許多複雜的疾病中,基因的表觀遺傳控製無法正常工作,這對科學家非常感興趣。然而,在實驗室中對這些區域的分析通常是麻煩,費時且複雜的。這就是為什麼Vingron和他的團隊決定開發一個新的程序包的過程。

        該程序包稱為條件特定的調節單元預測(CRUP),它可以簡化分析並解決一些實際問題。開發該軟件包的生物信息學家Verena Heinrich說:“我們希望通過一個簡單的通用程序將增強子預測過程中的常見步驟結合在一起。” CRUP在許多方麵簡化了分析。機器學習算法不限於特定的細胞或組織類型。無需在每次分析數據集之前重新校準它,並且可以對多個數據係列進行比較研究。該工具由Heinrich和博士生Anna Ramisch開發,仍然易於使用。

        CRUP專門鑒定和表征增強子-刺激或“增強”基因轉錄的DNA片段。這些區域吸引附著在啟動子序列上的蛋白質,該啟動子序列充當每個基因的開關。然而,哪種增強子在正確的時間控製正確的基因通常仍然是一個謎。

        基因組包含成千上萬個增強子,它們在細胞生命的不同階段(如生長,維持或疾病期間)具有活性。當DNA像羊毛線一樣緊密地堆積在稱為組蛋白的載體蛋白線軸上時,調節序列處於“靜止”狀態。它們僅通過對組蛋白的化學修飾而產生影響。

        這些ChIP數據是新開發程序的初始輸入值。 CRUP首先檢查所有序列,然後判斷它是否是增強子。分類算法基於使用小鼠胚胎幹細胞的信息進行訓練的人工智能產生。正如Heinrich和她的同事在德國表觀基因組計劃(DEEP)提供的一係列數據中所展示的那樣,它可以檢測許多其他動物物種或組織中的增強子區域。

        在第二步中,可以向CRUP導入多個數據集,程序會找到它們之間的區別。這使得可以解釋一係列的測量結果或查明組織之間的差異。隨著時間的流逝,或者在比較健康和患病的組織時,增強子的表觀遺傳變化變得顯而易見。分析的第三步也是最後一步是將基因映射到它們各自的增強子。為了實現這一目標,CRUP將增強子分析與轉錄數據聯係起來,轉錄數據揭示了哪些基因是活躍的,而實驗則表明了DNA鏈的哪些部分彼此靠近。

        最後,研究人員在實際環境中測試了他們的程序。他們分析了患有免疫性類風濕關節炎的小鼠的組織,並將其與健康動物的數據進行了比較。 CRUP確定了增強子區域中的200多個差異,其中一些在其他研究中已經與該疾病相關。 CRUP分配給這些增強子的基因也已顯示在疾病中起作用。

        Vingron說:“我們的程序可靠地識別出與疾病相關的增強子的候選物,並將其與靶基因聯係起來。”他的團隊希望該新工具將使該領域更容易使用,並加快研究速度,以幫助確定複雜的人類疾病的原因。

分享:

相關文章

評論

我要跟帖
發表
回複 小鴨梨
發表

copyright©醫學論壇網 版權所有,未經許可不得複製、轉載或鏡像

京ICP證120392號  京公網安備110105007198  京ICP備10215607號-1  (京)網藥械信息備字(2022)第00160號
//站內統計 //百度統計 //穀歌統計 //站長統計
*我要反饋: 姓    名: 郵    箱: