美研制出新工具 可將基因序列轉譯成圖像
美國科學家開發出一個可將DNA序列轉譯成圖像的新工具,這將有助于鑒別導致癌癥、亨廷頓氏癥以及其他遺傳疾病的DNA圖譜的實時變化,從而使研究人員能更迅速、更有效地區分遺傳模式。
北卡羅來納州立大學計算機科學系博士生戴維·考克斯設計的這個“符號散點圖”工具,給DNA序列提供了一個可視化的示意圖。考克斯解釋說,與現存的那些試圖找出重復DNA序列的計算機程序相比,人類的視覺系統更善于識別圖樣,并在圖樣之間進行區分。換言之,肉眼看圖的能力目前要強于計算機。
確定DNA序列中的圖樣是很重要的,因為它能幫助研究人員在癌癥等疾病患者和健康人之間鑒別實時的基因變異。改進相關DNA序列的鑒別力,將有望加快開發出各種疾病的更成功的治療方法,并允許研究人員將重點放在和疾病相關的部分DNA上,使人們增強對這些疾病遺傳機制的了解。譬如,到底是什么打開或關閉了某個特定基因?
那么,符號散點圖工具是如何創建DNA的可視化示意圖的呢?DNA由4種核苷酸組成,分別用字母A、T、G和C表示,這些核苷酸的每三個字母串,如AAA或ATG等稱為3基體(3-mers)。考克斯解釋說,有64種3基體,每個3基體用數字0至63來表示。符號散點圖工具將用一個很長的字符串來表示DNA序列,并將其以一個個的3基體形式分開。為每個3基體畫一個點,將數字0至63作為Y軸。X軸則代表3基體出現在基因序列中的順序。由此產生的散點圖就可揭示原始DNA中的有趣圖樣。將這些散點串在一起就能制成動畫用來比較DNA序列。
考克斯選擇3基體的原因是其與密碼子相關,密碼子是人體在蛋白質過程中插入一個特定氨基酸所用的遺傳代碼。換句話說,他們監督蛋白質(人體基本構建模塊)的產生。
考克斯說,盡管3基體有64個,但只有20個氨基酸,所以每個氨基酸對應3個多一點的3基體。考克斯設計的這個符號散點圖可使這些對應相應氨基酸的3基體能夠彼此相鄰。如此一來,就很容易判斷何時3基體中的一個出現明顯差異,即從一個氨基酸變成了另一個氨基酸。
美研制出新工具 可將基因序列轉譯成圖像