The Unknome:研究人員剛剛創建了一個我們最神秘基因的數據庫
為了增加我們對基因藍圖的理解,研究人員建立了一個我們幾乎一無所知的基因數據庫。
雖然我們知道這些基因存在并編碼蛋白質,但我們不知道它們的用途。
“很明顯,科學研究傾向于關注經過充分研究的蛋白質,導致人們擔心知之甚少的基因被不合理地忽視,”研究者來自英國MRC分子生物學實驗室(LMB)的解釋。
“為了解決這個問題,我們開發了一個公開可用且可定制的'Unknome數據庫'。
人類基因組序列的粗略草案已經有20年了。首次發布,包含數以萬計的基因。
從那以后,我們學到了很多東西,先進的技術像CRISPR一樣,但仍有數以萬計的這些基因仍然是神秘的。
到目前為止,這些基因被科學忽視的原因有很多,分子生物學家Jo?o Rocha及其同事解釋說。
它們包括資金和同行評審系統更傾向于支持對已經證明具有臨床重要性的基因的研究,或者在實驗室物種中更豐富或更廣泛的基因。
Unknome數據庫根據對蛋白質基因的了解程度對蛋白質基因進行排名,這些蛋白質基因適用于人類和實驗室環境中通常研究的其他物種。
為了證明如何使用這個數據庫,研究人員隨后采集了260個在數據庫中被列為高度未知的基因樣本,這些基因也可以在實驗室蒼蠅中找到。果蠅基因組。
他們系統地刪除了發育中的蒼蠅的共同基因。許多蒼蠅沒有存活下來,這表明這些基因中的每一個編碼的蛋白質在動物生物學中起著至關重要的作用。
“這些未表征的基因不值得他們忽視,”說分子生物學家肖恩·芒羅。
通過僅在某些組織中去除基因的表達,而不是在果蠅內的其他組織中,研究人員能夠確定它們的一些功能。一些與男性生育能力、發育和壓力反應相關的基因。
“通過識別問題被無意和不合理地忽視的情況,有可能加速科學進步,”該團隊寫.
Rocha及其同事現在已經確定了人類基因組中那些被忽視的問題,因此現在由世界各地的研究人員來幫助加速這一進展。
“我們的數據庫提供了一個強大,多功能和高效的平臺,可以識別和選擇功能未知的重要基因進行分析,從而加速縮小unknome所代表的生物學知識差距,”門羅總結道.
這項研究發表于公共科學圖書館生物學.