編碼區
編輯基因的編碼區,也稱為編碼序列 (CDS),是基因的 DNA 或 RNA 中編碼蛋白質的部分。 與不同物種和時間段的非編碼區相比,研究編碼區的長度、組成、調控、剪接、結構和功能,可以提供有關原核生物和真核生物基因組織和進化的大量重要信息。 這可以進一步幫助繪制人類基因組圖和開發基因療法。
定義
編輯雖然這個術語有時也與外顯子互換使用,但它們并不完全相同:外顯子由編碼區以及 RNA 的 3' 和 5' 非翻譯區組成,因此,外顯子 將部分由編碼區組成。 RNA 的 3' 和 5' 非翻譯區不編碼蛋白質,稱為非編碼區,本頁不予討論。
編碼區和外顯子組之間經常存在混淆,但這些術語之間有明顯的區別。 外顯子組是指基因組中的所有外顯子,而編碼區是指專門編碼某種蛋白質的 DNA 或 RNA 的單個部分。
歷史
編輯1978 年,Walter Gilbert 發表了 Why Genes in Pieces 一書,首先開始探索基因是一個嵌合體的想法——每條完整的核酸鏈不是連續編碼的,而是被沉默的非編碼區打斷的。 這是xxx個跡象表明需要區分基因組中編碼蛋白質的部分(現在稱為編碼區)和不編碼的部分。
組成
編輯證據表明,堿基組成模式和編碼區可用性之間存在普遍的相互依賴關系。 編碼區被認為比非編碼區包含更高的 GC 含量。 進一步研究發現,編碼鏈越長,GC含量越高。 短編碼鏈的 GC 含量相對較低,類似于 TAG、TAA 和 TGA 等堿基組成翻譯終止密碼子的低 GC 含量。
富含 GC 的區域也是比例點突變類型略有改變的地方:與顛換相比,轉換更多,即從嘌呤到嘌呤或嘧啶到嘧啶的變化,即從嘌呤到嘧啶或嘧啶到嘌呤的變化。 轉換不太可能改變編碼的氨基酸并保持沉默突變(特別是如果它們發生在密碼子的第三個核苷酸),這通常在翻譯和蛋白質形成過程中對生物體有益。
這表明與輔助和非必需區域(基因貧乏)相比,必需編碼區域(富含基因)的 GC 含量更高,并且更穩定和抗突變。 然而,目前尚不清楚這是通過中性隨機突變還是通過選擇模式實現的。 還存在關于用于確定 GC 含量和編碼區域之間關系的方法(例如基因窗口)是否準確和公正的爭論。
結構與功能
編輯在 DNA 中,編碼區的兩側是模板鏈 5' 端的啟動子序列和 3' 端的終止序列。 在轉錄過程中,RNA 聚合酶 (RNAP) 與啟動子序列結合并沿著模板鏈移動到編碼區。 RNAP 然后添加與編碼區互補的 RNA 核苷酸以形成 mRNA,用尿嘧啶代替胸腺嘧啶。 這一直持續到 RNAP 到達終止序列。
轉錄和成熟后,形成的成熟 mRNA 包含多個對其最終翻譯成蛋白質很重要的部分。 mRNA 中的編碼區兩側是 5' 非翻譯區 (5'-UTR) 和 3' 非翻譯區 (3'-UTR)、5' 帽和 Poly-A 尾。 在翻譯過程中,核糖體有助于將 tRNA 附著到編碼區,一次附著 3 個核苷酸(密碼子)。 tRNA 將它們相關的氨基酸轉移到不斷增長的多肽鏈上,最終形成在初始 DNA 編碼區中定義的蛋白質。
法規
編輯可以修飾編碼區以調節基因表達。
烷基化是編碼區的一種調節形式。 可以通過靶向特定序列來沉默本應被轉錄的基因。 該序列中的堿基將被烷基封閉,從而產生沉默效應。
雖然基因表達的調節管理著細胞中 RNA 或蛋白質的豐度,但這些機制的調節可以通過在 DNA 鏈中開放閱讀框開始之前發現的調節序列來控制。 然后調節序列將決定蛋白質編碼區表達發生的位置和時間。
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/228753/