什么是蛋白質設計

編輯

蛋白質設計是新蛋白質分子的合理設計，旨在設計新的活性，行為或目的，并增進對蛋白質功能的基本了解。可以從頭開始設計蛋白質（從頭設計），也可以通過對已知蛋白質結構及其序列進行計算得出的變體進行設計（稱為蛋白質重新設計）。合理的蛋白質設計方法可以預測蛋白質序列，并將其折疊成特定的結構。然后可以通過諸如肽合成，定點誘變或人工基因合成等方法對這些預測序列進行實驗驗證。

合理的蛋白質設計可以追溯到1970年代中期。然而，最近，有許多成功的合理設計水溶性乃至跨膜肽和蛋白質的例子，部分原因是由于人們對有助于蛋白質結構穩定性的不同因素有了更好的了解，并開發了更好的計算方法。

概述和歷史記錄

編輯

在合理的蛋白質設計的目標是預測氨基酸?序列，將折疊到一個特定的蛋白質結構。盡管可能的蛋白質序列數量眾多，并隨蛋白質鏈的大小呈指數增長，但其中只有一個子集可以可靠且快速地折疊為一種天然狀態。蛋白質設計涉及鑒定該子集中的新序列。蛋白質的天然狀態是鏈的構象自由能最小值。因此，蛋白質設計就是尋找具有所選結構作為自由能最小值的序列。從某種意義上講，它與蛋白質結構預測相反。在設計上，三級結構被指定，并確定要折疊的序列。因此，它也被稱為反向折疊。因此，蛋白質設計是一個優化問題：使用一些評分標準，選擇可以折疊成所需結構的優化序列。

在1970年代和1980年代合理設計了xxx個蛋白質時，這些蛋白質的序列是根據對其他已知蛋白質、序列組成、氨基酸電荷和所需結構的幾何形狀的分析手動進行優化的。首先設計的蛋白質歸功于Bernd Gutte，他設計了已知催化劑的簡化版，牛核糖核酸酶以及由β-折疊和α-螺旋（包括DDT的結合劑）組成的三級結構。Urry及其同事后來根據序列組成規則設計了類似彈性蛋白的纖維肽。理查森及其同事設計了79個殘基的蛋白質，與已知蛋白質沒有序列同源性。在1990年代，功能強大的計算機，氨基酸構象庫以及主要為分子動力學模擬開發的力場的出現促成了基于結構的計算蛋白質設計工具的開發。隨著這些計算工具的發展，在過去的30年中，蛋白質設計取得了巨大的成功。Stephen Mayo和他的同事在1997年成功完成了從頭開始完全成功設計的xxx個蛋白質，隨后不久，Peter S. Kim和他的同事在1999年設計了不自然的右旋卷曲螺旋的二聚體，三聚體和四聚體。在2003年，大衛·貝克（David Baker）的實驗室將全蛋白質設計成自然界中從未見過的折疊。之后，在2008年，貝克（Baker）小組通過計算設計了用于兩種不同反應的酶。在2010年，使用計算機設計的蛋白質探針從患者血清中分離出了一種xxx大的廣泛中和抗體。^[8]由于這些成就和其他成功，蛋白質設計已成為可用于蛋白質工程的最重要工具之一。人們非常希望新的蛋白質的設計，無論大小，都可以用于生物醫學和生物工程。

蛋白質結構和功能的基礎模型

編輯

蛋白質設計程序使用在體內環境中驅動蛋白質的分子力的計算機模型。為了使問題易于解決，蛋白質設計模型簡化了這些作用力。盡管蛋白質設計程序相差很大，但它們必須解決四個主要的建模問題：設計的目標結構是什么，目標結構允許什么樣的靈活性，搜索中包括哪些序列，以及將使用哪個力場來分數序列和結構。

目標結構

蛋白質功能在很大程度上取決于蛋白質結構，合理的蛋白質設計使用這種關系通過設計具有目標結構或折疊結構的蛋白質來設計功能。因此，根據定義，在合理的蛋白質設計中，必須預先知道靶標結構或結構的整體。這與其他形式的蛋白質工程（例如定向進化）形成鮮明對比，在定向進化中，可以使用多種方法來查找實現特定功能的蛋白質；在蛋白質結構預測中，已知序列但結構未知。

通常，靶標結構基于另一種蛋白質的已知結構。但是，自然界中看不見的新穎褶皺變得越來越有可能。彼得·S·金（Peter S.Kim）和他的同事設計了自然界中從未見過的非自然卷曲螺旋的三聚體和四聚體。在大衛·貝克（David Baker）實驗室開發的蛋白質Top7，是使用蛋白質設計算法完全設計的，具有完全新穎的折疊效果。最近，貝克和同事們開發了一系列原理來設計基于蛋白質折疊漏斗的理想球狀蛋白質結構在二級結構預測和三級結構之間架起橋梁。這些基于蛋白質結構預測和蛋白質設計的原理被用于設計五種不同的新型蛋白質拓撲。

序列空間

在合理的蛋白質設計中，可以從已知蛋白質的序列和結構重新設計蛋白質，或者在從頭蛋白質設計中完全從頭開始重新設計蛋白質。在蛋白質重新設計中，序列中的大多數殘基都保留為野生型氨基酸，同時允許少數突變。在從頭設計中，整個序列是在沒有先驗序列的基礎上重新設計的。

既從頭設計和重新設計的蛋白質能建立此規則序列空間：特定的氨基被允許在每個可變位置殘基的酸。例如，基于進化數據和電荷平衡，限制了選擇RSC3探針的?HIV-中和抗體的表面成分。蛋白質設計的許多最早嘗試都很大程度上基于序列空間的經驗規則。此外，纖維蛋白的設計通常在序列空間上遵循嚴格的規則。例如，基于膠原蛋白設計的蛋白質通常由Gly-Pro-X重復序列組成。計算技術的出現允許設計蛋白質而無需人工干預序列選擇。

結構靈活性

在蛋白質設計中，蛋白質的靶結構是已知的。但是，合理的蛋白質設計方法必須在目標結構上建立一定的靈活性模型，以增加可以針對該結構設計的序列數量，并xxx程度地減少序列折疊為不同結構的機會。例如，在蛋白質的緊密堆積核心中的一個小氨基酸（例如丙氨酸）的蛋白質重新設計中，如果周圍的側鏈折疊，則通過合理的設計方法可以預測出很少的突變體可以折疊成目標結構不允許重新包裝。

因此，任何設計過程的基本參數是側鏈和主鏈所允許的靈活性。在最簡單的模型中，蛋白質主鏈保持剛性，同時允許某些蛋白質側鏈改變構象。但是，側鏈的鍵長，鍵角和χ二面角可具有許多自由度。為了簡化此空間，蛋白質設計方法使用的旋轉異構體庫假定鍵長和鍵角為理想值，同時將χ二面角限制為一些經常觀察到的低能構象，稱為旋轉異構體。

旋轉異構體文庫基于對許多蛋白質結構的分析來描述旋轉異構體。獨立于主干的rotamer庫描述了所有rotamer。相反，依賴于骨干的旋轉異構體文庫將旋轉異構體描述為取決于它們在側鏈周圍的蛋白質骨架排列方式出現的可能性。rotamer庫描述的rotamer通常是空間區域。大多數蛋白質設計程序都使用一種構象（例如，空間中旋轉異構體二面體的模態值）或旋轉異構體描述的區域中的多個點。在OSPREY蛋白質設計方案，相比之下，模型整個連續區域。

盡管合理的蛋白質設計必須保留蛋白質的一般骨架折疊，但允許某些骨架柔性可以顯著增加折疊至結構的序列數，同時保持蛋白質的一般折疊。骨架靈活性在蛋白質重新設計中尤其重要，因為序列突變通常會導致骨架結構發生微小變化。此外，骨架靈活性對于蛋白質設計的更高級應用（例如結合預測和酶設計）可能至關重要。蛋白質設計骨架柔性的一些模型包括小而連續的整體骨架運動，目標折疊周圍離散的骨架樣品，反沖運動和蛋白質環柔性。

能量功能

合理的蛋白質設計技術必須能夠將在目標折疊下穩定的序列與傾向于其他低能競爭態的序列區分開。因此，蛋白質設計需要精確的能量功能，該功能可以根據序列與目標結構的折疊程度對序列進行排序和評分。但是，同時，這些能量函數必須考慮蛋白質設計背后的計算挑戰。成功設計中xxx挑戰性的要求之一是能量函數，該函數對于計算計算而言既準確又簡單。

最精確的能量函數是基于量子力學模擬的能量函數。然而，這樣的模擬太慢并且對于蛋白質設計通常是不切實際的。取而代之的是，許多蛋白質設計算法使用的是基于分子力學模擬程序的基于物理學的能量函數，基于知識的能量函數或兩者的混合。趨勢是使用更多基于物理學的勢能函數。

基于物理的能量函數（例如AMBER和CHARMM）通常來自量子力學模擬，以及來自熱力學，晶體學和光譜學的實驗數據。這些能量函數通常會簡化物理能量函數并使它們成對分解，這意味著可以通過在每個原子對之間添加成對能量來計算蛋白質構象的總能量，這使它們對于優化算法具有吸引力。基于物理的能量函數通常對原子之間的吸引排斥Lennard-Jones項和非鍵合原子之間的成對靜電庫侖項進行建模。

與基于物理的電勢相反，統計電勢的優點是計算速度快，隱含地考慮復雜的影響并且對蛋白質結構的微小變化不太敏感。這些能量函數基于結構數據庫中出現頻率得出的能量值。

然而，蛋白質設計有時會受到分子力學力場的限制。分子力學力場是分子動力學模擬中最常用的一種，它針對單個序列的模擬進行了優化，但是蛋白質設計通過許多序列的許多構象進行搜索。因此，必須為蛋白質設計量身定制分子力學力場。在實踐中，蛋白質設計能量函數通常同時包含統計術語和基于物理的術語。例如，Rosetta能量函數（最常用的能量函數之一）結合了源自CHARMM能量函數的基于物理學的能量項以及統計能量項，例如旋轉子概率和基于知識的靜電。通常，能源功能在實驗室之間是高度定制的。

有效的設計能量功能面臨的挑戰

水構成蛋白質周圍的大部分分子，是蛋白質結構的主要驅動力。因此，對水和蛋白質之間的相互作用進行建模對于蛋白質設計至關重要。在任何給定時間與蛋白質相互作用的水分子數量巨大，并且每個分子都有大量的自由度和相互作用伙伴。相反，蛋白質設計程序將大多數此類水分子建模為一個連續體，同時對疏水作用和溶劑化極化進行建模。

個別的水分子有時在蛋白質的核心以及蛋白質-蛋白質或蛋白質-配體相互作用中起著至關重要的結構作用。未能對此類水進行建模可能導致對蛋白質-蛋白質界面的最佳序列的錯誤預測。作為替代方案，可以將水分子添加到旋轉異構體中。

作為優化問題

編輯

蛋白質設計的目的是找到可以折疊成目標結構的蛋白質序列。因此，蛋白質設計算法必須針對目標折疊搜索每個序列的所有構象，并根據蛋白質設計能量函數確定的每個序列的最低能量構象對序列進行排序。因此，蛋白質設計算法的典型輸入是目標折疊，序列空間，結構柔韌性和能量函數，而輸出是一個或多個被預測穩定折疊至目標結構的序列。

設計的蛋白質的應用和實例

編輯

酶設計

新酶的設計是蛋白質設計在生物工程和生物醫學領域的巨大應用。通常，設計蛋白質結構可能與設計酶不同，因為酶的設計必須考慮催化機制中涉及的許多狀態。然而，蛋白質設計是從頭進行酶設計的先決條件，因為至少催化劑的設計需要支架，在支架中可以插入催化機理。

在21世紀的前十年，從頭酶設計和重新設計取得了巨大進展。在三項主要研究中，David Baker和他的同事從頭設計了用于逆醛醇反應，消除Kemp反應和用于Diels-Alder反應的酶。此外，斯蒂芬·梅奧（Stephen Mayo）和他的同事開發了一種迭代方法，以設計最有效的已知酶來消除Kemp。此外，在實驗室布魯斯唐納德中，使用計算的蛋白設計來切換之一的特異性蛋白結構域的從其天然底物苯丙氨酸到其他非同源底物（包括帶電荷的氨基酸）產生Gramicidin S的非核糖體肽合成酶；重新設計的酶具有接近野生型的活性。

親和性設計

蛋白質間的相互作用涉及大多數生物過程。許多最難治療的疾病，例如阿爾茨海默氏病，多種形式的癌癥（例如TP53）和人類免疫缺陷病毒（HIV）感染都涉及蛋白質之間的相互作用。因此，為了治療這種疾病，期望設計結合相互作用的伴侶之一并因此破壞引起疾病的相互作用的蛋白質或蛋白質樣治療劑。這需要設計蛋白質治療劑以使其對伴侶具有親和力。

可以使用蛋白質設計算法設計蛋白質之間的相互作用，因為決定蛋白質穩定性的原理也決定了蛋白質之間的結合。但是，蛋白質間相互作用設計提出了蛋白質設計中通常不存在的挑戰。最重要的挑戰之一是，通常來說，蛋白質之間的界面比蛋白質核心更具極性，并且結合涉及去溶劑化和氫鍵形成之間的權衡。為了克服這一挑戰，布魯斯·提多爾（Bruce Tidor）和他的同事們開發了一種通過專注于靜電作用來提高抗體親和力的方法。他們發現，對于研究中設計的抗體，降低界面殘基的去溶劑化成本可提高結合對的親和力。

專為設計

蛋白質與蛋白質相互作用的設計必須具有高度特異性，因為蛋白質可以與大量蛋白質相互作用。成功的設計需要選擇性的粘合劑。因此，蛋白質設計算法必須能夠區分靶標結合（或陽性設計）和脫靶結合（或陰性設計）。特異性設計最突出的例子之一是Amy Keating和同事針對20個bZIP家族中的19個設計了特定的bZIP結合肽。這些肽中有8種對它們的預期伴侶比競爭性肽具有特異性。此外，安德森（Anderson）及其同事還使用正面和負面的設計來預測藥物靶標的活性位點的突變，從而賦予對新藥的抗性。陽性設計用于維持野生型活性，而陰性設計用于破壞藥物的結合。Costas Maranas和他的同事最近的計算重新設計也能夠通過實驗將念珠菌木糖還原酶的輔因子特異性從NADPH轉換為NADH。

蛋白質換膚

蛋白質表面修復包括設計蛋白質表面，同時保留完整的蛋白質整體折疊，核心和邊界區域。蛋白質表面重整對于改變蛋白質與其他蛋白質的結合特別有用。蛋白質表面修飾的最重要應用之一是在NIH疫苗研究中心設計RSC3探針以選擇廣泛中和的HIV抗體。首先，選擇gp120 HIV包膜蛋白與先前發現的b12抗體之間的結合界面之外的殘基進行設計。然后，基于進化信息，溶解性，與野生型的相似性和其他考慮因素選擇間隔的序列。然后使用RosettaDesign軟件在所選序列空間中找到最佳序列。

球狀蛋白的設計

球狀蛋白質是包含疏水核心和親水表面的蛋白質。球狀蛋白通常具有穩定的結構，這與纖維蛋白不同，后者具有多種構象。球蛋白的三維結構通常比纖維蛋白和膜蛋白更容易通過X射線晶體學和核磁共振確定，這使得球蛋白比其他類型的蛋白更具吸引力。最成功的蛋白質設計涉及球狀蛋白質。無論RSD-1?，和頁首7.是從頭球蛋白的設計。貝克小組于2012年設計，合成并驗證了另外五種蛋白質結構。這些新蛋白質不具有生物功能，但結構旨在充當構建基塊，可以擴展以包含功能性活性位點。通過使用新的啟發式方法，在分析指定二級結構的序列各部分之間的連接環的基礎上，通過計算發現了結構。

膜蛋白的設計

已經成功設計了幾種跨膜蛋白，以及許多其他與膜相關的肽和蛋白。最近，Costas Maranas和他的同事開發了一種自動化工具，用于將E.coli的F型外膜孔蛋白（OmpF）的孔徑重新設計為任何所需的亞納米尺寸，然后將其組裝在膜中以完成精確的埃尺度分離。

內容由匿名用戶提供，本內容不代表www.gelinmeiz.com立場，內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載，請注明出處：http://www.gelinmeiz.com/109177/

蛋白質設計

目錄