蛋白質數據庫
編輯蛋白質數據庫(PDB)是蛋白質、核酸等生物大分子三維結構數據的數據庫。 這些數據通常通過 X 射線晶體學、NMR 光譜學或越來越多的冷凍電子顯微鏡獲得,并由世界各地的生物學家和生物化學家提交,可通過其成員組織的網站(PDBe, PDBj、RCSB 和 BMRB)。 PDB 由一個名為全球蛋白質數據庫 (wwPDB) 的組織監督。
PDB 是結構生物學領域的關鍵,例如結構基因組學。 大多數主要科學期刊和一些資助機構現在都要求科學家向 PDB 提交他們的結構數據。 許多其他數據庫使用存儲在 PDB 中的蛋白質結構。 例如,SCOP 和 CATH 對蛋白質結構進行分類,而 PDBsum 使用來自其他來源(例如基因本體)的信息提供 PDB 條目的圖形概述。
歷史
編輯兩種力量匯聚在一起啟動了 PDB:通過 X 射線衍射確定的蛋白質結構數據集數量雖小但不斷增加; 以及新推出的(1968 年)分子圖形顯示器,Brookhaven 光柵顯示器 (BRAD),以 3-D 形式可視化這些蛋白質結構。 1969 年,在布魯克海文國家實驗室 Walter Hamilton 的贊助下,Edgar Meyer(德克薩斯 A&M 大學)開始編寫軟件,以通用格式存儲原子坐標文件,使它們可用于幾何和圖形評估。 到 1971 年,Meyer 的一個程序 SEARCH 使研究人員能夠遠程訪問數據庫中的信息以離線研究蛋白質結構。 SEARCH 在啟用網絡方面發揮了重要作用,從而標志著 PDB 功能的開始。
蛋白質數據庫于 1971 年 10 月在 Nature New Biology 上宣布,是英國劍橋晶體數據中心和美國布魯克海文國家實驗室的合資企業。
1973 年漢密爾頓去世后,Tom Koeztle 在隨后的 20 年里接管了 PDB。 1994年1月,以色列魏茨曼科學研究所的Joel Sussman被任命為PDB的負責人。 1998年10月,PDB轉移到結構生物信息學研究合作實驗室(RCSB); 1999年6月完成交接,新任主任是羅格斯大學的Helen M. Berman(RCSB的管理機構之一,另一個是加州大學圣地亞哥分校的圣地亞哥超級計算機中心)。 2003 年,隨著 wwPDB 的成立,PDB 成為了一個國際組織。 創始成員是 PDBe(歐洲)、RCSB(美國)和 PDBj(日本)。 BMRB 于 2006 年加入。wwPDB 的四個成員中的每一個都可以作為 PDB 數據的存儲、數據處理和分發中心。 數據處理是指 wwPDB 工作人員對每個提交的條目進行審核和注釋。 然后自動檢查數據的合理性(該驗證軟件的源代碼已免費向公眾提供)。
內容
編輯PDB 數據庫每周更新一次(星期三 UTC+0),連同它的持股清單。 截至 2020 年 4 月 1 日,PDB 包括:
PDB 中的 134,146 個結構具有結構因子文件。10,289 個結構具有 NMR 約束文件。PDB 中的 4,814 個結構具有化學位移文件。PDB 中的 4,718 個結構具有存放在 EM 數據庫中的 3DEM 映射文件
大多數結構由 X 射線衍射確定,但約 10% 的結構由蛋白質 NMR 確定。 當使用 X 射線衍射時,獲得蛋白質原子坐標的近似值,而使用 NMR 時,估計蛋白質原子對之間的距離。 蛋白質的最終構象是通過解決距離幾何問題從 NMR 獲得的。 2013 年之后,越來越多的蛋白質通過冷凍電子顯微鏡測定。 單擊鏈接的外部表中的數字將顯示由該方法確定的結構示例。
對于通過 X 射線衍射確定的具有結構因子文件的 PDB 結構,可以查看其電子密度圖。 此類結構的數據存儲在電子密度服務器上。
從歷史上看,PDB 中的結構數量以近似指數的速度增長,1982 年有 100 個注冊結構,1993 年有 1,000 個結構,1999 年有 10,000 個,2014 年有 100,000 個。
文件格式
編輯PDB最初使用的文件格式稱為PDB文件格式。 原始格式受計算機穿孔卡片寬度限制為每行 80 個字符。 大約在 1996 年,作為 CIF 格式擴展的大分子晶體學信息文件格式 mmCIF 被逐步采用。mmCIF 在 2014 年成為 PDB 檔案的標準格式。2019 年,wwPDB 宣布晶體學方法的沉積將只 以 mmCIF 格式接受。
2005 年描述了 PDB 的 XML 版本,稱為 PDBML。
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/228887/