Протеинска банка података

С Википедије, слободне енциклопедије

Протеинска банка података, (енгл. Protein Data Bank, ПДБ), је колекција 3Д структурних података великих биолошких молекула, као што су протеини и нуклеинске киселине. Подаци су типично добијени рендгенском структурном анализом или НМР спектроскопијом. Биолози и биохемичари из целог света доприносе стварању ове колекције. ПДБ је слободно доступан на Интернету. ПДБ надзире организација под називом Светска протеинска банка података (енгл. Worldwide Protein Data Bank, wwPDB).

ПДБ је кључни ресурс у структурно биолошким областима, попут структурне геномике. Већина водећих научних часописа, и поједине агенције за финансирање, као што је НИХ у САД, захтевају од истраживача да унесу њихове структурне податке у ПДБ. ПДБ садржај се сматра примарним подацима, и постоје стотине изведених база података које категоризују податке на разне начине. На пример, SCOP и CATH категоризују структуре на основу структурно типа и претпостављених еволуционих односа; а GO категоризује структуре на основу гена.[1]

Историја[уреди | уреди извор]

ПДБ је формиран 1971. године[1]. Њен оснивач је Валтер Хамилтон са Брукхавен националне лабораторије. Након Хамилтонове смрти 1973, Том Коезтле је преузео надзор над ПДБ-ом. Јануара 1994, Јоел Сусман је био именован за ПДБ руководиоца. Октобра 1998,[2] ПДБ је трансформисан у РЦСБ (енгл. Research Collaboratory for Structural Bioinformatics) [3]. Трансфер је завршен јуна 1999. Нови директор је била Хелен M. Берман са Рутгерс универзитета (једног од РЦСБ институција чланица).[4] 2003 са wwPDB формирањем, ПДБ је постао интернационална организација. Сваки од четири wwPDB члана дејствује као центар за депозицију, обраду и дистрибуцију ПДБ података. Обрада података се односи на чињеницу да wwPDB особље прегледа и анотира сваки поднети упис. Након тока се веродостојност података се проверава. Изворни код тог софтвера за валидацију је јавно доступан.[5]

Садржај[уреди | уреди извор]

ПДБ база података се ажурира седмично (уторком). У септембру 2010 ПДБ је имао следећи садржај[6]:

Експериментални
метод
Протеини Нуклеинске киселине Протеин/Нуклеинска киселина
комплекси
Друго Тотал
дифракција X-зрака 55480 1231 2605 17 59333
НМР 7512 925 162 7 8606
Електронска микроскопија 214 17 77 0 308
Хyбрид 24 1 1 1 27
Отхер 126 4 4 13 147
Тотал: 63356 2178 2849 38 68421
48,715 структура у ПДБ имају структурни фактор фајл.
5,901 структура имају НМР податке.

Ови подаци показују да је већина структура одређена дифракцијом X-зрака, док је око 15% структура одређено путем протеин НМР. Кад се користи дифракција X-зрака добијају се приближне координате атома протеина. НМР експерименти дају процене растојања између парова атома протеина, а конформација протеина се добија решавањем проблема геометрије растојања. Неколико протеинских структура је одређено крио-електронском микроскопијом.

У прошлости[7] ПДБ је растао приближно експоненцијалном брзином. Међутим, од 2007 брзина акумулације нових протеина изгледа да је достигла плато, са 7263 протеина додатих у 2007, 7073 у 2008, и 7448 у 2009.

Фајл формат[уреди | уреди извор]

Фајл формат који је ПДБ иницијално користио се зове ПДБ фајл формат. Тај оригинални формат је био ограничен ширином рачунарских бушених карти на 80 слова по линији. "Макромолекуларни кристалографски информациони фајл" формат, mmCIF, је почео да се примењује 1996. године,. XML верзија овог формата, звана PDBML, се појавила 2005. године.[8]

Протеинске структуре се могу преузети у било ком од тих формата. Графички пакети могу директно да приступе структурама на ПДБ сајту:

  • За ПДБ фајлове, нпр., http://www.pdb.org/pdb/files/4hhb.pdb.gz
  • За PDBML (XML) фајлове, нпр., http://www.pdb.org/pdb/files/4hhb.xml.gz

Види још[уреди | уреди извор]

Референце[уреди | уреди извор]

  1. ^ а б Берман, Х. M. (2008). „Тхе Протеин Дата Банк: а хисторицал перспецтиве” (ПДФ). Ацта Црyсталлограпхица Сецтион А: Фоундатионс оф Црyсталлограпхy. А64 (1): 88—95. ПМИД 18156675. дои:10.1107/С0108767307035623. 
  2. ^ Берман, Х. M.; et al. (2000). „Тхе Протеин Дата Банк”. Нуцлеиц Ацидс Рес. 28 (1): 235—242. ПМЦ 102472Слободан приступ. ПМИД 10592235. дои:10.1093/нар/28.1.235. 
  3. ^ „Ресеарцх Цоллабораторy фор Струцтурал Биоинформатицс (РЦСБ)”. Архивирано из оригинала 05. 02. 2007. г. Приступљено 24. 10. 2010. 
  4. ^ „РЦСБ ПДБ Неwслеттер Арцхиве”. РЦСБ Протеин Дата Банк. Архивирано из оригинала 13. 04. 2012. г. Приступљено 01. 01. 2021. 
  5. ^ „ПДБ Валидатион Суите”. Архивирано из оригинала 03. 03. 2016. г. 
  6. ^ „РЦСБ Протеин Дата Банк - Холдингс Репорт”. Архивирано из оригинала 04. 07. 2007. г. 
  7. ^ „Нумбер оф струцтурес”. Архивирано из оригинала 28. 04. 2007. г. Приступљено 24. 10. 2010. 
  8. ^ Wестброок, Ј.; et al. (2005). „ПДБМЛ: тхе репресентатион оф арцхивал мацромолецулар струцтуре дата ин XМЛ” (ПДФ). Биоинформатицс. 21 (7): 988—992. ПМИД 15509603. дои:10.1093/биоинформатицс/бти082. 

Спољашње везе[уреди | уреди извор]