V prvním cvičení se seznámíme s databází PDB a s formátem strukturních záznamů. Rovněž se naučíme základní příkazy a analýzu struktury pomocí programu PyMOL. Databáze The Protein Data Bank se nachází na stránkách http://www.rcsb.org. Každá struktura uložená v PDB databázi má svůj čtyřmístný kód.
Jedná se o krystalovou strukturu komplexu mutantu HIV-1 proteasy (mutace A71V, V82T, I84V) s inhibitorem. Úvodní stránka nabízí shrnutí základních informací vtahujících se k dané struktuře. Mezi nejdůležitější informace o experimentu patří rozlišení (Resolution) a hodnoty R faktorů (R-Value). Stránka dále obsahuje odkaz na publikaci, ve které byla daná struktura prvně zmíněna. V modulu Macromolecules lze získat informace o bílkovinných řetězcích, či o řetězcích nukleových kyselin. Modul Small Molecules obsahuje informace o chemickém složení a interakcích ligandů, jako např. inhibitory, součásti pufrů, soli, ionty, apod.
Na stránce lze rovněž otevřít záložky, které nabízí informace o aminokyselinové sekvenci, podobných sekvencích a podobných strukturách. Poslední důležitou záložkou je Experiment, kde lze získat velice přehledné sdělení o experimentu a jeho vyhodnocení (včetně krystalizace, měřícího stanoviště, apod.).
Databáze nabízí možnost strukturní soubor zobrazit, či stáhnout do počítače.
Na začátku každého PDB souboru jsou podobně jako v databázi uvedeny údaje o průběhu a zpracování experimentu, ze kterého struktura vzešla. Důležitá strukturní informace začíná až klíčovým slovem CRYST1, za kterým následují parametry základní buňky (tři rozměry, tři úhly) a symbol prostorové grupy krystalu.
Samotné souřadnice jednotlivých atomů jsou označeny úvodním klíčovým slovem ATOM. Následuje číslo atomu, symbol atomu v daném reziduu, třímístný kód rezidua, označení řetězce, číslo rezidua, tři souřadnice x, y, z, okupance (probíráno v předmětu 11DMSB), B-faktor (probíráno v předmětu 11DMSB) a zkratku atomu. Následuje malá ukázka:
CRYST1 56.409 87.419 94.900 90.00 90.00 90.00 I 2 2 2 16 ORIGX1 1.000000 0.000000 0.000000 0.00000 ORIGX2 0.000000 1.000000 0.000000 0.00000 ORIGX3 0.000000 0.000000 1.000000 0.00000 SCALE1 0.017728 0.000000 0.000000 0.00000 SCALE2 0.000000 0.011439 0.000000 0.00000 SCALE3 0.000000 0.000000 0.010537 0.00000 ATOM 1 N PRO A 1 7.962 -6.205 -11.445 1.00 37.89 N ATOM 2 CA PRO A 1 8.954 -5.469 -12.231 1.00 36.84 C ATOM 3 C PRO A 1 8.429 -5.033 -13.584 1.00 35.02 C ATOM 4 O PRO A 1 7.431 -5.562 -14.052 1.00 34.03 O ATOM 5 CB PRO A 1 10.069 -6.514 -12.468 1.00 37.13 C ATOM 6 CG PRO A 1 9.693 -7.741 -11.695 1.00 37.61 C ATOM 7 CD PRO A 1 8.569 -7.363 -10.765 1.00 38.65 C ATOM 8 N GLN A 2 9.125 -4.077 -14.196 1.00 33.88 N ATOM 9 CA GLN A 2 9.016 -3.788 -15.639 1.00 32.62 C ATOM 10 C GLN A 2 10.431 -3.935 -16.172 1.00 31.58 C ATOM 11 O GLN A 2 11.355 -3.303 -15.646 1.00 31.91 O ATOM 12 CB GLN A 2 8.514 -2.370 -15.886 1.00 33.25 C ATOM 13 CG GLN A 2 8.413 -1.959 -17.351 1.00 34.35 C ATOM 14 CD GLN A 2 7.725 -0.606 -17.532 1.00 37.75 C ATOM 15 OE1 GLN A 2 8.384 0.425 -17.762 1.00 37.73 O ATOM 16 NE2 GLN A 2 6.384 -0.601 -17.425 1.00 36.57 N
Nyní přejdeme k analýze struktury. Program PyMOL uživatelům umožňuje široké spektrum funkcí. Základem je především příkazový řádek, do kterého lze zadávat komplikované úlohy. V první řadě lze označit a vybrat určitou skupinu atomů, se kterými lze dále pracovat. Výběr a jeho metody lze kombinovat, přičemž výrazy AND a OR mají v příkazovém řádku význam logických operátorů. Tzn.pokud chceme vybrat reziduum Asn26 a Pro17, musíme je spojit logickým operátorem OR, nikoliv AND. Asn26 samozřejmě nemůže být současně Pro17, pokud bychom použili výraz AND.
Následující tabulka ukazuje příklady výběrů skupin atomů. Výběry provádíme pomocí příkazu select (select nazev_vyberu, konkrétní formulace výběru).
příkaz | |
select nazev0, chain A | výběr řetězce A |
select nazev1, chain A or chain B | výběr řetězce A a B |
select nazev2, chain A+B | výběr řetězce A a B, jiné zadání |
select nazev3, resn Lys | výběr rezidua lyzin |
select nazev4, resn Lys+Glu | výběr reziduí Lys a Glu |
select nazev5, resi 148 or resi 169-219 | výběr reziduí č.148 a všech mezi 169 až 219 |
select nazev6, elem Zn or Mn | výběr prvků Zn a Mn |
Jak již bylo uvedeno, výběr atomů lze kombinovat a dospět tak i ke komplikovaným výběrům. Například příkaz select nazev7, chain B and resi 200-300 and resn Glu+Ala and elem N+O vybere všechny atomy dusíku a kyslíku z reziduí alanin a glutamová kyselina, které jsou obsaženy v řetězci B na pozici 200 až 300. Názvy všech výběrů je vhodné pojmenovat odlišně, neboť používání stejného názvu pro nový výběr vždy přepíše původní výběr starý.
.Molekuly vody také slabou mírou přispívají k interakcím mezi molekulami (tzv. "water mediated contacts"). V tomto cvičení tyto příspěvky zanedbáme. Tímto způsobem jsou vybrány pouze atomy, které jsou vzdáleny od ihnibitoru méně než 3,6 Å.
Nyní se zaměříme ještě detailněji na interakci inhibitoru s HIV proteasou. K odhalení vodíkových vazeb je třeba nejdříve vytvořit výběry dvou skupin atomů, které se mohou takovéto vazby účastnit a pak měřit jejich vzájemné vzdálenosti.
.Hodnota 3.6 Å reflektuje obecně uznávané maximum pro vzdálenost dvou atomů vázaných vodíkovou vazbou. Prohlédněte si detaily této interakce a spočítejte množství vazeb. Je nutno dodat, že mnoho interakcí tímto způsobem nelze zobrazit. Všimněte si například OH-π interakce inhibitoru s reziduem Val84. Úplný výčet interakcí se takřka nikdy neomezuje jen na počet vodíkových vazeb.