Spørsmål:
Konsekvent atomnavn PDB
Mehdi Nellen
2015-03-10 18:17:35 UTC
view on stackexchange narkive permalink

La oss si at du har to ganger det samme molekylet i PDB-format.

PDB1:

  HETATM 1916 C1 EQU A1128 22.568 -34.213 -37.632 1.00 19.82 CHETATM 1917 O1 EQU A1128 21.807 -35.267 -37.474 1.00 17.07 OHETATM 1918 C2 EQU A1128 22.218 -33.078 -36.885 1.00 19.81 CHETATM 1919 C3 EQU A1128 23.024 -31.912 -37.017 1.00 21.42 CHETATM 1920 C4 EQU A1128 24.206 -3150 24.504 -33.085 -38.661 1.00 20.61 CHETATM 1922 C6 EQU A1128 23.703 -34.217 -38.516 1.00 17.92 CHETATM 1923 C10 EQU A1128 22.658 -30.748 -36.242 1.00 22.26 CHETATM 1924 C11 EQU A1128 23.461 -29.5731.0 29,558 -37,249 1,00 24,75 CHETATM 1926 C13 EQU A1128 24,992 -30,715 -38,034 1,00 24,09 CHETATM 1927 C16 EQU A1128 25,402 -28,301 -37 .351 1,00 23,63 CHETATM 1928 C17 EQU A1128 26,110 -28,153 -38,728 1,00 25,12 CHETATM 1929 C18 EQU A1128 26,990 -29,384 -39,036 1,00 23,20 CHETATM 1930 C19 EQU A1128 26,187 -30,715 -38,965 1,00 23,69 CETATM 19 1,00 25,63 CHETATM 1932 C25 EQU A1128 25,847 -25,958 -37,473 1,00 24,96 CHETATM 1933 C26 EQU A1128 26,770 -26,799 -38,426 1,00 26,13 CHETATM 1934 O26 EQU A1128 27,843 -26,441 -38,854 1,00 29,46 OH.11AT2775 C  

PDB2:

  HETATM 1 C10 LIG 1 22.735 -30.818 -36.280 1.00 0.00 CHETATM 2 C5 LIG 1 24.497 -33.076 -38.614 1.00 0.00 CHETATM 3 C11 LIG 1 23,469 -29,649 -36,412 1,00 0,00 C
HETATM 4 C6 LIG 1 23.704 -34.219 -38.496 1.00 0.00 CHETATM 5 C2 LIG 1 22.306 -33.076 -36.899 1.00 0.00 CHETATM 6 C3 LIG 1 23.085 -31.931 -37.022 1.00 0.00 CHETATM 7 C4 LIG 1 24.186 -31.919 -37.892M.00.00 CHET C12 LIG 1 24.550 -29.604 -37.290 1.00 0.00 CHETATM 9 C13 LIG 1 24.951 -30.740 -38.009 1.00 0.00 CHETATM 10 C1 LIG 1 22.602 -34.190 -37.652 1.00 0.00 CHETATM 11 C26 LIG 1 26.758 -26.817 -38.473 1.00 0.00 CETATM 12 1 26.180 -30.692 -38.934 1.00 0.00 CHETATM 13 C25 LIG 1 25.881 -26.016 -37.526 1.00 0.00 CHETATM 14 C18 LIG 1 27.001 -29.371 -38.996 1.00 0.00 CHETATM 15 C24 LIG 1 24.709 -26.963 -37.185 1.00 0.00 CHETATM 16 C16 LIG 1 -28,337 -37,396 1,00 0. 00 CHETATM 17 C17 LIG 1 26.086 -28.150 -38.747 1.00 0.00 CHETATM 18 C27 LIG 1 25.093 -27.987 -39.938 1.00 0.00 CHETATM 19 O26 LIG 1 27.821 -26.440 -38.923 1.00 0.00 OHETATM 20 O1 LIG 1 21.738 -35.208 -37.538 1.00 0.00  

I den tredje kolonnen kan du se atomnavnene ( C1 , O20 , etc.). De er forskjellige for begge PDB-filene, selv om det er det samme molekylet. Jeg vil at de skal ha de samme navnene på de samme atomene. Så i stedet for C13 og C9 vil jeg ha dem begge kalt C13 eller C9 .

Hva er konvensjonen om å kalle disse atomene? Hvilken metode skal jeg bruke for å konvertere dem til en vanlig navngiving?

ps. Jeg la ut mesteparten av PDB-en for å spare plass

To svar:
Geoff Hutchison
2015-03-10 20:57:57 UTC
view on stackexchange narkive permalink

Du må ha en slags ligandordbok. For mange PDB-ligander eksisterer dette, og du kan slå opp atomnavngivningen.

For eksempel, PDB-ligand-ekspoen lar deg søke etter ligander med 3-bokstavskode ( f.eks. HEM ​​).

PDBeChem lar deg også finne atomnavn basert på koder på 3 bokstaver (lenken er HEM). p Så langt jeg vet er det (ennå) ikke noen form for mønstermatching som gjør at du kan gå gjennom PDB-filer og automatisk oppfatte ligandene dine, sortere atomene og navngi dem systematisk. p>

Hvis du finner en, vennligst gi meg beskjed - det vil være et flott tillegg til programmer som Open Babel

ABDreverhaven
2019-02-07 02:51:21 UTC
view on stackexchange narkive permalink

Konvensjonen for navn på kanoniske atomer finnes i Chemical Component Dictionary (CCD). Når det gjelder metoden, vil jeg bruke Vim-metoden for å slette og lime inn linjer. En annen fancy måte ville være å bruke en graftilnærming basert på element og gjøre en matching på per node-basis. Dette ville være et utmerket masteroppgaveprosjekt for å utvikle en så fin programvare.



Denne spørsmålet ble automatisk oversatt fra engelsk.Det opprinnelige innholdet er tilgjengelig på stackexchange, som vi takker for cc by-sa 3.0-lisensen den distribueres under.
Loading...