- Universität Hamburg - Fachbereich Biologie - Biozentrum Klein Flottbek - Rolf Bergmann
 
Biochemie zum Ansehen:
molekulare Strukturen vom Atom zum Makromolekül
Koenzym A
Biochemie zum Ansehen     englisch   
punkt
 

 

Chime und Strukturdaten

Das Plugin Chime wurde aus dem ingeniös einfachen Molekülbetrachter RasMol entwickelt. Letzteres Programm kann mit einzelnen Datenfiles umgehen, in denen die Atomkoordinaten in der Proteindatenbank abgelegt sind. In einigen Skripten in diesem Projekt zeige ich jedoch mehr, als in einem Datensatz enthalten ist. Daher muß ich die Originaldatensätze je nach Zweck manipulieren.

Wenn verschiedene Zustände eines Moleküls zu zeigen sind, kopiere ich die Datensätze aus den separaten PDB-Einträgen in einen Datensatz und füge entsprechende Ketten-Identifikationsbuchstaben hinzu. Das führt allerdings zu nicht mehr eindeutigen Atomnummern in der Datei. Wenn die Einzelstrukturen von verschiedenen Autoren stammen, müssen eventuell auch die Orientierungen der Moleküle vereinheitlicht und daher geänderte Datensätze gespeichert werden.

Bei großen vielkettigen Strukturen (wie sie z.B. vom EBI Protein Quaternary Structure Server zu bekommen sind) zeigt sich eine Einschränkung des PDB File-Formates: das Alphabet hat nicht genug Buchstaben, die Chime unterscheiden kann. Die anzuzeigenden Ketten müssen mit einzelnen Großbuchstaben gekennzeichnet sein, kleinbuchstaben und Nummern versteht Chime nicht. Diese Tatsache limitiert die demonstrierbare Kettenzahl.

Chime kann von sich aus keine graphischen Elemente anzeigen. Wenn Symmetrieachsen oder andere Hilfselemente zu sehen sein sollen, muß ich "Moleküle" erfinden, deren Koordinaten in die Strukturfiles eingefügt werden. Diese Zusätze stammen natürlich nicht von den Originalautoren der PDB-Files!

Um eine chemische Bindung zwischen Protein und Ligand zu demonstrieren, reicht es für Chime nicht, daß der PDB-Datenzatz den entsprechenden CONECT-Eintrag enthält. Vielmehr muß die Datenzeile des zugehörigen HETATM unmittelbar auf die bindende Aminosäure folgen: ich kopiere sie daher dorthin und der ganze Datensatz wird dadurch redundant. Mehrfachbindungen zwischen Atomen erfordern zusätzliche CONECT-Einträge. Wenn eine Atomgruppe wahlweise mit verschiedenen Bindungssymbolen gezeigt werden soll, müssen die entsprechenden Atome zusätzliche Datenzeilen mit gleichen Koordinaten, aber anderen eindeutigen Atombezeichnungen erhalten.

Zur Beschleunigung von Datentransfers im Internet werden die Datenfiles komprimiert (gzip). In zusammengesetzten Datensätzen werden die Angaben zu nicht gezeigten Atomen (z.B. Wasser) gelöscht. Die Datenfiles können natürlich entpackt und benutzt werden, aber immer mit dem Bewußtsein, daß sie heftig manipuliert sein können und nicht immer den Original-PDB-Files entsprechen.


punkt
   Impressum  /  23-2-2004  /  Rolf Bergmann  /  http://www.papanatur.de/chimlimd.htm     english