Was ist eine PDB-Datei?

Unsere Instagram und Blog beziehen sich häufig auf PDB-Dateien. Wir haben die Protein-Datenbank (auch kurz PDB abgekürzt) kurz in unserem vorherigen Blog über das Andocken erwähnt, was zu Verwirrung geführt hat. Dieser Blogbeitrag erläutert die Verwendung von PDB-Dateien und deren Lesen. Ich sollte erwähnen, dass es ein anderes PDB-Dateiformat namens Program Database gibt, das von Microsoft als Debugging-Tool erstellt wurde. Wenn Sie danach suchen, besuchen Sie den Artikel hier.

Herkunft des PDB-Formats

Im Bild sind Walter Hamilton, Helen Berman und Tom Koetzle, die alle maßgeblich zur Schaffung und Pflege des PDB beigetragen haben (1).

PDB-Dateien dienen zur Visualisierung der Kristallstrukturen von Molekülen in Simulationssoftware. Die Kristallographie ist ein Untersuchungsgebiet aus dem Jahr 1912. Kristallstrukturen wurden damals aus Röntgenbeugungsmustern und mathematischen Gleichungen abgeleitet. Unser Blogbeitrag zur Kristallographie erläutert den Prozess und die Entwicklung ausführlich. Wir besuchen das Thema, weil die wissenschaftliche Gemeinschaft in den 1960er Jahren eine Umwandlung von kristallographischen Daten in digitale molekulare Strukturdaten sah. Die zunehmende Größe und Menge der Daten zusammen mit der Entwicklung der Brookhaven RAster Display (BRAD) -Konsole erforderte ein Repository im Standardformat. Walter Hamilton war stellvertretender Vorsitzender der Chemischen Abteilung des Brookhaven National Laboratory in Großbritannien und ein brillanter mathematischer Kristallograph. Dr. Hamilton traf Edgar Meyer von der Texas A & M University auf der jährlichen Tagung der American Crystallographic Association (ACA) im Jahr 1968. Auf Anweisung von Walter Hamilton reiste Meyer nach Brookhaven, um mit ihm an der Standardisierung von Kristallstrukturdaten und der Erstellung eines Endlagers zu arbeiten. Meyer erinnerte diesmal an seine auf der ACA-Website eingereichten Memoiren,

"Ausgehend von kristallographischen Koordinaten hat mein Programm DISPLAY einen Farbfernsehmonitor dazu gebracht, rot / grüne 3D-Bilder mit bis zu 256 Atomen zu zeichnen, was für die Gründung der Proteindatenbank (PDB) in Brookhaven 1971 entscheidend war."

Das Dateiformat, das Meyer für DISPLAY erstellt hat, war die Grundlage des .PDB-Formats, das noch heute verwendet wird, jedoch mit vielen Ergänzungen und Modifikationen. Meyers 's beeindruckte die wissenschaftliche Community im September 1971, als er mit SEARCH - seiner Link- und Abfragesoftware - mit einer Abfrage nach Myoglobin aus der Ferne auf die PDB zugegriffen hat, und definiert, dass alle Atome innerhalb eines bestimmten Radius ihres Eisenatoms auf DISPLAY erscheinen sollen. Dies war der erste Einsatz von Networking in den Lebenswissenschaften.

Spalten einer PDB-Datei

Die Datei, die Meyers für DISPLAY abgerufen hatte, war eine primitive Form des nachstehenden Textes. Dies finden Sie, wenn Sie eine PDB-Datei in einem Texteditor öffnen. Die Datei mag auf den ersten Blick kompliziert erscheinen, ist jedoch bei näherer Betrachtung recht einfach - solange Sie über grundlegende Kenntnisse der Biochemie und des Koordinatensystems verfügen.

Wie wird eine PDB-Datei in einem Texteditor angezeigt?

Im Grunde ist eine PDB-Datei eine Liste von Atomen und kartesischen (XYZ) -Koordinaten. Das gleiche Format kann verwendet werden, um jedes physische Objekt darzustellen. Zusätzliche Informationen enthalten weitere Informationen zu den Atomen und zum Aufbau von Atomen in Aminosäuren, Aminosäuren (Reste) in Proteinen und Proteinen in Makromolekülen. Weitere Informationen finden Sie in unserem Proteinblog. Überspringt man die erste Spalte, ist die zweite die fortlaufende Atomnummer. Als nächstes ist das Atomsymbol. Atome werden nicht nur durch ein Ein-Buchstaben-Symbol beschrieben, sondern auch mit einem Entfernungsindikatorcode. Dieser Code entspricht der Reihenfolge, in der die Atome in der Struktur der Aminosäure vorkommen - A für Alpha, B für Beta, G für Gamma usw. Der Restname steht in Spalte 4, gefolgt von dem Kettenidentifikator in Spalte 5 und der Restnummer des Restes, zu dem die Atome in Spalte 6 gehören. Die XYZ-Orthogonalkoordinaten sind in dieser Reihenfolge die nächsten. Die grafischen Einheiten für Koordinaten sind in Angström angegeben, was 0,1 Nanometern entspricht. Die nächsten Spalten sind Belegung und Temperaturfaktor (B-Faktor, B-Wert), die näher erläutert werden müssen.

OccupancyOrganische Kristalle wie Proteine ​​sind nicht so statisch wie anorganische Kristalle wie Tafelsalz. Organische Kristalle weisen mehrere Konformationen - oder Geometrien - auf, wenn sie Umwelteinflüssen ausgesetzt sind. Beispielsweise ist Myoglobin (instagram link) ein Protein, das ein Metallion trägt, das an Sauerstoff bindet. Wenn dieses Bindungsereignis auftritt, ändert sich die Konformation von Myoglobin. Konformationsänderungen bedeuten eine Verschiebung der Atompositionen. Die Belegungsspalte ist eine Schätzung der Anzahl möglicher Positionen bei jeder Konformation. Das heißt - wenn ein Atom an 4 verschiedenen Positionen in 4 verschiedenen Konformationen beobachtet wurde, ist die Belegungsspalte 0,25 anstelle der Standardeinstellung 1,00.

B-FaktorDie Atome eines makromolekularen Kristalls können nur indirekt betrachtet werden - Atome sind offensichtlich zu klein, um gesehen zu werden! Die Beobachtung wird mit verschiedenen Experimenten durchgeführt, bei denen die Lage der Atome durch Wechselwirkungen mit Elektronen kartiert wird. Elektronen sind niemals statisch, daher liefert dieser Ansatz nicht immer die genaue Position der Atome. Unsere Atomkarten müssen mit einem gewissen Maß an Vertrauen gemessen werden, da Elektronen niemals an einem Ort sind. Jedes Atom wird mit einem B-Faktor bezeichnet, um die Vertrauenswürdigkeit seines Standorts darzustellen. Niedrigere B-Faktoren korrelieren mit einem höheren Vertrauen und umgekehrt. Atome im Inneren eines Kristalls neigen zu niedrigeren B-Faktoren, weil ihre Elektronen durch die umgebenden Atome stabilisiert werden, während Atome an der Oberfläche höhere B-Faktoren aufweisen, da sie sich mit einem größeren Freiheitsgrad bewegen können.

Das Bild links ist ein innerer Rest des Myoglobinmoleküls, während das rechte ein Rest auf der Oberfläche ist. Das grüne Netz repräsentiert die B-Werte jedes Atoms. Beachten Sie, dass die Netze an der Oberfläche viel breitere Netze haben - was darauf hinweist, dass sich die Elektronen während des Mappings viel mehr bewegt haben.

Andere KeywordsSome PDB-Dateien enthalten HETATM anstelle des Schlüsselworts ATOM. ATOM wird für alle Protein- und Nukleinsäureatome verwendet, während HETATM für kleine Molekülatome reserviert ist. Das Schlüsselwort TER merkt das Ende einer Kette. Erinnern Sie sich in unserem Blog Was ist ein Protein, dass Proteine ​​hierarchische Strukturen haben. Die Tertiärstruktur ist die Kette. TER benachrichtigt die Anzeigesoftware, dass die Ketten nicht kontinuierlich sind, so dass die Software nicht versucht, sie zu verbinden. Zusätzlich erhält das letzte Sauerstoffatom des letzten Rests am Ende der Kette manchmal einen Entfernungsindikator für XT (erscheint als OXT), um den C-Terminus zu bezeichnen.

Verwendung von PDB-Dateien

Grafiksoftware verwendet PDB-Dateien, um visuelle Darstellungen mikroskopischer Moleküle zu simulieren. Das ist cool genug für sich allein! Wenn Sie mehr wollen, gibt es viele wichtige Verwendungsmöglichkeiten für diese Informationen. PDB-Dateien werden zum Simulieren des Andockens verwendet, sodass Forscher beispielsweise bestimmen können, wie zwei Moleküle interagieren. Dies hat weitere Auswirkungen, wie die Interaktion blockiert werden kann, wenn die beiden Moleküle beispielsweise ein Toxin und ein Protein auf der Zelloberfläche sind! Medizinische Wissenschaftler können Oberflächenproteine ​​aus Krebszellen beobachten, um festzustellen, ob sie Taschen haben, an denen sich niedermolekulare Wirkstoffe binden können. PDB-Dateien und Software zum Lesen sind kostenlos und für die Öffentlichkeit leicht zugänglich. Schauen Sie sich Pymol an und holen Sie sich eine PDB aus dem Repository, um es selbst zu sehen. Sie können etwas Neues lernen.

Links und Zitate: 1. Foto von Hamilton, Berman und Koetzle https://www.amercrystalassn.org/assets/History/Helen_M_Berman_Newsletter_2012.pdf

Suchen Sie nach weiteren Informationen über Macromoltek, Inc? Besuchen Sie unsere Website unter www.Macromoltek.com. Sie interessieren sich für molekulare Simulationen, biologische Kunst oder mehr über Moleküle? Abonniere unser Twitter und Instagram!