Ein Leitfaden für Methoden und Software zur Vorhersage der Proteinstruktur

Um ihre biologischen Funktionen auszuüben, falten sich Proteine ​​in eine oder mehrere spezifische Konformationen, die durch komplexe und reversible nichtkovalente Wechselwirkungen bestimmt werden. Die Bestimmung der Struktur eines Proteins kann durch zeitaufwändige und relativ teure Techniken wie Kristallographie, Kernspinresonanzspektroskopie und Doppelpolarisationsinterferometrie erreicht werden. Bioinformatik-Software wurde entwickelt, um Proteinstrukturen basierend auf ihren Aminosäuresequenzen zu berechnen und vorherzusagen.

Ein Rückblick auf die Proteinstruktur

Als Alternative zu experimentellen Techniken helfen Strukturanalyse- und Vorhersagewerkzeuge dabei, die Proteinstruktur anhand ihrer Aminosäuresequenzen vorherzusagen. Die Lösung der Struktur eines bestimmten Proteins ist in der Medizin (z. B. beim Wirkstoffdesign) und in der Biotechnologie (z. B. beim Design neuartiger Enzyme) von großer Bedeutung. Das Gebiet der rechnergestützten Proteinvorhersage entwickelt sich daher ständig weiter, da die Rechenleistung von Maschinen zunimmt und intelligente Algorithmen entwickelt werden.

Es gibt vier Ebenen der Proteinstruktur (Abbildung 1). Bei der Vorhersage der Proteinstruktur wird die Primärstruktur verwendet, um Sekundär- und Tertiärstrukturen vorherzusagen.

Sekundärstrukturen von Proteinen sind lokalisierte Faltungen innerhalb der Polypeptidkette, die durch Wasserstoffbrücken stabilisiert wird. Die häufigsten sekundären Proteinstrukturen sind Alpha-Helices und Beta-Faltblätter.

Die Tertiärstruktur ist die endgültige Form des Proteins, sobald sich die verschiedenen Sekundärstrukturen zu einer 3D-Struktur gefaltet haben. Diese endgültige Form bildet sich und wird durch ionische Wechselwirkung, Disulfidbrücken und Van-de-Waals-Kräfte zusammengehalten.

Vier Ebenen der Proteinstruktur. Bild von Khanacademy.org.

Methoden und Software zur Vorhersage der Proteinstruktur

Eine große Anzahl von Strukturvorhersagesoftware wird für spezielle Proteinmerkmale und -spezifitäten entwickelt, wie z. B. Störungsvorhersage, Dynamikvorhersage, Strukturerhaltungsvorhersage usw. Ansätze umfassen Homologiemodellierung, Protein-Threading, Ab-initio-Methoden, Sekundärstrukturvorhersage und Transmembranhelix und Signalpeptidvorhersage.

Die Auswahl der richtigen Methode beginnt immer mit der Verwendung der Primärsequenz des unbekannten Proteins und der Suche in der Proteindatenbank nach Homologen (Abbildung 2).

Entscheidungsdiagramm für die Methode zur Vorhersage der Proteinstruktur.

Hier sind einige detaillierte Methoden zur Vorhersage der Proteinstruktur:

  • Werkzeuge zur Vorhersage der Sekundärstruktur

Diese Werkzeuge sagen lokale Sekundärstrukturen voraus, die nur auf der Aminosäuresequenz des Proteins basieren. Die vorhergesagten Strukturen werden dann mit dem DSSP-Score verglichen, der basierend auf der kristallografischen Struktur des Proteins berechnet wird (mehr zum DSSP-Score hier).

Vorhersagemethoden für Sekundärstrukturen stützen sich hauptsächlich auf Datenbanken bekannter Proteinstrukturen und moderne Methoden des maschinellen Lernens wie neuronale Netze und Support-Vektor-Maschinen.

Hier sind einige großartige Werkzeuge zur Vorhersage der Sekundärstruktur.

  • Tertiärstruktur

Werkzeuge zur Vorhersage der Tertiärstruktur (oder 3D-Struktur) lassen sich in zwei Hauptmethoden einteilen: Ab initio und vergleichende Proteinmodellierung.

Ab-initio (oder de novo) -Vorhersagemethoden für Proteinstrukturen versuchen, Tertiärstrukturen aus Sequenzen vorherzusagen, die auf allgemeinen Prinzipien basieren, die die Proteinfaltungsenergie und / oder statistische Tendenzen von Konformationsmerkmalen steuern, die native Strukturen ohne Verwendung expliziter Templates erhalten.

Alle Informationen über die Tertiärstruktur eines Proteins sind in seiner Primärstruktur (dh seiner Aminosäuresequenz) kodiert. Es kann jedoch eine enorme Anzahl von ihnen vorhergesagt werden, von denen nur eine die minimale freie Energie und Stabilität aufweist, die erforderlich sind, um richtig gefaltet zu werden. Die Vorhersage der Ab-initio-Proteinstruktur erfordert daher eine enorme Rechenleistung und Zeit, um die native Konformation eines Proteins zu lösen, und bleibt eine der größten Herausforderungen für die moderne Wissenschaft.

Zu den beliebtesten Servern gehören Robetta (mit dem Rosetta-Softwarepaket), SWISS-MODEL, PEPstr, QUARK. Durchsuchen Sie hier eine vollständige Liste.

Wenn ein Protein mit bekannter Tertiärstruktur mindestens 30% seiner Sequenz mit einem potenziellen Homologen mit unbestimmter Struktur teilt, können Vergleichsmethoden verwendet werden, die die mutmaßliche unbekannte Struktur mit der bekannten überlagern, um die wahrscheinliche Struktur des Unbekannten vorherzusagen. Homologiemodellierung und Protein-Threading sind zwei Hauptstrategien, die vorherige Informationen zu anderen ähnlichen Proteinen verwenden, um eine Vorhersage eines unbekannten Proteins basierend auf seiner Sequenz vorzuschlagen.

Homologiemodellierungs- und Protein-Threading-Software umfassen RaptorX, FoldX, HHpred, I-TASSER und mehr.

Verweise

Vorhersage der De-novo-Proteinstruktur. Wikipedia.

Vorhersage der Proteinstruktur. Wikipedia