Seitenbanner

Nachricht

Der diesjährige Lasker Basic Medical Research Award wurde Demis Hassabis und John Jumper für ihre Beiträge zur Entwicklung des künstlichen Intelligenzsystems AlphaFold verliehen, das die dreidimensionale Struktur von Proteinen auf der Grundlage der Aminosäuresequenz erster Ordnung vorhersagt.

 

Ihre Ergebnisse lösen ein Problem, das die wissenschaftliche Gemeinschaft seit langem beschäftigt, und ermöglichen eine Beschleunigung der Forschung im gesamten biomedizinischen Bereich. Proteine ​​spielen eine zentrale Rolle bei der Krankheitsentstehung: Bei der Alzheimer-Krankheit falten und verklumpen sie; bei Krebs geht ihre regulatorische Funktion verloren; bei angeborenen Stoffwechselstörungen sind sie dysfunktional; bei Mukoviszidose gelangen sie an die falsche Stelle in der Zelle. Dies sind nur einige der vielen Mechanismen, die Krankheiten verursachen. Detaillierte Proteinstrukturmodelle können atomare Konfigurationen liefern, die Entwicklung oder Auswahl hochaffiner Moleküle vorantreiben und die Arzneimittelforschung beschleunigen.

 

Proteinstrukturen werden im Allgemeinen durch Röntgenkristallographie, Kernspinresonanz und Kryoelektronenmikroskopie bestimmt. Diese Methoden sind teuer und zeitaufwendig. Daher enthalten die vorhandenen 3D-Proteinstrukturdatenbanken lediglich etwa 200.000 Strukturdaten, während die DNA-Sequenzierungstechnologie mehr als 8 Millionen Proteinsequenzen hervorgebracht hat. In den 1960er Jahren entdeckten Anfinsen et al., dass sich die 1D-Sequenz von Aminosäuren spontan und wiederholbar in eine funktionelle dreidimensionale Konformation falten kann (Abbildung 1A) und dass molekulare „Chaperone“ diesen Prozess beschleunigen und erleichtern können. Diese Beobachtungen führten zu einer 60-jährigen Herausforderung in der Molekularbiologie: der Vorhersage der 3D-Struktur von Proteinen aus der 1D-Sequenz von Aminosäuren. Mit dem Erfolg des Humangenomprojekts haben sich unsere Möglichkeiten, 1D-Aminosäuresequenzen zu erhalten, erheblich verbessert, und diese Herausforderung ist noch dringlicher geworden.

ST6GAL1-Proteinstruktur

Die Vorhersage von Proteinstrukturen ist aus mehreren Gründen schwierig. Erstens erfordern alle möglichen dreidimensionalen Positionen jedes Atoms in jeder Aminosäure eine umfangreiche Untersuchung. Zweitens nutzen Proteine ​​die Komplementarität ihrer chemischen Struktur maximal aus, um die Atome effizient anzuordnen. Da Proteine ​​typischerweise Hunderte von Wasserstoffbrücken-„Donoren“ (normalerweise Sauerstoff) haben, die sich in der Nähe des Wasserstoffbrücken-„Akzeptors“ (normalerweise an Wasserstoff gebundener Stickstoff) befinden sollten, kann es sehr schwierig sein, Konformationen zu finden, bei denen sich nahezu jeder Donor in der Nähe des Akzeptors befindet. Drittens gibt es nur begrenzt Beispiele für das Training experimenteller Methoden, sodass es notwendig ist, die potenziellen dreidimensionalen Wechselwirkungen zwischen Aminosäuren auf der Grundlage von 1D-Sequenzen zu verstehen, indem man Informationen über die Evolution der relevanten Proteine ​​nutzt.

 

Die Physik wurde erstmals verwendet, um die Interaktion von Atomen bei der Suche nach der besten Konformation zu modellieren, und es wurde eine Methode entwickelt, um die Struktur von Proteinen vorherzusagen. Karplus, Levitt und Warshel erhielten 2013 den Nobelpreis für Chemie für ihre Arbeit zur computergestützten Simulation von Proteinen. Physikbasierte Methoden sind jedoch rechenintensiv und erfordern eine ungefähre Verarbeitung, sodass präzise dreidimensionale Strukturen nicht vorhergesagt werden können. Ein anderer „wissensbasierter“ Ansatz besteht darin, Datenbanken mit bekannten Strukturen und Sequenzen zu verwenden, um Modelle durch künstliche Intelligenz und maschinelles Lernen (KI-ML) zu trainieren. Hassabis und Jumper wenden sowohl Elemente der Physik als auch der KI-ML an, aber die Innovation und der Leistungssprung des Ansatzes beruhen hauptsächlich auf der KI-ML. Die beiden Forscher kombinierten auf kreative Weise große öffentliche Datenbanken mit Rechenressourcen auf Industrieniveau, um AlphaFold zu erstellen.

 

Woher wissen wir, dass sie das Rätsel der Strukturvorhersage „gelöst“ haben? 1994 wurde der Wettbewerb „Critical Assessment of Structure Prediction“ (CASP) ins Leben gerufen, der alle zwei Jahre stattfindet, um die Fortschritte bei der Strukturvorhersage zu verfolgen. Die Forscher teilen die 1D-Sequenz des Proteins, dessen Struktur sie kürzlich entschlüsselt haben, dessen Ergebnisse aber noch nicht veröffentlicht wurden. Der Prädiktor sagt die dreidimensionale Struktur anhand dieser 1D-Sequenz voraus, und der Bewerter beurteilt unabhängig die Qualität der vorhergesagten Ergebnisse, indem er sie mit der vom Experimentator bereitgestellten dreidimensionalen Struktur vergleicht (die nur dem Bewerter zur Verfügung gestellt wurde). CASP führt echte Blindprüfungen durch und zeichnet periodische Leistungssprünge auf, die mit methodischen Innovationen einhergehen. Auf der 14. CASP-Konferenz im Jahr 2020 zeigten die Vorhersageergebnisse von AlphaFold einen solchen Leistungssprung, dass die Organisatoren verkündeten, das Problem der 3D-Strukturvorhersage sei gelöst: Die Genauigkeit der meisten Vorhersagen lag nahe an der von experimentellen Messungen.

 

Die umfassendere Bedeutung liegt darin, dass die Arbeit von Hassabis und Jumper überzeugend zeigt, wie KI-ML die Wissenschaft verändern könnte. Ihre Forschung zeigt, dass KI-ML komplexe wissenschaftliche Hypothesen aus mehreren Datenquellen erstellen kann, dass Aufmerksamkeitsmechanismen (ähnlich denen in ChatGPT) wichtige Abhängigkeiten und Korrelationen in Datenquellen erkennen können und dass KI-ML die Qualität seiner Ergebnisse selbst beurteilen kann. KI-ML betreibt im Wesentlichen Wissenschaft.


Veröffentlichungszeit: 23.09.2023