ESMFold sagt Molekülstrukturen voraus

Meta bietet KI-Tool für Proteinforschung

17.03.2023
Von 
Martin Bayer ist Chefredakteur von COMPUTERWOCHE, CIO und CSO. Spezialgebiet Business-Software: Business Intelligence, Big Data, CRM, ECM und ERP.
Mit einem neuen KI-Tool von Meta sollen Forscher die Struktur und Funktion von Proteinen besser vorhersagen können. Das könnte die Entwicklung neuer Medikamente beschleunigen.
Die Art und Weise, wie sich Protein-Moleküle falten, ist komplex. Entsprechend starke KI-Lösungen braucht es, um die dahintersteckenden Prozesse vorherzusagen.
Die Art und Weise, wie sich Protein-Moleküle falten, ist komplex. Entsprechend starke KI-Lösungen braucht es, um die dahintersteckenden Prozesse vorherzusagen.
Foto: Yurchanka Siarhei - shutterstock.com

Die Facebook-Mutter Meta hat ein KI-Tool vorgestellt, mit dessen Hilfe sich Hunderte Millionen von Proteinstrukturen vorhersagen lassen sollen. Die Sparte Meta AI hat mit Hilfe von ESMFold bereits eine Datenbank mit 617 Millionen möglichen Proteinen angelegt, berichtete das Wall Street Journal (WSJ).

Der Bauplan von Eiweißmolekülen ist komplex. Je nachdem wie die einzelnen Bausteine zusammenhängen und sich im Raum aneinanderhängen, entwickelt ein Protein unterschiedliche Eigenschaften. Aufgrund der vielen variablen Parameter erfordert die Berechnung der Molekülstrukturen viel Rechenpower und ausgefeilte KI-Werkzeuge.

Die Vorhersage der Struktur eines Proteins kann Wissenschaftlern helfen, seine biologische Funktion zu verstehen, schreibt Alexander Rives, Forscher bei MetaAI, in einem Beitrag für die Zeitschrift Science. Proteine mit ähnlichen Strukturen wiesen oft auch vergleichbare biologische Funktionen auf, so Rives.

Künstliche Intelligenz statt Mikroskop

Wissenschaftler arbeiten seit vielen Jahren daran, die Struktur und - daraus abgeleitet - die Funktion von Proteinen vorherzusagen. In der Vergangenheit gestaltete sich dies meist aufwändig. Da sich Proteine ständig neu zusammenfalten, bevor sie ihre endgültige Struktur bilden, war die Bestimmung von Proteinstrukturen mit Hilfe von Mikroskopen, um die Moleküle auf atomarer Ebene abzubilden, komplex. KI-Modelle vereinfachen und beschleunigen die Bestimmung. Proteinformen lassen sich innerhalb von Stunden oder Tagen statt in Monaten und Jahren vorhersagen.

ESMFold basiert auf einem großen Sprachmodell, ähnlich der GPT-Technik von OpenAI. Die Wissenschaftler von Meta fütterten das Tool mit einer Reihe von Buchstaben, die solche Aminosäuren darstellen, die den genetischen Code eines Proteins bilden. Das KI-Modell lernte dann, wie es die leeren oder verborgenen Abschnitte in der Sequenz ausfüllen konnte. Sobald eine vollständige Sequenz vorlag, konnte ESMFold die Beziehung zwischen bereits bekannten Proteinsequenzen erlernen, um die Strukturen neuer Proteine vorherzusagen.

Neue Medikamente gegen Krebs

Meta hoffe, mit ESMFold das Wissen, wie Proteine als Grundbaustein des Lebens funktionieren, zu erweitern und die Entwicklung neuer Medikamente zu beschleunigen. KI zur Vorhersage von Proteinstrukturen könnte die Wirksamkeit bestehender Medikamente verbessern, und zur Entdeckung von Molekülen beitragen, mit denen sich schwer zu heilende Krankheiten behandeln lassen. Protein-basierte Medikamente werden heute bereits zur Behandlung von Herzkrankheiten, einzelnen Krebsarten und HIV eingesetzt.

Meta ist nicht der einzige Anbieter, der an KI-Werkzeugen für die Proteinvorhersage arbeitet. Im vergangenen Jahr hatte DeepMind Technologies, eine Tochter der Google-Mutter Alphabet, mit AlphaFold ein Modell vorgestellt, das eine Datenbank von 214 Millionen möglichen Proteinstrukturen beinhaltet.

Nach den bisherigen Einschätzungen von Wissenschaftlern arbeitet ESMFold zwar schneller, aber weniger genau als AlphaFold. Dennoch sei damit zu rechnen, dass auch das Meta-Tool in vielen Fällen gut Ergebnisse liefern werde. Die KI-Vorhersagemodelle von DeepMind und Meta hätten beide ihre Stärken und würden sich gut ergänzen, so der Tenor aus der Proteinforschung.