Biotechnik profitiert von moderner DV-Architektur:

Superminis öffnen Fenster zur Schöpfung

15.09.1989

BRAUNSCHWEIG - "Number Crunching" mit Minisupercomputern ist auch eine Möglichkeit, Menschenleben zu retten. Die Gesellschaft für Biotechnologische Forschung aus Braunschweig (GBF) entwickelte erfolgreich ein Protein als Enzym-Inhibitor, das dem gefürchteten aseptischen Schock bei Infektionen den Schrecken nimmt. Die Voraussetzungen für die wissenschaftliche Arbeit waren durchaus überschaubar: Es gibt lediglich 10**330 Möglichkeiten**, ein Protein zu gestalten.

In der Bundesrepublik existiert nach Aussage von Dr. Dietmar Schomburg, Leiter der Arbeitsgruppe Molekulare Strukturforschung der GBF, erst ein einziges Protein-Design-Projekt, das erfolgreich gelaufen ist. Die Bereiche, in denen geforscht wird, sind vielfältig, teils auch finden sie Eingang in das tägliche Leben, so zum Beispiel bei der Frage der Enzyme in Waschmitteln. Diese wirken schmutzlösend, haben aber einen großen Nachteil: Sie sind in der alkalischen Laugenumgebung relativ instabil und daher kurzlebig. Wenn die Forscher diese Kurzlebigkeit durch eine veränderte Struktur des Enzyms verlängern könnten, könnte gleichzeitig die Menge der eingesetzten Enzyme verringert werden - ein Ziel, das sich zu verfolgen lohnt, da Enzyme in der Herstellung noch sehr teuer sind.

Enzyme geraten bei Krankheit außer Kontrolle

Von der Bedeutung her wichtiger ist diese Forschung im Bereich der Medizin. Hier gibt es durch die Protein-Design-Forschung völlig neue Aspekte, da durch verbesserte- sprich: ausgefeiltere - Molekularstrukturen sehr viel gezielter im medikamentösen Bereich Nebenwirkungen an anderen Organen ausgeschaltet werden können.

Molekularbiologische Forschung ist ein recht junger Wissenschaftszweig, der erst seit 1982 aufblüht. Forschungseinrichtungen existieren in Japan (PERI) und den USA (CARB). In Deutschland zählt die Gesellschaft für Biotechnologische Forschung GBF in Braunschweig zu den Einrichtungen, in denen intensiv biotechnologische Forschung betrieben wird. In diesem öffentlich geförderten Institut (zu 90 Prozent Finanzierung durch den Bund, zu 10 Prozent durch das Land Niedersachsen) arbeiten rund 500 Wissenschaftler in den Bereichen Bioverfahrenstechnik, Mikrobiologie, Genetik und Strukturforschung.

In den letzten Jahren befaßten sich die Forscher der GBF im medizinschen Bereich mit dem "aseptischen Schock" - einer bislang in der Hälfte aller Fälle tödlich verlaufenden Irritation des Organismus. Wenn beispielsweise nach schwierigeren Operationen größere Infektionen auftreten, dann werden in dieser Körperregion sehr viele weiße Blutkörperchen produziert. Diese weißen Blutkörperchen setzen ein Enzym frei, das die Aufgabe hat, Bakterienzellwände abzubauen. Werden zu viele, Enzyme durch überhöhtes Auftreten der weißen Blutkörperchen freigesetzt, dann ist diese Aktivität nicht mehr kontrollierbar - das Enzym greift nicht mehr nur Bakterien, sondern auch weiße Blutkörperchen an, die in dieser Region vorhanden sind. Diese wiederum setzen noch mehr Enzyme frei - der Zustand schaukelt sich hoch. Das Enzym wird dann so dominierend, erläutert Schomburg, daß es Körpersubstanz angreift: Der aseptische Schock mit einer Todesrate von 50 Prozent tritt ein - allein in den USA sterben 2000 Menschen pro Jahr am aseptischen Schock.

Für das Enzym mit der Bezeichnung Elastase bedarf es also dringend eines Inhibitors - eines anderen Enzymes quasi als "Aktivitätsbremse". Ein menschlicher ElastaseInhibitor aber ist zur Zeit unbekannt - herkömmliche medikamentöse Mittel sind zu unspezifisch und daher nur eingeschränkt wirksam. Sie führen beispielsweise dazu, daß die Blutgerinnung gehemmt wird. Ein zu Anfang erfolgversprechender Inhibitor zur Behandlung des aseptischen Schocks wurde von einem Schweizer Pharma-Unternehmen bei Blutegeln gefunden. Der Nachteil hier aber ist, daß das Fremdprotein sehr schnell vom Körper als solches erkannt und angegriffen wird. Auf Grund der entsprechenden Nebenwirkungen wurden diese Arbeiten eingestellt.

Die GBF ging bei ihren Forschungen zur Elastasehemmung von einem menschlichen Protein aus, einem Enzym also, das der Körper kennt und deshalb nicht mehr angreift. Dieses Protein muß zu seiner eigentlichen Aufgabe aber relativ geringfügig geändert werden.

"Relativ geringfügig" heißt in einem solchen Fall, daß eine unvorstellbare Anzahl Varianten überprüft werden muß, wobei die Veränderung bestimmten Gesetzmäßigkeiten genügen muß, ohne die das modellierte Enzym nicht wirkungsvoll ist.

Die Wissenschaftler haben auf ihrem Weg zuerst ein menschliches Protein isoliert. Proteine sind im Prinzip lange kettenförmige Hetero-Polymere, die sich aus einzelnen Bausteinen, den Aminosäuren, zusammensetzen. Je nach der Frequenz, die sich bei der Verkettung der 20 verschiedenen Aminosäuren, einstellt, und einer charakteristischen Faltung, üben Proteine ihre spezifische biologische Wirkung als Enzym, Strukturprotein, Hormon, Antikörper, Toxin oder ähnlichem aus.

Die Vorgehensweise beim Protein-Design besteht, so erläutert Schomburg, in der zyklischen Abfolge von experimentellen physikalischen, chemischen und biologischen Schritten, wobei der Technik des "Computer Aided Protein Design" (CAPD) eine wachsende Bedeutung zukommt.

Zur Proteinmodellierung am Computer bedarf es zuerst der Konstruktion einer dreidimensionalen Struktur eines artverwandten Proteins als Alternative zur experimentellen Bestimmung der Struktur und in einem zweiten Schritt dann der Definition der möglichen zu ändernden Positionen in der Hauptkette der Aminosäuren, um letztendlich vorhersagen zu können, welche Auswirkungen die Veränderung der Primärstruktur auf die dreidimensionale Struktur, die Aktivität und die Stabilität des Proteins hat.

Sequenzveränderungen werden auf dem Bildschirm als Quasi-Echtzeit-Darstellung gezeigt. Zur Analyse des Ausgangs- und des modellierten Proteins werden verschiedene Darstellungsweisen und Farbkodierungen für Ladungen, Art der Aminoseitenkette oder Atomtypen eingesetzt.

Zur Modellierung eines neuen Proteins sind nach Aussage Dr. Schomburgs drei Schritte notwendig. Zum ersten wird von einer gegebenen 3D-Struktur mit der Hilfe molekularer Grafik ausgegangen, um mögliche Veränderungen der Aminosäuren zu erkennen und einzuarbeiten. In einem zweiten Schritt unterliegt das modifizierte Protein einer Kraftfeldanalyse mit Energieminimierung, um dann in einem dritten Zyklus mit der 3D-Struktur des Originalproteins verglichen zu werden. Kenntnisse der Korrelation, Struktur-Funktion und Struktur-Stabilität werden zur Bewertung herangezogen. Das modellierte Protein wird dann entweder synthetisch hergestellt oder der Berechnungszyklus neu gestartet.

Für ihre Forschungsarbeiten entwickelten die GBFler ein Softwarepaket mit der Bezeichnung "Bragi", das speziell im ersten und dritten Schritt Anwendung findet und den zweiten Schritt unterstützt. Das menügesteuerte Programm ist auf vektorgrafischen Bildschirmen PS300 von Evans & Sutherland installiert; die mit einer DEC VAX unter VMS über Decnet sowie Hewlett-Packard SRX Workstations verbunden sind. Die Hintergrundberechnungen - das Number Crunching für die Darstellungsberechnungen - führen seit kurzem zwei Trace 14/300 der GEI Rechnersysteme GmbH aus Aachen durch.

Während die Echtzeitrotation nur mit Hilfe der Vektordarstellung möglich ist, liefert die Rastergrafik-Workstation zusätzliche Information durch Darstellung der molekularen Oberfläche.

Bei dem Ausgangsprotein ihrer Arbeiten für den gesuchten Inhibitor wußten die Forscher nach seiner Isolation, welche Aminosäure an welcher Stelle stand. Wichtig war auch, zu wissen, wie die Faltung der Kette aussieht - sie ist für jedes Protein charakteristisch. Ein Protein ist nur in dieser sehr kompakten, "kartoffelförmigen" Faltung aktiv. Diese Faltungsstruktur wurde mit einer Proteinraumstruktur-Analyse bestimmt. Eine solche Analyse dauert im Labor rund anderthalb Jahre, In diesem speziellen Forschungsvorhaben wurde die Struktur des menschlichen Ausgangsproteins aus einer bekannten, relativ ähnlichen Schweine-Proteinstruktur vorhergesagt - erstmals mittels "molecular modelling" (Molekülmodellierung).

Auf Grund der angenommenen Struktur kam dann die Überlegung, was an der Faltung und der Struktur der Sequenz geändert werden kann und muß, damit das Molekül nicht mehr seine ursprüngliche Aufgabe der Hemmung eines ganz anderen Proteins ausführt. Die Planung von Varianten war die wichtigste Arbeit, die den DV-Fachleuten in diesem Projekt zukam. Um sich das Ausmaß dieser Arbeit vorstellen zu können, bringt Dr. Schomburg ein Beispiel: Die Zahl der Möglichkeiten einer Protein-Veränderung ist so groß, daß man die gesamte Masse des Universums benötigt hätte, um jeweils ein Molekül jeder möglichen Variante herzustellen. * * Hier ist eine der wichtigsten Aufgaben im Vorfeld die gezielte Planung der Arbeiten, um auf eine handhabbare Zahl zu kommen.

In einem zyklischen Prozeß wurden von der DV-Gruppe des Forschungsteams drei Varianten vorhergesagt - die den gewünschten Zweck nicht so sehr erfüllten. "Daraus haben wir dann gelernt", erzählt Dr. Schomburg, und fünf Varianten entwickelt, die sehr gut paßten. Das Problem der praktischen Forschung liegt in der Herstellung der Varianten. "Wir machen diese Arbeit nur vor dem Computer", so Dr. Schomburg, "da geht es eigentlich recht gut." Der Forscher hat auf seinem Bildschirm ein Molekül in 3D-Darstellung - Erfahrung und interdisziplinäres Wissen führen zu einer ersten Einschränkung der Varianten.

Erscheint eine Möglichkeit als "gut" oder "machbar", so wird über Energie-Minimierung auf Rechnern wie dem Trace überprüft, ob diese Molekülstruktur für das Forschungsziel geeignet ist. Falls ja, geben die DVIer - in diesem Fall Strukturchemiker - die Info über die mögliche Veränderung zum experimentellen Austausch und zur Erstellung des benötigten Gens an die Molekularbiologen weiter, die es einem Mikroorganismus einpflanzen. Dieser produziert dann das gewünschte Protein zum Weitertest im Reagenzglas. Die Methoden, die hier rechentechnisch mit Bragi eingesetzt werden, sind ähnlich denen des CAD in der Automobilindustrie.

Die Strukturberechnung des "neuen" Moleküls an sich ist ein diffiziles Thema. Im ersten Schritt existiert eine unermeßliche Zahl von Freiheitsgraden - die astronomische Zahl von 10330** gibt ein Bild davon. Hier scheitert aus Gründen der Berechnungszeit bislang jeder Computer - Fachwissen ist gefragt, um eine begrenzte Anzahl Varianten herauszufischen. Punktuelles Vorgehen mit der Beschränkung auf Aminosäuren in bekannter Wechselwirkung mit der Elastase führten hier zu ersten Ansätzen.

Die ersten Varianten bei der Technik des CAPD werden aus einem Grundmuster am Bildschirm erstellt, indem an bestimmten Stellen ein Austausch in Form einer Verlängerung oder Verkürzung durchgeführt wird. Durch diesen Austausch aber verändert sich die Gesamtstruktur des Moleküls, die nur durch sogenannte "Kraftfeldberechnungen" vorhergesagt werden können - eine Aufgabe für Supercomputer.

Jedes einzelne der etwa 1000 Atome pro Protein wird untersucht und so in seiner Lage optimiert, daß es der neuen Variante den optimalen Energiewert zuordnet. Dabei ist auch noch zu berücksichtigen, daß die Faltung des Proteins erhalten bleibt es darf keine drastische Veränderung eintreten, um die Wirksamkeit nicht von vornherein aufzuheben. Lediglich die Oberflächenstruktur kann geringfügig verändert werden, um beispielsweise eine bessere Bindung an die Elastase zu erzielen.

Hier gibt es verschiedene Möglichkeiten. So kann zum Beispiel versucht werden, einer negativen Ladung an einer Stelle der Elastase eine positive des Inhibitors entgegenzusetzen - zwar nicht das erfolgreichste Verfahren, wie Wissenschaftler Dr. Schomburg erklärt, aber ein gut verständliches für die Problematik.

Die Optimierungsverfahren hier ähneln denen, die in Windkanalverfahren eingesetzt werden. Die Forscher machen sich bei diesem Verfahren ein Naturgesetz zunutze, wonach jedes Molekül von sich aus in seinem energieärmsten Zustand steht.

Im Computer wird das Molekül aufgeheizt

Die Berechnungen, die durchgeführt werden müssen, sind schlecht quantifizierbar. Es werden Prozesse simuliert, die das Protein in seinem Lösungsmittel in Sekundenbruchteilen absolviert - mit den Rechnern, die zur Zeit existieren, können aber nur sechs Größenordnungen weniger simuliert werden.

Man bewegt sich heute im Picosekundenbereich mit 10**-12 bis 10**-11 Sekunden - aber, so Schomburg; diese Zeitperiode reicht, um gewisse Vorstellungen über das Verhalten des modellierten Proteins zu bekommen. Um diese Hinweise auf die Stabilität zu bekommen, kann eine Cray XMP oder Cray 2 durchaus 24 Stunden rechnen. Der Supermini Trace schafft diese Berechnung in ungefähr der doppelten Zeit.

Im ersten Schritt ist das Molekül durch den veränderten Aufbau nicht mehr im Gleichgewichtszustand hier wird eine Energie-Minimierung gefahren, die solange läuft, bis das Minimum erreicht ist. Bei einer Faltung aber gibt es eine Vielzahl von Nebenminima. Das Interesse nun liegt auf Grund des erwähnten Naturgesetzes aber nur an dem absolut tiefsten Minimum. Hier gibt es bei der Fülle der "Fast-Minima" kein mathematisches Verfahren um die Absolutheit des errechneten Minimalwertes zu verifizieren. Der Forscher behilft sich mit der rechnerischen Simulation von Schwingungen, die das Molekül auf Grund thermischer Energie in der Realität ebenfalls durchführt.

Im Computer wird das Molekül also quasi aufgeheitzt und der Forscher hofft, daß das Molekül durch die thermische Schwingung aus einem eventuell angezeigten Energie-Nebenminimum herausspringt und in das tiefste Minimum reinfällt. Ein Nebeneffekt, der den Forschern sehr gelegen kommt, ist die Tatsache, daß bei diesem Verfahren, zu erkennen ist, welche Teile des Moleküles sich sehr aktiv und welche sich sehr passiv verhalten.

Die Anpassungsfähigkeit bei Aufeinandertreffen zweier Moleküle und ihre Wechselbeeinflussung können daran vom Forscher abgelesen werden. Die Schwingungen des Moleküls in einem bestimmten Zeitraum teilen sich auf in sehr kurzfristige Schwingungen und langfristige Schwingungen, in dem sich größere Teile des Moleküls gegeneinander bewegen. Die langsameren Schwingungen wären eigentlich die für Forscher die interessanteren, meint Dr. Schomburg, "aber da kommen wir noch nicht ran".

Die Schwingungen werden im Rechner dann in kleine Teilschritte aufgeteilt - der Blick auf die einzelnen Komponenten gibt Aufschluß darüber, welche Kräfte in einem spezifischen Moment auf jedes Atom in dem Molekül wirken und es in eine bestimmte Richtung ziehen. Die Teilschritte, die per Rechner realisiert werden liegen, bei ungefähr 10**-16 Sekunden. Die Berechnung jedes einzelnen Teilschrittes benötigt entsprechende Computerzeit - zur Zeit können ungefähr 10**-6 bis 10**-7 von diesen Teilschritten berechnet werden. Danach sprengt sich das Verhältnis zwischen Rechenaufwand und Ergebnis - nach Monaten der Berechnung ist das Ergebnis nicht mehr interessant.

Die GBF-Forscher sind dabei, diese DV-Verfahren des jungen Forschungsbereiches weiter zu entwickeln - Ziel dieser in der Bundesrepublik einzigen Gruppe ist es, Methoden zu entwickeln, die Struktur- wie auch die Funktionsplanung von Molekülen so weiterzuentwickeln, wie es bei Kfz- oder Chip-Design heute zum Teil schon realisiert ist.

Bevor die Trace angeschafft wurde, die die Berechnungen der GBF-Wissenschaftler jetzt durchführt, wurden umfangreiche Benchmarks mit anderen Systemen gefahren. Dabei hat sich die Trace als das System mit dem besten Preis-/Leistungsverhältnis und der besten Kombination von Eigenschaften für die GBF-Forscher erwiesen.

Die beiden Trace werden bei GBF als zentrale Numbercruncher eingesetzt. Es wäre nach Dr. Schomburgs Aussage nicht sinnvoll, bei dieser hochkomplexen Anwendung die Trace für die reinen Grafikberechnungen der 3D-Darstellungen des Moleküls einzusetzen. Hier hilft man sich zur besseren Nutzung der vorhandenen Kapazität und aus Kosten-/Nutzen-Überlegungen bei der GBF mit der erwähnten Rechner-Rechner-Kopplung.

Die Forschungen der GBF waren von Erfolg gekrönt. Die Wissenschaftler haben einen Inhibitor entwickelt, der die Aktivität der Elastase um die Größenordnung 11 senkt.

* Martin J. P. Hoffman ist freier DV-Fachjournalist in München

* * Da es 20 verschiedene Aminosäuren gibt, können an Position 1 der Protein-Hauptkette die Aminosäuren 1 bis 20 positioniert werden; an Position 2 wiederum Aminosäure 1 bis 20 und so fort. Bei einer zweigliedrigen Kette gibt es also schon 20 mal 20 Möglichkeiten. Für ein mittelgroßes Protein errechnet sich somit eine Variantenzahl von rund 20 hoch 250; das entspricht ungefähr 10 hoch 330, also einer Zehn mit 330 Nullen theoretischer Möglichkeiten. Wäre die Masse des Universums in ihrer Elementarzusammensetzung geeignet, um jedes Molekül "nachzubauen", so käme man auf einen - rein rechentechnischen - Darstellungswert von 10**72 Möglichkeiten, also "nur" einer 10 mit 72 Nullen.