„Mit KI die Rechenzeit reduzieren“
Dirk Eidemüller

gorodenkoff/iStock
Welt der Physik: Warum benötigt man in der Physik eigentlich so viele Simulationsdaten?
Gregor Kasieczka: Es kommt ein bisschen auf den Forschungsbereich an, ob man Simulationsdaten dringend benötigt und wie groß die Datenmengen dann sind. In der Teilchenphysik und Astrophysik hat man es generell mit riesigen Datenmengen zu tun. Denn sowohl die Experimente an den Teilchenbeschleunigern – also die Detektoren – als auch die Teleskope und Observatorien produzieren bereits selbst enorm viele Daten. Aber um diese Daten auswerten zu können, benötigt man zusätzliche, große Mengen an simulierten Daten. Diese werden nach klar definierten Kriterien erstellt und bringen ebenfalls große Datenmengen mit sich.
Was heißt das konkret?
In der Teilchenphysik ist es etwa so, dass an einem Gerät wie dem LHC am Forschungszentrum CERN in jeder Sekunde rund 40 Millionen sogenannte Ereignisse stattfinden, von denen am Ende aber nur mehrere Tausend gespeichert werden. Bei jedem einzelnen Ereignis strömen Tausende Partikel, die bei einer Kollision erzeugt wurden, durch den Detektor. Um zu verstehen, was genau da passiert, vergleicht man die realen Ereignisse mit Simulationsdaten. In der Computersimulation lässt man etwa ein bestimmtes Teilchen mit einer bestimmten Energie durch einen bestimmten Teil des Detektors laufen und schaut, was dann alles passiert. Das alles lässt sich mittlerweile sehr präzise berechnen und liefert dann eine solide Basis für die Auswertung der realen Daten. Allerdings benötigt man mit einem normalen Computerprozessor rund eine Minute Rechenzeit, um ein einziges Kollisionsereignis durchzurechnen.
Wie werden diese Simulationsdaten bislang erzeugt?
Alle großen Teilchenphysik- und auch Astrophysikinstitute weltweit haben Rechenzentren, die teilweise auch mithilfe von Supercomputern solche Simulationsberechnungen durchführen. Herkömmliche Computer kommen da schnell an ihre Grenzen. Ein Beispiel: Wenn im LHC die Produktion von sogenannten Z-Bosonen, einem speziellen Elementarteilchen, zusammen mit mehreren weiteren Teilchenjets, mit hoher Genauigkeit simuliert werden soll, fallen dabei – um die notwendige Anzahl an Ereignissen zu erreichen – schnell viele Millionen CPU-Jahre an. Ein normaler Computerchip müsste also Millionen von Jahren daran rechnen. Auch auf einem Supercomputer verschlingt das nicht nur Rechenzeit, sondern natürlich auch entsprechend viel Strom.
Sie koordinieren das Projekt „KISS“, mit dem solche Simulationen einfacher berechnet werden sollen. Welche Rolle spielt dabei Künstliche Intelligenz, also KI?
In unserem Projekt verfolgen wir den Plan, diese komplexen Simulationen analog zu den bekannten Sprachmodellen wie ChatGPT zu vereinfachen. Die Sprachmodelle werden anhand von Texten trainiert und liefern dann mehr oder weniger plausibel klingende Antworten auf die Fragen, die man ihnen stellt. In der Physik verwenden wir nun nicht Sprache als Trainingsmaterial, sondern eben Daten, die wir in normalen Simulationen gewonnen haben. Die KI erkennt dann bestimmte Muster in den simulierten Ereignissen und kann daraus weitere Simulationsdaten erzeugen – und zwar ohne alle Berechnungen nochmal im Detail nachvollziehen zu müssen.
Wie viel Rechenzeit lässt sich so einsparen?
Die Hoffnung ist, die Rechenzeit um rund eine bis zwei Größenordnungen zu reduzieren – und auch entsprechend viel Energie zu sparen. Optimistische Szenarien gehen in Zukunft sogar von noch höheren Einsparungen aus. Aber das wird man sehen müssen. Beim vorhin genannten Beispiel mit dem Z-Boson können wir dank der KI die 50 Millionen CPU-Jahre bereits auf acht Millionen herunterdrücken. Das ist bereits fast eine Größenordnung, und wir stehen ja noch ziemlich am Anfang. Natürlich ist das Training zunächst aufwendig, und dafür benötigt man klassische Simulationsdaten. Aber danach hat man eine gut trainierte KI, die viel Rechenleistung ersetzen kann.
Aber wie kann man sicher sein, dass die KI auch sinnvolle Resultate produziert?
Das ist ein sehr wichtiger Aspekt, den wir auf verschiedene Weise analysieren. Bei allen Verfahren mit KI-Einsatz muss verifiziert werden, dass nicht fehlerhafte oder einseitige Daten erzeugt werden. Wir arbeiten hierzu im Projekt nicht nur mit Expertinnen und Experten aus der Physik zusammen, sondern auch aus der Mathematik und Informatik. Unter anderem entwickeln wir bestimmte Verfahren, um die per KI erzeugten Simulationsdaten mit klassisch erzeugten Simulationen zu vergleichen. Zum Beispiel arbeiten wir bei Anwendungen, bei denen besonders hohe Genauigkeit notwendig ist, in zwei Schritten: Zuerst produziert der KI-Algorithmus einen Vorschlag, der dann noch von einem zweiten Algorithmus – ebenfalls automatisch – validiert wird. Wenn wir keine relevanten Unterschiede zwischen beiden Typen von Simulationsdaten erkennen können, dann wissen wir, dass die KI gute Arbeit geleistet und mit deutlich geringerem Ressourceneinsatz brauchbare Daten geliefert hat.
Für welche Zwecke sollen dieses KI-Verfahren noch zum Einsatz kommen?
Im Fokus steht zunächst die Teilchenphysik. Aber auch die Astro- und die Astroteilchenphysik haben ganz ähnliche Fragestellungen. Wenn etwa ein hochenergetisches Teilchen der kosmischen Strahlung auf die Erdatmosphäre trifft, erzeugt das einen Teilchenschauer. Dem liegen ganz ähnliche physikalische Prozesse zugrunde wie im Detektor eines Teilchenbeschleunigers. Aber auch in der Radioastronomie und ähnlichen Gebieten ist die von uns entwickelte KI nützlich. Für Gebiete wie die Klimaforschung wird man allerdings andere Ansätze benötigen, da dort lange Zeiträume mit komplexen, rückgekoppelten Variablen eine entscheidende Rolle spielen. Für solche Prozesse eignet sich unser Ansatz nicht so gut, sondern vor allem für kurzfristige Ereignisse.
Das Bundesministerium für Forschung, Technologie und Raumfahrt fördert das Projekt „KISS: Künstliche Intelligenz zur schnellen Simulation von wissenschaftlichen Daten.“ im Zeitraum von März 2023 bis Februar 2026 mit rund 3 600 000 Euro.
Fördersumme: 3 615 144 Euro
Förderzeitraum: 01.03.2023 bis 28.02.2026
Förderkennzeichen: 05D23GU4, 05D23MG1, 05D23OD1, 05D23PE1, 05D23RI1, 05D23VH1, 05D23WM1, 13D22CH5
Beteiligte Institutionen: Universität Hamburg, Universität Göttingen, Technische Universität Dresden, Technische Universität Dortmund, Frankfurt Institute for Advanced Studies, Universität Heidelberg, Universität München, Deutsches Elektronen-Synchrotron
Quelle: https://www.weltderphysik.de/thema/bmbf/digitalisierung-in-der-grundlagenforschung/kuenstliche-intelligenz-mit-ki-die-rechenzeit-reduzieren/