Im Rahmen des Projekts SWAG sollen mittels Swarm Learning trainierte KI-Modelle genetische Veränderungen vorhersagen können. Das soll dazu dienen, die Diagnostik und Behandlung von Krebserkrankungen zu verbessern.
Im vom Bundesministerium für Bildung und Forschung geförderten und vom Uniklinikum Würzburg koordinierten Projekt SWAG wird das Teilen und Analysieren von Datensätzen mittels kombinierter KI-Methoden entwickelt und erprobt.
Das Kürzel SWAG steht für „SWArm learning for Generation and dissemination of high-quality data in oncology“. Die synthetischen Datensätze und trainierten Modelle sollen öffentlich verfügbar gemacht und gemeinsam weiterentwickelt werden, um die Diagnostik und Behandlung von Krebserkrankungen zu verbessern. Letztendlich geht es bei dem Projekt darum, wie man einerseits vermeidet, persönliche Gesundheitsdaten für Forschungszwecke zu verwenden und zu teilen, andererseits aber dennoch hochqualitative Daten in der Krebsmedizin für Forschungszwecke nutzen kann.
Klar ist: Persönliche, medizinische Daten sind überaus sensibel und unterliegen einem besonderen Schutz. Auch wenn man sie noch so sehr anonymisiert, dürfen sie aufgrund des in der EU geltenden Datenschutzes nicht herausgegeben werden und müssen dortbleiben, wo sie erhoben wurden. Das erschwert jedoch die Präzision in Diagnostik und Behandlung vieler Erkrankungen. Ganz besonders dann, wenn Krankheiten wie etwa einige Krebserkrankungen selten sind und entsprechend wenige Informationen überhaupt verfügbar sind. Stünde indes eine große Sammlung an medizinischen Bilddaten aus verschiedenen Krebszentren zur Verfügung, könnten Forscher und Mediziner die Entwicklung von Tumoren und einer möglichen Metastasierung besser abschätzen und eine optimale Therapie wählen.
Synthetische Daten frei von Datenschutzbeschränkungen
Im Rahmen des Projekts SWAG will ein interdisziplinäres Konsortium aus fünf Wissenschaftlerinnen und Wissenschaftlern die praktischen, ethischen und rechtlichen Hindernisse, die einer Sammlung großer Datensätze im Wege stehen, überwinden. Mittels Künstlicher Intelligenz können klinisch relevante Parameter aus Röntgenbildern, Computertomografie-Aufnahmen oder histologischen Befunden ausgelesen werden und zu einem KI-Modell zusammengefasst werden. Je mehr Patientendaten das KI-Modell umfasst, umso effizienter lassen sich krankhafte Veränderungen in Zellen und Gewebe vorhersagen.
Datensätze an verschiedenen Standorten
Der Schwarm besteht in diesem Fall aus Servern an fünf Standorten: der Universitätsmedizin in Aachen, Dresden, Heidelberg, Mainz und Würzburg. Über diese Server werden die gelernten, also künstlich erzeugten Modelle mittels Blockchain-Technologie untereinander ausgetauscht. Das heißt, die Daten bleiben am Standort, man teilt nur die Algorithmen und das, was sie am jeweiligen Standort dazulernen. Einen zentralen Koordinator wie es beim föderierten Lernen der Fall ist, gibt es beim Schwarmlernen nicht, wodurch die Daten zusätzlich gesichert sind. Jeder lokale Server wirkt als zentraler Server, sobald er seinen neuesten Block mit künstlichen Datensätzen mit dem vorhergehenden Block verbindet und somit das KI-Modell mit einer stetig wachsenden Datenmenge trainiert.
Seltene Tumore besser bewerten und behandeln
„Wir erzeugen synthetische Bilder, die auf ganz vielen Bildern von verschiedenen Patienten basieren, jedoch keinen Patientenbezug mehr haben und daher niemandem gehören“, bringt es Professorin Dr. Bettina Baeßler auf den Punkt. Die Leiterin der Kardiovaskulären Bildgebung und Künstlichen Intelligenz am Uniklinikum Würzburg koordiniert das SWAG-Projekt. Die Radiologin vergleicht es gern mit KI-generierten Kunstwerken: „Die KI lernt wie typische Bilder von van Gogh oder Monet aussehen. Dann sage ich: Generiere mir ein Bild, dass so aussieht, als hätte es van Gogh gemalt. Das Bild sieht dann aus wie ein van Gogh, ist aber keiner.“ Ziel ist es, die synthetischen Datensätze und trainierten Modelle mit der Wissensgemeinschaft zu teilen, sie gemeinsam weiterzuentwickeln und somit seltene Tumore besser bewerten und behandeln zu können. Das SWAG-Projekt wird vom Bundesministerium für Bildung und Forschung (BMBF) mit einer Millionen Euro über einen Zeitraum von zwei Jahren gefördert.