Auf einer Intensivstation gehören häufige Fehlalarme zum Alltag. Sie beschäftigen nicht nur das medizinische Personal, sondern bergen auch die Gefahr, dass echte Alarme untergehen. Mithilfe von maschinellem Lernen wollen Forscher die Zahl der Fehlalarme deshalb nun reduzieren.
Um dieses Ziel zu erreichen, arbeiten Forscher der ETH Zürich mit Wissenschaftlern der Neurochirurgischen Intensivstation des Universitätsspitals Zürich zusammen. Sie haben eine neue Methode des maschinellen Lernens entwickelt, die falsche Alarme von echten unterscheiden soll. Im Rahmen einer Machbarkeitsstudie wurden wurde diese Methode nun getestet. Dazu nutzten die Forscher umfassende Datenaufzeichnungen der Intensivstation. Für ein Datenwissenschafts-Projekt (ICU Cockpit) werden dort die Messungen der Vitalfunktionen in hoher zeitlicher Auflösung sowie die Alarme mit Zustimmung der Patienten systematisch gespeichert.
Menschliche Vorarbeit nötig
Wie auch auf anderen Intensivstationen üblich, arbeiten auch im Universitätsspitals Zürich die unterschiedlichen Geräte zur Kreislaufüberwachung, künstlichen Beatmung und der Aufzeichnung eines Elektroenzephalogramms unabhängig voneinander. Das führt bislang dazu, dass sie auch unabhängig voneinander Alarm schlage, sobald ein den zuvor definierten Schwellenwert unter- oder überschreitet. Um mithilfe von maschinellem Lernen medizinisch nicht-relevante Alarme ermitteln, wurden deshalb zunächst die Daten der Messgeräte kombiniert und synchronisiert.
„Damit der Computer lernen kann, müssen üblicherweise zuvor Menschen eine bestimme Zahl von Alarmen als relevant oder nicht-relevant beurteilen“, erläutert Walter Karlen, Professor für mobile Gesundheitssysteme an der ETH Zürich. Computersysteme können dann diese Informationen verwenden, um das Prinzip der Klassifizierung zu verstehen und danach selbst Alarme auszuwerten.
Aus wenigen Fehlalarmen lernen
Die Klassifizierung von Alarmen auf einer Intensivstation ist jedoch höchst aufwändig. Denn sie muss für jeden Patienten individuell erstellt werden. Zudem bleibt dem medizinischen Personal neben der Patienten-Betreuung kaum Zeit, eine solche Aufgabe zu stemmen. Deshalb sollte ein System entwickelt werden, das selbst dann lernfähig ist, wenn Pflegekräfte oder Ärzte nur wenige Alarme klassifizieren. Genau hier setzt die Machine-Learning-Methode von Karlen und seinen Kollegen an.
An einem kleinen Datensatz aus der Zürcher Intensivstation haben die Wissenschaftler n ihre Methode getestet. Dabei handelte es sich um eine Aufzeichnung von Vitalparametern und Alarmen von 14 Patienten während mehrerer Tage. Durchschnittlich 700 mal pro Patient und Tag schlugen die Geräte Alarm, im Schnitt also alle zwei Minuten. Von den 14.000 Fehlalarmen waren nur 13 Prozent (1.800) vom Fachpersonal der Intensivstation klassifiziert worden. Auf Basis dieser Daten konnte Algorithmus die restlichen Alarme in echte, beziehungsweise falsche Alarme einteilen. Bei einer Fehlerquelle von fünf Prozent sortierte das System 77 Prozent aller Fehlalarme aus.
Stark bei geringer Vorarbeit
Die Methode funktioniert selbst dann, wenn weit wenige Alarme klassifiziert werden. Bereits 25 oder 50 manuelle Beurteilungen durch Experten reichen aus, um einen Großteil der Fehlalarme auszusortieren. Die Forscher konnten zeigen, dass ihre Methode vor allem bei dieser geringen manuellen Hilfestellung anderen Machine-Learning-Methoden überlegen ist.
Für die aktuelle Studie wurden klinische Daten retrospektiv analysiert. Im nächsten Schritt wollen die Forscher die Leistungsfähigkeit ihres Algorithmus in einer vorausblickenden (prospektiven) klinischen Studie prüfen.