Berner Studie: KI liefert keine Garantie gegen Fehldiagnosen

Bern, 03.02.2025 - 21:30

Laut einer Berner Studie liefert ein KI-Diagnosesystem keine besseren Ergebnisse als herkömmliche Diagnosen durch einen Arzt.

Inselspital Bern Studie KI — Das Inselspital Bern hat eine Studie zu KI-Diagnosesystemen durchgeführt. (Archivbild) - Keystone

Das Wichtigste in Kürze

Eine Studie des Inselspitals in Bern hat ein KI-Diagnosesystem getestet.
Dabei traten gleich viele Qualitätsprobleme auf wie bei herkömmlichen Diagnosen.
Im aktuellen Entwicklungsstand bietet das System daher noch keinen Mehrwert.

Künstliche Intelligenz (KI) liefert keine Garantie gegen Fehldiagnosen.

Ein in einer Studie des Inselspitals in Bern getestetes KI-Diagnosesystem habe die hohen Erwartungen der Forschenden enttäuscht. Das teilte das Spital am Montag mit.

Das System zeigte keinen messbaren Vorteil gegenüber herkömmlichen diagnostischen Methoden. Eine Studie dazu wurde in der Fachzeitschrift «The Lancet Digital Health» veröffentlicht.

Nach Angaben des Inselspitals handelt es sich um die weltweit erste Studie zu einem KI-basierten Diagnosesystem in der Akutmedizin.

Diagnose wurde mit «Isabel Pro» unterstützt

Für die Studie untersuchte das Forschungsteam um Wolf Hautz vom Inselspital Bern die Diagnosen von rund 1200 Patienten.

Diese wurden mit unspezifischen Beschwerden wie Ohnmacht, Bauchschmerzen oder Fieber in Notfallstationen eingewiesen. Eingeschlossen wurden das Inselspital Bern, das Bürgerspital Solothurn, das Spital Tiefenau und das Spital Münsingen.

Eine Studie hat untersucht, ob ein KI-System Fehldiagnosen minimieren kann. (Symbolbild) - keystone

Die Auswertung ergab, dass sowohl bei Diagnosen mit dem KI-Tool als auch bei herkömmlichen Diagnosen gleich viele Qualitätsprobleme auftraten. (Symbolbild) - keystone

Untersucht wurden Notfall-Patienten verschiedener Spitäler im Raum Bern und Solothurn. (Symbolbild) - keystone

Wenn die Patienten ungeplant weitere Interventionen benötigten, galt dies als Qualitätsproblem. (Symbolbild) - keystone

Bei einem Teil der Patienten liessen sich die Forschenden bei der Diagnosestellung vom KI-basierten System «Isabel Pro» unterstützen.

Die Qualität der Diagnose wurde daran gemessen, ob es innerhalb von zwei Wochen nach der Behandlung zu Problemen kam. Dazu zählten eine ungeplante medizinische Nachsorge, eine Änderung der Diagnose, eine unerwartete Intensivaufnahme oder Todesfälle.

Studie zeigt keine Unterschiede

Sowohl bei KI-Diagnosen als auch bei Diagnosen ohne technische Hilfsmittel traten bei 18 Prozent der Patienten Qualitätsprobleme ein.

Auch bezüglich schwerwiegenden unerwünschten Ereignissen und dem Ressourcenverbrauch, gemessen in Schweizer Franken, gab es keine Unterschiede zwischen den Gruppen.

Mehrere Faktoren können Wirksamkeit beeinflussen

«Es ist enttäuschend, die Ergebnisse einer negativen Studie zu lesen in einem Bereich, den wir seit 20 Jahren intensiv erforschen.» Das schrieben die zwei nicht an der Studie beteiligten britischen Forschenden Olga Kostopoulou und Bendan Delaney. Ihr Kommentar zur Studie erschien im gleichen Fachblatt.

Ein einzelnes negatives Ergebnis einer klinischen Studie bedeute aber nicht dringend, dass KI-basierte Systeme für die medizinische Diagnostik unwirksam seien.

Laut dem Kommentar könnten mehrere Faktoren die Wirksamkeit des KI-Systems beeinflusst haben. So könnte das KI-System zu spät im diagnostischen Prozess eingesetzt worden sein, wie die Forschenden argumentierten.

Auch psychologische Faktoren könnten demnach eine Rolle gespielt haben. Ärzte neigen laut den Forschenden dazu, ihre anfänglichen Diagnosen zu verteidigen. Daher könnten sie Vorschläge des KI-Systems ignoriert haben, wenn diese ihren eigenen Einschätzungen widersprochen haben.

Fehldiagnosen sollen minimiert werden

Bis zu 15 Prozent aller Patienten, die eine medizinische Behandlung in Anspruch nehmen, erhalten laut dem Inselspital eine Fehldiagnose. Fehldiagnosen gehören somit zu den häufigsten und kostspieligsten medizinischen Problemen weltweit.

Sogenannte computergestützte diagnostische Entscheidungshilfesysteme (auf Englisch «Computerized Diagnostic Decision Support Systems», kurz: CDDSS), die diagnostische Genauigkeit erhöhen. Das medizinische Fachpersonal soll bei der Diagnosestellung unterstützen. Dafür analysieren die Systeme Symptome und Befunde.

Forschung steckt «in den Kinderschuhen»

Die Studienresultate verdeutlichen laut dem Studienleiter Hautz: Computergestützte Diagnosesysteme haben, zumindest in ihrem aktuellen Entwicklungsstand, keinen erheblichen Einfluss auf die diagnostische Qualität in der Notfallmedizin.

Hautz sagt: «Wir müssen andere Lösungsansätze verfolgen, um die Diagnosequalität zu verbessern. Und insbesondere die Forschung zu diesem Thema, die aktuell in den Kinderschuhen steckt, erheblich intensivieren.»