Am 15. April berichtete Bloomberg, dass eine neue Studie zeigt, dass KI-gesteuerte Chatbots bei der Bereitstellung medizinischer Ratschläge in etwa der Hälfte der Fälle Antworten auf problematische Fragen geben. Die Entdeckung verdeutlicht die Gesundheitsrisiken von KI, einer neuen Technologie, die zunehmend in das tägliche Leben integriert wird.
Forscher aus den USA, Kanada und dem Vereinigten Königreich bewerteten fünf führende KI-Plattformen: ChatGPT, Gemini, Meta AI, Grok und DeepSeek, indem sie jeder Plattform 10 Fragen in fünf Gesundheitskategorien stellten. Laut einer Studie, die diese Woche in der medizinischen Fachzeitschrift BMJ Open veröffentlicht wurde, wurden etwa 50 % aller Antworten dieser KI-Chatbots als „problematisch“ eingestuft, fast 20 % wurden als „höchst fragwürdig“ eingestuft.
Die Studie ergab, dass diese Chatbots bei verschiedenen Arten von Fragen deutlich unterschiedliche Leistungen erbrachten: Bei geschlossenen Fragen (Antworten stehen fest) und Fragen zu Impfstoffen und Krebs schnitten sie relativ besser ab, bei offenen Fragen und in Bereichen wie Stammzellenforschung und Ernährung schnitten sie jedoch schlechter ab.

Gelb bedeutet, dass ein Problem vorliegt, Orange bedeutet, dass ein Höhenproblem vorliegt
Die Forscher sagten, dass die Antworten oft in einem selbstbewussten und sicheren Ton erfolgten, aber keiner der Chatbots lieferte als Antwort auf irgendeine Aufforderung eine vollständige und genaue Referenzliste. Während der gesamten Studie lehnte der Chatbot die Beantwortung von Fragen nur zweimal ab, beide von Meta AI.
Die Ergebnisse verdeutlichen die wachsende Besorgnis darüber, dass Menschen zunehmend generative KI-Plattformen nutzen, um medizinischen Rat einzuholen, diese Plattformen jedoch nicht für die Bereitstellung medizinischer Ratschläge lizenziert sind und nicht über das klinische Urteilsvermögen verfügen, das für die Erstellung einer Diagnose erforderlich ist.
Die explosionsartige Verbreitung von KI-Chatbots hat sie zu einem beliebten Tool für Menschen gemacht, die Rat zu ihrer Krankheit suchen. Laut OpenAI wenden sich jede Woche mehr als 200 Millionen Menschen mit Fragen zu Gesundheit und Wohlbefinden an ChatGPT. Die Plattform kündigte im Januar dieses Jahres an, separate Gesundheitstools für allgemeine Benutzer und Ärzte auf den Markt zu bringen. Im selben Monat kündigte Anthropic außerdem an, mit seinem Claude-Produkt einen neuen Gesundheitsdienst einzuführen.
Die Autoren der in BMJ Open veröffentlichten Studie sagten, ein erhebliches Risiko bestehe darin, dass Chatbots die Verbreitung von Fehlinformationen verstärken könnten, wenn sie ohne öffentliche Aufklärung und Regulierung eingesetzt würden.
Sie sagten, die Ergebnisse „zeigen wichtige Verhaltenseinschränkungen der KI auf und legen nahe, dass die Art und Weise, wie KI-Chatbots in der öffentlichen Gesundheits- und medizinischen Kommunikation eingesetzt werden, neu bewertet werden muss.“ Sie stellen außerdem fest, dass diese Systeme häufig in der Lage sind, „maßgeblich klingende, aber möglicherweise fehlerhafte Antworten“ zu generieren.