Die neueste BBC-Studie ergab, dass Chatbots mit künstlicher Intelligenz immer noch erhebliche Mängel bei der Genauigkeit der Nachrichtenberichterstattung aufweisen, da fast die Hälfte der generierten Inhalte Fehler enthalten. Laut einem von der BBC und 22 anderen europäischen öffentlichen Medienorganisationen gemeinsam veröffentlichten Analysebericht enthielten KI-Chatbots in 18 Ländern und 14 Sprachumgebungen etwa 45 % der Antworten, als sie auf Inhalte von Nachrichtenorganisationen zugegriffen und entsprechende Fragen beantworteten.
Zu diesen Fehlern gehören nicht nur ungenaue Sätze und falsche Anführungszeichen, sondern auch Probleme wie veraltete Informationen, falsche Anführungszeichen und nicht übereinstimmende Quellen. Der Bericht stellt fest, dass Chatbots häufig Links bereitstellen, die nicht mit den tatsächlich zitierten Quellen übereinstimmen, und selbst bei korrekter Zitierung von Material nicht in der Lage sind, Fakten von Meinungen und Satire von legitimem Journalismus zu unterscheiden.
Große Technologieunternehmen, darunter OpenAI, Google, Microsoft usw., fördern aktiv generative KI-Chatbots und integrieren sie tief in Internetplattformen, um Benutzer bei der automatischen Beschaffung und Analyse von Informationen zu unterstützen. Obwohl Entwickler weiterhin viele Ressourcen investieren, um das Phänomen der „Halluzination“ (also der Erstellung von KI-Inhalten) zu reduzieren, zeigen Berichte, dass dieses Problem kurzfristig immer noch schwer vollständig zu lösen ist.
In tatsächlichen Tests wiesen viele gängige KI-Tools wie ChatGPT, Copilot und Gemini erhebliche Fehler auf. Sie geben beispielsweise fälschlicherweise an, dass Papst Franziskus immer noch im Amt sei, obwohl Leo XIV. tatsächlich sein Nachfolger geworden ist. Einige KI gaben sogar korrekt das Sterbedatum von Franziskus an, bezeichneten ihn aber dennoch als den aktuellen Papst. Darüber hinaus gibt es veraltete und falsche Informationen zu relevanten Führungspositionen.

Der Bericht zeigt auch, dass diese Probleme nicht auf eine Region oder Sprache beschränkt sind, sondern auf der ganzen Welt verbreitet sind. Unter ihnen ist Googles Gemini am ungenauesten, da ganze 72 % seiner Antworten erhebliche Quellfehler enthielten. OpenAI hat solche Fehler zuvor darauf zurückgeführt, dass die frühe Version nur bis September 2021 trainiert wurde und es nicht gelang, Echtzeit-Internetinformationen zu erhalten. Es ist jedoch nicht mehr anwendbar. Daher ist das Problem höchstwahrscheinlich auf den Algorithmus selbst zurückzuführen und lässt sich nur schwer durch Datenaktualisierungen beheben.
Obwohl der Anteil schwerwiegender Fehler im Vergleich zum separaten Test der BBC im Februar dieses Jahres von 51 % auf 37 % gesunken ist, hinkt Gemini immer noch anderen Produkten hinterher. Trotz der schlechten Ergebnisse stellten die Forscher fest, dass die britische Öffentlichkeit ein hohes Maß an Vertrauen in die Zusammenfassung von Nachrichten durch KI zeigte: Mehr als ein Drittel der britischen Erwachsenen und fast die Hälfte der Menschen unter 35 Jahren glaubten, dass KI Nachrichteninhalte genau zusammenfassen könne. 42 % der Öffentlichkeit gaben an, dass eine falsche Darstellung der ursprünglichen Nachrichteninhalte durch KI auch die Zuverlässigkeit der Nachrichtenorganisation selbst in Frage stellt oder das Vertrauen in sie verringert. Experten warnen davor, dass die wachsende Beliebtheit generativer KI-Tools den Ruf und die Glaubwürdigkeit der Mainstream-Nachrichtenorganisationen ernsthaft schädigen könnte, wenn solche Probleme weiterhin bestehen.
