Google lässt die künstliche Intelligenz von Bard lernen, an sich selbst zu zweifeln und versucht, widersprüchliche Informationen zweimal zu überprüfen

Sprechen wir heute über die Weiterentwicklung von Bard, Googles Antwort auf ChatGPT, und darüber, wie es eines der dringendsten Probleme heutiger Chatbots löst: die Tendenz von Chatbots, Dinge zu erfinden.

Seit der Einführung von Chatbots im letzten Jahr haben uns ihre Entwickler davor gewarnt, ihnen zu vertrauen. Der von Tools wie ChatGPT generierte Text basiert nicht auf einer Datenbank mit fundierten Fakten. Stattdessen ist der Chatbot prädiktiv und macht probabilistische Vermutungen darüber, welche Wörter auf der Grundlage eines großen Textkorpus, der auf dem zugrunde liegenden großen Sprachmodell trainiert wurde, korrekt erscheinen.

Infolgedessen machen Chatbots im Branchenjargon oft „selbstbewusst Fehler“. Dies kann selbst hochgebildete Menschen täuschen, wie wir dieses Jahr gesehen haben, als ein Anwalt von ChatGPT generierte Zitate einreichte, ohne zu bemerken, dass jeder Fall aus der Luft gegriffen war.

Diese Situation erklärt, warum ich Chatbots als Forschungsassistenten meist für nutzlos halte. Sie werden Ihnen innerhalb von Sekunden alles sagen, was Sie wollen, aber in den meisten Fällen werden sie ihre Arbeit nicht zitieren. Daher müssen Sie viel Zeit damit verbringen, zu recherchieren, ob ihre Antworten wahr sind – was oft den Zweck der Verwendung eines Chatbots von vornherein zunichte macht.

Als Bard von Google Anfang dieses Jahres auf den Markt kam, verfügte es über eine „GoogleIt“-Schaltfläche, über die Ihre Anfrage an die Suchmaschine des Unternehmens weitergeleitet wurde. Dadurch können Sie zwar schneller eine zweite Meinung zu den Ergebnissen des Chatbots einholen, es liegt aber dennoch in Ihrer Verantwortung, zu entscheiden, ob diese wahr oder falsch sind.

Aber ab heute wird Bard mehr für Sie tun. Nachdem der Chatbot eine Ihrer Fragen beantwortet hat, klicken Sie auf die Google-Schaltfläche, um Ihre Antwort zu „überprüfen“. So erklärte das Unternehmen es in einem Blogbeitrag:

Wenn Sie auf das „G“-Symbol klicken, liest „Bard“ Ihre Antworten und bewertet, ob es im Web Inhalte gibt, die Ihre Antworten bestätigen. Wenn der Anspruch bewertet werden kann, können Sie auf den hervorgehobenen Begriff klicken, um mehr über unterstützende oder widersprüchliche Informationen zu erfahren, die bei der Suche gefunden wurden.

Bei genauer Betrachtung der Abfrage werden viele Sätze in den Antworten grün oder braun. Grün hervorgehobene Antworten verweisen auf die verweisende Webseite. Bewegen Sie Ihre Maus über eine dieser Seiten und Bard zeigt Ihnen, woher die Informationen stammen. Braun hervorgehobene Antworten weisen darauf hin, dass Bard die Quelle der Nachricht nicht kennt und dass es sich bei der Hervorhebung möglicherweise um einen Fehler handelt.

Als ich zum Beispiel Bards Antwort auf meine Frage zur Geschichte der Band Radiohead noch einmal überprüfte, gab es viele grün hervorgehobene Sätze, die meinem eigenen Wissen entsprachen. Aber es lässt den Satz auch braun werden: „Sie haben zahlreiche Auszeichnungen gewonnen, darunter sechs Grammy Awards und neun Brit Awards.“ Wenn Sie mit der Maus über diesen Satz fahren, werden in den Google-Suchergebnissen widersprüchliche Informationen angezeigt. Tatsächlich hat Radiohead noch nie einen einzigen Brit Award gewonnen, geschweige denn neun.

„Ich werde Ihnen von einer Tragödie erzählen, die sich in meinem Leben ereignet hat“, sagte mir Jack Krawczyk, Senior Director of Product bei Google, letzte Woche in einem Interview.

Krawczyk kochte zu Hause Schwertfisch und der Geruch des Kochvorgangs schien das ganze Haus zu durchdringen. Er benutzte Bard, um nach Möglichkeiten zur Desodorierung zu suchen, und untersuchte dann die Ergebnisse, um Fakten von Fiktionen zu unterscheiden. Es stellt sich heraus, dass eine gründliche Reinigung der Küche das Problem nicht löst, wie der Chatbot ursprünglich sagte. Es kann jedoch hilfreich sein, Schüsseln mit Natron im Haus aufzubewahren.

Krawczyk erzählte mir, dass eine doppelte Überprüfung oft nicht notwendig sei, da die Menschen Bard auf so viele verschiedene Arten nutzen. (Normalerweise würden Sie es nicht bitten, ein von Ihnen geschriebenes Gedicht oder eine von ihm verfasste E-Mail usw. noch einmal zu überprüfen.)

Obwohl eine doppelte Überprüfung eine deutliche Verbesserung darstellt, müssen Sie häufig dennoch alle Zitate herausziehen und sicherstellen, dass Bard diese Suchergebnisse richtig interpretiert. Zumindest in der Forschung hält der Mensch immer noch die Hand der KI, genauso wie die KI unsere Hand hält.

Dies ist jedoch eine erfreuliche Entwicklung.

„Wir haben möglicherweise das erste Sprachmodell erstellt, das zugibt, dass es einen Fehler gemacht hat“, sagte Krawczyk. „Angesichts der Bedeutung der Verbesserung dieser Modelle sollte es für die Branche oberste Priorität haben, sicherzustellen, dass KI-Modelle Fehler genau zugeben.“

Am Dienstag erhielt Bard ein weiteres großes Update: Es kann jetzt eine Verbindung zu Gmail, Docs, Drive und einigen anderen Google-Produkten, einschließlich YouTube und Maps, herstellen. Mit der sogenannten Erweiterung können Sie in Ihrem Google-Konto gespeicherte Dokumente in Echtzeit durchsuchen, zusammenfassen und Fragen stellen.

Derzeit ist es auf persönliche Konten beschränkt, was seine Nützlichkeit stark einschränkt, aber als alternative Möglichkeit, im Internet zu surfen, macht es manchmal Spaß – als ich es beispielsweise bat, mir ein paar tolle Videos über den Einstieg in die Innenarchitektur zu zeigen, hat es großartige Arbeit geleistet. (Schön, dass diese Videos online im Bard-Antwortfenster abgespielt werden können.)