Der KI-Spam-Erkennungsmechanismus von Gmail schließt sein größtes Verteidigungs-Upgrade seit Jahren ab. RETVec wird eingeführt, um Sonderzeichen zu identifizieren

Ein aktueller Beitrag im Google-Sicherheitsblog beschreibt neue Upgrades der Spam-Filter von Gmail, die Google als „eines der größten Verteidigungs-Upgrades der letzten Jahre“ bezeichnet. Das Upgrade erfolgt in Form eines neuen Textklassifizierungssystems namens RETVec (Resilient Efficient Text Vectorizer). Laut Google hilft dies dabei, „kontroverse Textmanipulation“ zu verstehen – E-Mails voller Sonderzeichen, Emojis, Tippfehler und anderer Junk-Zeichen, die zuvor für Menschen lesbar waren, für Maschinen jedoch nicht leicht zu verstehen waren. Bisher konnten mit Sonderzeichen gefüllte Spam-Mails die Abwehrmechanismen von Gmail problemlos umgehen.

Wenn Sie sich ein Bild davon machen möchten, wie „kontradiktorische Textverarbeitung“ aussieht, finden Sie Folgendes in meinem Spam-Ordner:

Meine persönliche Erfahrung ist, dass diese E-Mails in der ersten Jahreshälfte ein großes Problem darstellten und ich sie ziemlich oft in meinem Posteingang sah. Dieses RETVec-Technologie-Upgrade scheint jedoch einen Unterschied gemacht zu haben, da ich in den letzten Monaten überhaupt keine E-Mails dieser Art erhalten habe.

E-Mails wie diese sind schwer zu klassifizieren, da jeder Spam-Filter wahrscheinlich eine E-Mail mit der Aufschrift „Herzlichen Glückwunsch! Ihr Gewinnkontostand beträgt 1.000 US-Dollar“ abfängt, der eigentliche Inhalt der E-Mail jedoch nicht so hoch ist. Die meisten Buchstaben hier sind „Homophone“ – wenn Sie in die endlosen Tiefen des Unicode-Standards eintauchen, können Sie obskure Zeichen finden, die aussehen, als wären sie Teil des regulären lateinischen Alphabets, es aber nicht sind.

Beispielsweise ist das Thema „Check_Your_Account“ seltsamerweise fett, nicht weil es einen fetten Stil hat, sondern weil es ein Unicode-Glyph wie „Math Bold Capital C“ verwendet. Es ist ein mathematisches Symbol, das für Menschen zufällig wie der Buchstabe „C“ aussieht, aber Spam-Filter-Bots sehen es genau als mathematisches Symbol und verstehen seine englische Bedeutung nicht. Je genauer man sich eine E-Mail wie diese ansieht, desto schlimmer wird es: Das „O“-Zeichen in „CONGRATULATIONS“ wird durch eine 0 ersetzt, der Unterstrich in „Jackpot“ ist so seltsam, dass er nicht einmal in einer Unicode-Suche gefunden werden kann, und viele Leerzeichen werden durch Punkte oder Unterstriche ersetzt. Das hat zur Folge, dass Spam-Filter kapitulieren, wenn sie diese unordentlichen E-Mails sehen.

Laut Google ist RETVec hier, um uns zu retten: „RETVec ist darauf trainiert, Operationen auf Zeichenebene zu widerstehen, einschließlich Einfügungen, Löschungen, Tippfehlern, Homophonen, LEET-Ersetzungen und mehr. RETVec-Modelle werden auf einem neuartigen Zeichenkodierer trainiert, der alle UTF-8-Zeichen und -Wörter effizient kodiert. Daher benötigt RETVec keine Nachschlagetabellen oder festen Vokabulare und läuft in mehr als 100 Sprachen.“

Effizienz ist sehr wichtig. Andere Methoden, die „festes Vokabular“ oder homophone „Nachschlagetabellen“ verwenden, sind zur Laufzeit sehr ressourcenintensiv. Stellen Sie sich vor, wenn ein oder mehrere „Glückwunschzeichen“ durch Zahlen, mathematische Symbole, kyrillische Buchstaben, Hebräisch oder Emoticons ersetzt würden, dann würden alle möglichen Schreibweisen und Rechtschreibfehler in einer schier endlosen Liste auftauchen. Google sagt, dass RETVec nur 200.000 Parameter hat, „nicht Millionen“, also ist die Spam-Filter-Cloud von Google zwar groß genug, um alles auszuführen, aber klein genug, um sogar auf lokalen Geräten zu laufen. RETVec ist Open Source und Google hofft, dass es die Welt von dieser Art homophoner Angriffe in verschiedenen Kodierungen befreien wird.

RETVec scheint ähnlich wie menschliches Lesen zu funktionieren: Es handelt sich um ein TensorFlow-Modell für maschinelles Lernen, das visuelle „Ähnlichkeit“ verwendet, um die Bedeutung von Wörtern zu identifizieren, und nicht den tatsächlichen Zeicheninhalt der Wörter. Googles „Ähnlichkeits“-Demo nutzte dieselbe Technologie, um Bilder von Katzen zu identifizieren, daher scheint es machbar, daraus das fortschrittlichste optische Zeichenerkennungssystem der Welt zu machen.

Dieser Ansatz hat eindeutig zu großen Verbesserungen geführt, wobei Google angibt, dass „das Ersetzen des vorherigen Textvektorisierers im Spam-Klassifikator von Gmail durch RETVec unsere Spam-Erkennungsrate gegenüber dem Ausgangswert um 38 % verbesserte und Fehlalarme um 19,4 % reduzierte. Darüber hinaus reduzierte der Einsatz von RETVec die TPU-Nutzung des Modells um 83 %, was den Einsatz von RETVec zu einem der größten Verteidigungs-Upgrades der letzten Jahre machte.“

Google sagte, es „teste RETVec im vergangenen Jahr intern und habe es auf Ihrem Gmail-Konto eingeführt“.