Niantic verwandelt die AR-Daten von Pokémon Go in eine „lebende Karte“ für Lieferroboter

Niantic verwandelt die gleiche globale AR-Technologie, die Pikachu einst auf realen Bürgersteigen festhielt, in die Steuerung eines bodenständigeren Protagonisten – eines Lieferroboters, der auf der Suche nach der richtigen Hausnummer über den Bürgersteig pendelt. Mithilfe der im Laufe der Jahre gesammelten Positionsdaten und Street View-Bilder bietet das Unternehmen nun zentimetergenaue visuelle Positionierungsdienste für Unternehmen wie Coco Robotics an und löst damit insbesondere das alte Problem, dass herkömmliches GPS in Städten mit Hochhäusern „verloren“ geht.

Niantic Spatial ist ein KI-Spin-off-Unternehmen, das 2025 von Niantic gegründet wurde und sich darauf spezialisiert hat, jahrelange mobile Gaming-Daten in hochpräzise reale „Weltmodelle“ zu destillieren. Der offiziellen Beschreibung zufolge handelt es sich dabei um ein visuelles Positionierungssystem (VPS), das die Position und Lage des Geräts innerhalb eines Zentimeterbereichs bestimmen kann, indem es sich ausschließlich auf Kamerabilder und Kartenkontext verlässt, und über kommerzielle Schnittstellen Dienste für die Außenwelt bereitstellt. Sein erster großer kommerzieller Partner ist Coco Robotics, ein Endauslieferungsunternehmen, das in vielen europäischen und amerikanischen Städten rund tausend Bürgersteigroboter betreibt. Lokale Satellitensignale sind oft zu verrauscht, um zuverlässiges autonomes Fahren zu unterstützen.

Das technische Problem, das Niantic Spatial lösen muss, ist nicht schwer zu beschreiben, aber sehr schwer wirklich zu überwinden: In einer dicht besiedelten städtischen Umgebung werden GPS-Signale zwischen Glasfassaden und Beton reflektiert, und Positionierungsfehler können leicht mehrere zehn Meter betragen. Für einen Lieferroboter reicht diese Abweichung aus, um im falschen Viertel oder sogar auf der anderen Straßenseite zu landen. Cocos Roboter bewegt sich mit einer Geschwindigkeit von etwa fünf Meilen pro Stunde und kann mehrere übergroße Pizzen oder Tüten mit Lebensmitteln auf einmal ausliefern. Wenn es in puncto Pünktlichkeit sowie Abhol- und Liefergenauigkeit mit den menschlichen Fahrgästen mithalten will, muss es auf stabilere und präzisere Navigationsfähigkeiten angewiesen sein.

Die Alternative von Niantic Spatial ist ein visuelles Positionierungssystem, das auf „Sehen“ und nicht auf Funksignalen basiert. Seit Jahren sammelt das Unternehmen Daten von Pokémon Go und seinem früheren Augmented-Reality-Spiel Ingress, die beide Spieler dazu ermutigen, reale Fitnessstudios, Kampfarenen und verschiedene Sehenswürdigkeiten zu besuchen. Dieser Spielmechanismus baut unsichtbar einen dichten Satz globaler städtischer Datensätze auf: Die riesigen Bilder, die von Spielern in der städtischen Umgebung aufgenommen werden, sind genau an den Längen- und Breitengrad, die Kameraausrichtung, die Gerätehaltung, den Bewegungsstatus und andere vom Mobiltelefon aufgezeichnete Sensordaten gebunden.

Laut Niantic Spatial enthalten die Modelltrainingsdaten etwa 30 Milliarden Bilder, die stark um mehr als eine Million „Hotspot“-Standorte gruppiert sind und wiederholt aus verschiedenen Blickwinkeln, zu unterschiedlichen Tageszeiten und bei verschiedenen Wetterbedingungen fotografiert werden. Da jedes Bild einer Posenschätzung auf Zentimeterebene entspricht, stellt dieser Trainingssatz im Wesentlichen eine 3D-Probenahme mit mehreren Ansichten dar, die Stadtstraßen, Zebrastreifen, Ladenfronten und Gebäudefassaden abdeckt. Auf dieser Grundlage kann das Modell aus einer kleinen Anzahl von Bildern, die in Echtzeit aufgenommen wurden, den genauen Standort und die Ausrichtung ableiten, selbst in Gebieten, in denen die ursprüngliche Datenabdeckung nicht so dicht ist wie diese Hotspots.

Für Coco bedeutet das, dass seine Roboter GPS-Signale mit den von Niantic Spatial bereitgestellten Kamerapositionierungsergebnissen verknüpfen können. Jeder Roboter ist mit vier auf „Hüfthöhe“ installierten Kameras ausgestattet, um aus vier Richtungen zu fotografieren. Diese Perspektive unterscheidet sich von der eines Menschen, der ein Mobiltelefon in der Hand hält, aber Coco sagte, dass die Anpassung dieser Art von Daten an bestehende Modelle relativ intuitiv sei. Derzeit haben diese Roboter Hunderttausende Lieferungen in Los Angeles, Chicago, Miami, Jersey City, Helsinki und anderen Orten durchgeführt und insgesamt mehr als eine Million Meilen zurückgelegt, was dem Unternehmen eine Grundlage für die Bewertung der Zuverlässigkeitsverbesserung des neuen Systems liefert.

Die visuelle Positionierung an sich ist kein neues Konzept, wird jedoch seit langem durch die Sammlungsdichte und Abdeckung hochwertiger Bilder eingeschränkt. Niantic Spatial geht davon aus, dass das Volumen und die Vielfalt seiner Crowdsourcing-Gaming-Daten die Konkurrenz übertreffen wird, die sich zum Sammeln von Karten hauptsächlich auf ihre eigenen Sensorflotten verlässt. Einige andere Hersteller von Lieferrobotern (z. B. Starship Technologies) erstellen in der Regel mithilfe ihrer eigenen Sensoren lokale 3D-Karten auf der Laufstrecke, zeichnen Bordsteine, Straßenschilder, Gebäudeumrisse usw. auf und verwenden diese Karten dann bei nachfolgenden Fahrten wieder. Im Gegensatz dazu hofft Niantic Spatial, ein weltweit gemeinsames Geodatenmodell beizubehalten und es über eine API jedem Roboter, Telefon oder Headset zur Verfügung zu stellen, der eine präzise Positionierung benötigt.

Niantic nennt dieses Modell eine „lebende Karte“: eine virtuelle Darstellung der Welt, die jederzeit mit Sensoren aktualisiert wird. Während Cocos Roboter und weitere zukünftige Partner durch Straßen und Gehwege navigieren, werden ihre Sensoren weiterhin neue Beobachtungen liefern, die zur Korrektur und Erweiterung der zugrunde liegenden Karte von Niantic Spatial verwendet werden. Das Ziel ist nicht nur geometrische Genauigkeit, sondern auch semantisches Verständnis – das Kommentieren und Beschreiben verschiedener Arten von Objekten in einer Karte auf maschinenverständliche Weise.

Niantic-Führungskräfte betrachten die Bemühungen als Teil einer langfristigen Weiterentwicklung digitaler Karten und nicht als völlige Umkehrung. Von 2D-Karten über 3D bis hin zur analogen Welt und hin zu dynamischen „digitalen Zwillingen“ bleibt die Kernverbindung zwischen Kartenkoordinaten und physischem Raum unverändert. Was sich wirklich verändert hat, ist der „Hauptkonsument“ solcher Karten: vom Menschen in der Vergangenheit bis hin zu Maschinen. Aus dieser Perspektive wird die räumliche Intelligenz, mit der sichergestellt wurde, dass das virtuelle Pikachu sicher auf dem Bürgersteig stand, nun auf einen Lieferroboter übertragen, der hundert Pfund wiegt und bei Wind, Regen und Verkehr eine stabile Route beibehalten muss.