Der Bereich der KI bedauert den Weggang einer Generation von Giganten, und SenseTime hat seitdem einen Gründer verloren, der wie ein Vorbild war. Am 16. Dezember veröffentlichte SenseTime offiziell einen Nachruf.Tang Xiaoou, Gründer von SenseTime Technology, Wissenschaftler für künstliche Intelligenz, Direktor des Pujiang Laboratory, Direktor des Shanghai Artificial Intelligence Laboratory und Professor an der Chinesischen Universität Hongkong, starb im Alter von 55 Jahren, nachdem die Behandlung krankheitsbedingt fehlgeschlagen war.
Tang Xiaoous jüngster öffentlicher Auftritt fand im Juli auf der World Artificial Intelligence Conference (WAIC) 2023 statt.Damals erzählte Tang Xiaoou in seiner Rede die Geschichten seiner drei Schüler Wang Xiaogang, He Kaiming und Lin Dahua, die ihre Träume im Bereich Deep Learning verfolgten, und würdigte: „Ich habe dich nicht zum besten Zeitpunkt getroffen, aber ich habe dich kennengelernt und hatte die beste Zeit.“
Unmittelbar danach vergaß Tang Xiaoou nicht, damit die aktuelle Angst, dass große KI-Modelle den Menschen ersetzen könnten, ins Lächerliche zu ziehen, indem er sagte: „Jeden Abend vor dem Schlafengehen höre ich mir das Gespräch von Lehrer Yu Qian an und denke: ‚Wie kann eine Maschine eine so interessante Seele übertreffen? Das glaube ich nicht.‘“
Neben seinem Status als KI-Guru trat die Seite von Tang Xiaoou, der von der Branche als „durch künstliche Intelligenz verzögerter Talkshow-Meister“ bewertet wird, erneut vor die Öffentlichkeit.
Nachdem sie die Nachricht von Tang Xiaoous Tod gehört hatten, veröffentlichten viele seiner Schüler Beileidsbekundungen. Xu Li, Mitbegründer, Vorsitzender und CEO von SenseTime, verabschiedete sich von seinem Mentor: „Diese wunderbare Zeit haben wir erst, nachdem wir Sie kennengelernt haben.“
Auch Yang Fan, der mit Tang Xiaoou bei Microsoft Research Asia zusammenarbeitete und später Mitbegründer von SenseTime wurde, drückte sein Beileid aus: „Siebzehn Jahre scheinen gestern zu sein.“ Tang Xiaoou wurde von Yang Fan als der wichtigste Führer, Anführer und Unterstützer seiner gesamten Karriere angesehen.
Yan Shuicheng, der als Postdoc bei Tang Xiaoou (derzeit Co-CEO von Tiangong Intelligence und Direktor des Kunlun Wanwei 2050 Global Research Institute) arbeitete, erinnerte in seinem Beileid noch einmal an die Vergangenheit zwischen Meister und Lehrling. Er glaubte, dass es Tang Xiaoou war, der in den letzten zwei Jahrzehnten viele herausragende Schüler ausgebildet hatte. Jetzt haben diese Studenten die Möglichkeit, „Chinas Computer Vision von der Ebene auf den Gipfel des Mount Everest zu heben“.
Aber was SenseTime betrifft, das Ergebnis der Kommerzialisierung der KI durch Tang Xiaoou, ist es noch lange nicht der „Everest“ der Branche, und es gibt immer noch unendlich viele gefährliche Gipfel, die seine Nachfolger erklimmen müssen.
Tang Xiaoou wurde 1968 in Anshan, Provinz Liaoning, geboren. Im Alter von 17 Jahren wurde Tang Xiaoou in die Abteilung für Präzisionsmaschinen und Präzisionsinstrumente der Universität für Wissenschaft und Technologie Chinas aufgenommen. 1991 ging Tang Xiaoou für weitere Studien in die USA und erhielt einen Master-Abschluss von der University of Rochester und einen Doktortitel vom Massachusetts Institute of Technology.
Während seines Doktoratsstudiums am MIT kam Tang Xiaoou erstmals mit Gesichtserkennungsalgorithmen in Kontakt.Zu dieser Zeit entwickelte das Labor, dem Tang Xiaoou beitrat, Unterwasserroboter, die dem Einsatz von Sonar- und visuellen Kameras unter Wasser zur Erkundung der Unterwasserwelt entsprachen. „Bevor ich dorthin ging, hatte dieses Labor gerade die Titanic entdeckt, also fand ich es damals cool.“ Seitdem hat Tang Xiaoou ein Leben lang auf dem Gebiet der KI-Vision geforscht.
Nach ihrem Doktortitel am MIT ging die 28-jährige Tang Xiaoou an die Chinesische Universität Hongkong, um dort zu unterrichten. Zu dieser Zeit war die Bildverarbeitung ein Mangel an der Abteilung für Informationstechnik der Hong Kong Chinese University, und Tang Xiaoou hoffte, diesen Mangel auszugleichen.
Die Chinesische Universität Hongkong
Im Juli 2001 gründete Tang Xiaoou das Multimedia Laboratory (MMLab).Die Hauptforschungsrichtungen sind Systemleistung und Gesichtserkennung. Da die Computer-Vision-Technologie damals noch ein hochmodernes Nischengebiet war, war es für Tang Xiaoou nicht nur schwierig, Forschungsgelder zu beantragen, sondern es war auch noch schwieriger, gute Studenten zu rekrutieren. Einheimische Studenten aus Hongkong waren zu dieser Zeit eher geneigt, für weitere Studien in die Vereinigten Staaten zu gehen.
Tang Xiaoou richtete sein Augenmerk auf das Festland und dachte zunächst an seine Alma Mater, die Universität für Wissenschaft und Technologie Chinas. Li Xuelong wurde als erster Student zum Studium im MMLab eingeladen.
Lin Dahua, ein weiterer Schüler von Tang Xiaoou, betrachtet Tang Xiaoou direkt als einen „berühmten HR-Lehrer“ in seiner Karriereentwicklung.Bei der Rekrutierung von Studenten nutzte Tang Xiaoou zwei Hauptmethoden: Erstens nutzte er MMLab als Sprungbrett für Studenten, um sich für weitere Studien an renommierten Schulen zu bewerben, um ihnen dabei zu helfen, erfolgreich Angebote von renommierten Schulen zu erhalten. Zweitens werden die Schüler aufgefordert, fleißig zu lernen.
Während seiner Amtszeit wurde das MMLab der Chinesischen Universität Hongkong zu Chinas „Whampoa Military Academy“ im Bereich Computer Vision. Das Labor wurde 2016 von NVIDIA außerdem zu einem der zehn weltweit führenden Pioniere im Bereich der künstlichen Intelligenz ernannt.
Fast alle zukünftigen Mitbegründer von SenseTime werden von MMLab kommen, wie zum Beispiel SenseTime-CEO Xu Li, Präsident des SenseTime Research Institute Wang Xiaogang, Vizepräsident Lin Dahua usw.
Als sein Sohn 2003 in Peking geboren wurde, nahm Tang Xiaoou, der häufig zwischen Hongkong und Peking reiste, 2005 die Einladung von Microsoft Research Asia an, als Leiter der neu gegründeten Visual Computing-Gruppe zu fungieren.
Mit gesammelter Erfahrung in verschiedenen Bereichen der Industrie, Wissenschaft und Forschung führte Tang Xiaoou eine Gruppe von Schülern an, die zahlreiche Durchbrüche bei den ursprünglichen Deep-Learning-Technologien einleiteten.
Im Jahr 2009 gewannen Tang Xiaoou und sein Doktorand He Kaiming zusammen mit Sun Jian von Microsoft Research Asia mit ihrem Paper „Single Image Dehazing Technology Based on Dark Primary Colors“ den jährlichen „Best Paper Award“ auf der internationalen Spitzenkonferenz IEEE Computer Vision and Pattern Recognition Conference (CVPR). Dies ist das erste Mal seit der Gründung des CVPR, dass ein asiatischer Wissenschaftler diese Auszeichnung erhält.
Von 2011 bis 2013 veröffentlichte das Team von Tang Xiaoou 14 Deep-Learning-Artikel auf ICCV und CVPR, den beiden wichtigsten Konferenzen im Bereich Computer Vision, und machte fast die Hälfte der Gesamtzahl der Deep-Learning-Artikel (29 Artikel) weltweit auf diesen beiden Konferenzen aus.
Ein größerer Schock ereignete sich im Jahr 2014. Im Januar desselben Jahres veröffentlichte Facebook den DeepFace-Algorithmus, der die Genauigkeit der Computer-Gesichtserkennung auf beispiellose 97,35 % verbesserte, was fast den 97,53 % des menschlichen Auges entspricht.
Zwei Monate später veröffentlichte das Team von Tang Xiaoou den Gesichtserkennungsalgorithmus GaussianFace, der die Erkennungsgenauigkeit auf 98,52 % verbesserte und damit zum weltweit ersten Algorithmus für künstliche Intelligenz wurde, der die Erkennungsfähigkeiten des menschlichen Auges übertrifft. Drei Monate später veröffentlichte das Team von Tang Xiaoou sukzessive die DeepID-Algorithmenreihe, wodurch die Erkennungsgenauigkeit weiter auf 99,55 % verbessert wurde.
Eine Erkennungsgenauigkeit, die die des Menschen übertrifft, bedeutet die Möglichkeit einer neuen Kommerzialisierung.Im August 2014 flog IDG Capital-Partner Niu Kuiguang nach Hongkong und stellte dem Team von Tang Xiaoou Startkapital in zweistelliger Millionenhöhe zu einem Wert von 200 Millionen US-Dollar zur Verfügung. Zwei Monate später, im Oktober 2014, wurde SenseTime angekündigt. „Dies ist das einzige Projekt, in das IDG investiert hat, ohne sich das Produkt anzusehen“, sagte Niu Kuiguang.
Als Tang Xiaoou beschloss, ein Unternehmen zu gründen, war es für Professoren noch etwas Neues, „ins Ausland zu gehen“ und an die vorderste Front der Industrie zu gelangen. Einige Leute scherzten, dass sich „Shang Tang“ auf „Professor Tang, der in der Wirtschaft tätig ist“ beziehe.
Nach Tang Xiaoou entschieden sich immer mehr Wissenschaftler, das Labor zu verlassen.Starten Sie entweder Ihr eigenes Unternehmen oder treten Sie einem hochmodernen KI-Unternehmen bei. Unter ihnen wurde He Kaiming Forschungswissenschaftler bei Facebook, Yan Shuicheng kam als CTO zu Yitu Technology und Sun Jian wechselte zu Megvii Technology, um die wichtige Rolle des Chefwissenschaftlers zu übernehmen.
Obwohl das Unternehmen gegründet wurde und den kommerziellen Betrieb aufnahm, ist die Beziehung zwischen älteren Brüdern innerhalb von SenseTime keine Seltenheit. Als Tang Xiaoou Doktorand am MMLab war, behielt auch SenseTime die Gewohnheit bei, gemeinsam Arbeiten zu studieren.
Vor der Börsennotierung umfasste das Technologie-F&E-Team von SenseTime 40 Professoren, mehr als 250 Ärzte und Postdoktoranden sowie 3.593 Wissenschaftler und Ingenieure.
Obwohl sie die weltweit führende Computer-Vision-Technologie kontrollieren, wurden KI-Unternehmen, darunter auch SenseTime, lange Zeit von der Außenwelt nicht begrüßt.
In einer Rede im Jahr 2017 erinnerte sich Tang Xiaoou: „Vor drei Jahren habe ich oft mit Investoren und einigen Unternehmern über künstliche Intelligenz und Deep Learning gesprochen, aber damals haben es alle nicht verstanden und es war ihnen egal.“
Der Wendepunkt kam 2016, als Google AlphaGo startete. Mit dem Sieg von AlphaGo über den Go-Weltmeister Lee Sedol wurde das Konzept der künstlichen Intelligenz populär.
Die Bilderkennung ist zu einem Schwerpunkt der dritten Runde des Booms der künstlichen Intelligenz geworden. Diejenigen, die tief in diesen Track verwickelt sindSenseTime wurde zusammen mit Yitu Technology, Yuncong Technology und Megvii Technology von der Außenwelt als die „Vier kleinen Drachen der KI“ bezeichnet.
Heißes Geld strömt in Strömen. Im Juli 2017 hatte SenseTime mit einer Finanzierung von 410 Millionen US-Dollar gerade einen neuen Finanzierungsrekord im KI-Bereich weltweit aufgestellt. Drei Monate später wurde der Rekord durch Megviis Finanzierung in Höhe von 460 Millionen US-Dollar übertroffen.
Mit Hilfe von Kapital starteten mehrere KI-Unternehmen einen intensiven Sprint, um im Jahr 2020 an die Börse zu gehen.Jedes Unternehmen hat seine technische Stärke durch die Veröffentlichung von Beiträgen auf „hochkarätigen akademischen Konferenzen und Fachzeitschriften“ unter Beweis gestellt, aber jedes Unternehmen hat Probleme mit der Umwandlung von Technologie in Rentabilität. Yitu und Megvii haben ihre Einträge nacheinander ausgesetzt.
Nach 12 Finanzierungsrunden landete SenseTime, das 5,2 Milliarden US-Dollar an Finanzierungen eingeworben hat, am 30. Dezember 2021 erfolgreich an der Hongkonger Börse und wurde zur „ersten KI-Aktie“.Im Mai 2022 gelang Yuncong als zweites inländisches KI-Unternehmen ein Börsengang.
Mit der erfolgreichen Börsennotierung von SenseTime wurde Gründer Tang Xiaoou, der mehr als 20 % der Anteile hält, zu einem der reichsten Professoren Chinas. Tang Xiaoou gilt auch als Pionier bei der Übertragung der Computer-Vision-Technologie aus dem Elfenbeinturm in die Geschäftswelt.
Als technischer Navigator trat Tang Xiaoou offiziell als Vorsitzender zurück, als SenseTime an die Börse ging und begann, sich wieder auf strategische Forschung zu konzentrieren. Was Xu Li und anderen Schülern bleibt, ist eine SenseTime, die dringend die Geschäftsrealisierungskanäle erweitern und Verluste so schnell wie möglich in Gewinne umwandeln muss.
Dem Finanzbericht zufolge deckt das Geschäft von SenseTime hauptsächlich vier Hauptsektoren ab: Smart Business, Smart City, Smart Life und Smart Car. Unter ihnen sind Smart Business und Smart City die wichtigsten. Die beiden großen Sektoren werden mit dem traditionellen Sicherheitsgeschäft verglichen. Allerdings standen sie bereits unter starkem Druck. Sie müssen Wege finden, dem Branchenführer Hikvision den Kuchen zu stehlen, müssen sich aber auch vor der Konkurrenz durch Konkurrenten wie Megvii, Yitu und Yuncong in Acht nehmen.
Um seinen Kommerzialisierungspfad zu erweitern, folgt SenseTime dem Trend und konzentriert sich auf alles vom autonomen Fahren bis zum Metaversum.
Im Juli 2021 veröffentlichte SenseTime offiziell SenseAuto, eine unabhängige Marke für Smart-Car-Lösungen, in der Hoffnung, sie in die zweite Wachstumskurve des Unternehmens einzubauen. Während sich SenseTime auf den Börsengang Ende 2021 vorbereitet, konzentriert es sich erneut auf das Konzept des Metaversums. Das 47-dimensionale Universum wird im Prospekt erwähnt und Produkte wie der digitale Raum Metaverse, digitale Menschen und digitale Sammlungen werden nacheinander auf den Markt gebracht.
Diese Maßnahmen haben SenseTime jedoch nicht dabei geholfen, den Druck auf den Kapitalmarkt zu verringern.Am 30. Juni 2022, nachdem das Verbot von SenseTime-Aktien aufgehoben wurde, brach der Aktienkurs von SenseTime an diesem Tag um 46,7 % ein und sein Gesamtmarktwert sank von einem Höchststand von über 300 Milliarden Hongkong-Dollar auf 100 Milliarden Hongkong-Dollar.
Nachdem der Yuanverse-Trend nachgelassen hatte, änderte SenseTime, das sich intensiv mit ToB- und ToG-Geschäften befasst, seine Richtung und begann, in den ToC-Markt einzusteigen:Im August 2022 wurde das erste künstliche Intelligenzprodukt für Privatanwender auf den Markt gebracht – die Schachversion des KI-Schachspielroboters „Yuanluobot SenseRobot“. Im Juni 2023 wurde die Go-Version des KI-Schachroboters „Yuanluobot SenseRobot“ auf den Markt gebracht.
Allerdings konnten die oben genannten Bemühungen die finanzielle Situation von SenseTime noch immer nicht wirksam verbessern.Von 2018 bis 2022 beliefen sich die bereinigten Nettoverluste von SenseTime auf 150 Millionen Yuan, 1,16 Milliarden Yuan, 880 Millionen Yuan, 1,42 Milliarden Yuan bzw. 4,7 Milliarden Yuan. Im ersten Halbjahr 2023 verzeichnete SenseTime einen bereinigten Nettoverlust von 2,39 Milliarden Yuan.
Was noch schlimmer ist, ist, dass die enormen jährlichen F&E-Investitionen dieser Unternehmen nicht nur keine großen Erträge abwerfen, sondern selbst dann, wenn die F&E-Ausgaben allein im gleichen Zeitraum höher waren als die Einnahmen.
Von 2018 bis 2022 betrug der Umsatz von SenseTime 1,85 Milliarden Yuan, 3,03 Milliarden Yuan, 3,45 Milliarden Yuan, 4,7 Milliarden Yuan bzw. 3,8 Milliarden Yuan. Im ersten Halbjahr 2023 betrug der Umsatz von SenseTime 1,433 Milliarden Yuan.
Zum Vergleich: Die Forschungs- und Entwicklungsinvestitionen von SenseTime beliefen sich im gleichen Zeitraum auf 849 Millionen Yuan, 1,916 Milliarden Yuan, 2,454 Milliarden Yuan, 3,614 Milliarden Yuan bzw. 4,014 Milliarden Yuan. Im ersten Halbjahr 2023 investierte SenseTime 1,783 Milliarden Yuan in Forschung und Entwicklung, was einem neuen Höchstwert von 125 % des Umsatzes entspricht.
Große Modelle sind für SenseTime zu einer weiteren neuen Hoffnung geworden, sich selbst zu retten.Im Juli dieses Jahres wurde das groß angelegte Modellsystem „SenseTime SenseNova“ offiziell vorgestellt, das Multimodellanwendungen wie Grafik, Text, Sprache und Video abdeckt, darunter die Bilderstellungsplattform SenseMirage, die digitale Plattform zur Generierung menschlicher Videos „SenseAvatar“ und die Plattform zur Generierung von 3D-Inhalten „Qiongyu SenseSpace“/„SenseThings“ usw.
Angesichts der Realität, dass der Branchenführer OpenAI jedoch weiterhin Verluste erleidet und es nicht geschafft hat, einen geschlossenen Geschäftspfad zu etablieren, ist es immer noch voller Ungewissheit, wann SenseTime in der Post-Tang-Xiaoou-Ära aus dem Sumpf der Verluste herauskommen kann.
Referenzen:
„Die beste Inschrift der Welt“, Tang Xiaoou
„Hommage an Tang Xiaoou: Der Mann, der Hongkong-Chinesen in die chinesische Huangpu-Militärakademie für Computer Vision eingebaut hat“ Leifeng.com
„Zehn Jahre, in denen KI-Unternehmen 200 Milliarden eingesammelt haben, wollen immer noch nicht verstanden werden“ LatePost
„Shangtang zeigt sein schnelles Handlesen“-Alphabetliste