Die Harvard Law School Library gab heute den Start der Institutional Data Initiative bekannt, einer Forschungsinitiative, durch die die Harvard Law School Library mit Bibliotheken, Museen, Regierungsbehörden und anderen Institutionen zusammenarbeiten wird, um ihre Sammlungen in Datenform zu veröffentlichen. Diese Daten können für verschiedene Zwecke verwendet werden, einschließlich des Trainings von Modellen für künstliche Intelligenz.
Die Institutional Data Initiative (IDI) wird sich zunächst auf die Verfeinerung der 1 Million gemeinfreier Bücher konzentrieren, die von Harvard Libraries gescannt wurden. Außerdem wird es mit der Boston Public Library zusammenarbeiten, um Millionen Seiten historischer Zeitungen als Daten verfügbar zu machen. Obwohl es sich bei diesen Datensätzen um Langtexte handelt, möchte IDI mit anderen Institutionen zusammenarbeiten, um Daten in verschiedenen Formaten zu entwickeln, einschließlich wissenschaftlicher und biomedizinischer Daten.
Der Start von IDI wird von Microsoft und OpenAI unterstützt. Zur langfristigen Finanzierung plant IDI eine Partnerschaft mit mehreren Wohltätigkeitsorganisationen und Unterstützern der Industrie.
Microsoft-Vizepräsident und stellvertretender General Counsel Burton Davis äußerte die folgenden Ansichten zu IDI:
„Microsoft ist stolz darauf, die Gründung der Institutional Data Initiative zu unterstützen, die sich dafür einsetzen wird, den Zugang zu Wissen und hochwertigen Daten für alle KI-Entwickler zu verbessern. Wir setzen uns dafür ein, einen breiten Zugang zu Daten zu ermöglichen und ein integrativeres KI-Ökosystem zu ermöglichen. Seit 2020 arbeiten wir daran, die Datenkluft zu schließen und sicherzustellen, dass jede Organisation Zugriff auf die Daten hat, die sie für Innovationen und mehr Leistung benötigt, was für das Wachstum einer dynamischen und wettbewerbsfähigen KI-Wirtschaft von entscheidender Bedeutung ist.“
Microsoft war schon immer davon überzeugt, dass jeder von der Zusammenarbeit rund um offene und verfügbare Daten profitieren kann. Tatsächlich startete Microsoft bereits im Jahr 2020 eine Open-Data-Bewegung, über die Unternehmen jeder Größe auf die Daten zugreifen können, die für die Entwicklung von Anwendungen für künstliche Intelligenz erforderlich sind.
Tom Rubin, OpenAI-Direktor für geistiges Eigentum und Inhalte, sagte Folgendes zum Start von IDI:
„Akademische Institutionen sind seit langem wichtige Partner in der KI-Forschung und -Entwicklung, und die Institutional Data Initiative der Harvard University ist ein starkes Beispiel. Der öffentliche Raum spielt eine entscheidende Rolle bei der Verbreitung von Wissen und Kreativität, und OpenAI freut sich, diese Bemühungen zu unterstützen. Wir sind von der Führung von Professor Zittrain bei diesem wichtigen Projekt inspiriert und freuen uns sehr darauf, die Auswirkungen zu sehen, die es haben wird.“
Durch die Bereitstellung leicht zugänglicher großer Datensätze trägt IDI zur Weiterentwicklung der Technologie der künstlichen Intelligenz und ihrer Zugänglichkeit für alle bei.