Britische Forscher haben eine neue öffentlich zugängliche Datenbank entwickelt, die hoffentlich mit der Zeit schrumpfen wird. Das liegt daran, dass die Datenbank Tausende von wenig erforschten Proteinen zusammenfasst, die von Genen im menschlichen Genom kodiert werden und deren Existenz bekannt ist, deren Funktionen jedoch größtenteils unbekannt sind.
Die Datenbank mit dem Namen „unknome“ ist das Ergebnis einer Forschung von Matthew Freeman von der Dunn School of Pathology an der Universität Oxford, Großbritannien, und Sean Munro vom MRC Laboratory of Molecular Biology in Cambridge, Großbritannien, und ihren Kollegen. Sie untersuchten einige der Proteine in der Datenbank und stellten fest, dass die meisten zu wichtigen Zellfunktionen beitragen, darunter Entwicklung und Stressresistenz.
Die Sequenzierung des menschlichen Genoms hat deutlich gezeigt, dass das menschliche Genom Tausende möglicher Proteinsequenzen kodiert, deren Identität und Funktion bis heute unbekannt sind. Die Gründe dafür sind multifaktoriell, darunter die Tendenz, knappe Forschungsgelder auf bekannte Ziele zu konzentrieren, und ein Mangel an Werkzeugen, einschließlich Antikörpern, um die Funktion dieser Proteine in Zellen zu untersuchen.
Die Autoren glauben jedoch, dass es riskant ist, diese Proteine zu ignorieren, da es wahrscheinlich ist, dass einige Proteine, vielleicht sogar viele, eine wichtige Rolle in wichtigen zellulären Prozessen spielen und sowohl Erkenntnisse liefern als auch als Ziele für therapeutische Interventionen dienen könnten.
Um eine schnellere Erforschung dieser Proteinklasse zu ermöglichen, haben die Autoren die Unknome-Datenbank erstellt, die jedem Protein einen „Bekanntheitswert“ zuweist, der Informationen in der wissenschaftlichen Literatur zu Funktion, artübergreifender Erhaltung, subzellulärer Kompartimentierung und anderen Elementen widerspiegelt.
Nach diesem System gibt es Tausende von Proteinen mit einem „bekannten Grad“ nahe Null. Dazu gehören Proteine aus Modellorganismen sowie Proteine aus dem menschlichen Genom. Die Datenbank ist für jedermann zugänglich und anpassbar, sodass Benutzer ihre eigenen Gewichtungen für verschiedene Elemente angeben und so ihre eigenen Bekanntheitswerte generieren können, um ihre eigene Forschung zu priorisieren.
Um die Nützlichkeit der Datenbank zu testen, wählten die Autoren 260 Gene beim Menschen aus, die ähnliche Gene bei Fliegen aufweisen und bei beiden Arten einen Bekanntheitsgrad von 1 oder weniger aufweisen, was darauf hindeutet, dass über sie fast nichts bekannt ist. Das vollständige Ausschalten vieler dieser Gene ist mit dem Fliegenleben unvereinbar; Teilweiser oder gewebespezifischer Knockout hat ergeben, dass die meisten Gene an wichtigen Funktionen beteiligt sind, die sich auf Fruchtbarkeit, Entwicklung, Gewebewachstum, Proteinqualitätskontrolle oder Stressresistenz auswirken.
Die Ergebnisse zeigen, dass trotz jahrzehntelanger detaillierter Forschung Tausende von Fliegengenen selbst auf der grundlegendsten Ebene immer noch nicht verstanden sind, und das Gleiche gilt eindeutig für das menschliche Genom. „Diese uncharakterisierten Gene sollten nicht ignoriert werden“, sagte Munro. „Unsere Datenbank bietet eine leistungsstarke, vielseitige und effiziente Plattform zur Identifizierung und Auswahl wichtiger Gene mit unbekannter Funktion für die Analyse und beschleunigt so die Schließung der biologischen Wissenslücke, die durch unbekannte Genome entsteht.“ "
Munro fügte hinzu: „Die Rolle Tausender menschlicher Proteine bleibt unklar, aber die Forschung konzentriert sich tendenziell auf diejenigen, die bereits gut verstanden sind. Um dieses Problem zu lösen, haben wir eine „Unknome“-Datenbank erstellt, die Proteine danach einordnet, wie gut sie bekannt sind, und dann eine Teilmenge dieser mysteriösen Proteine funktionell durchmustert, um zu zeigen, wie Unwissenheit die biologische Entdeckung vorantreibt.“