Bits & Chips: SILVA - eine Datenbank für qualitätsgeprüfte und alignierte rRNA-Sequenzen

Die ribosomale RNA (rRNA) wird seit Jahrzehnten von Forschenden als Marker-Gen zur taxonomischen Klassifikation von Mikroorganismen verwendet. Um eigene Proben mit bekannten Organismen abgleichen zu können, benötigen Forschende verlässliche Referenzdatenbanken. Bis in die früher 2000er Jahre wurden diese Referenzdatenbanken von Hand gepflegt. Danach stieg die Anzahl der verfügbaren Sequenzdaten durch schnellere und günstigere Sequenzierverfahren so schnell an, dass eine semi-automatische Lösung benötigt wurde. Als Antwort auf dieses Problem wurde 2004 das SILVA Projekt ins Leben gerufen, das eine semi-automatische Datenprozessierung ermöglicht. Die aktuelle SILVA Datenbank (138.1, Sequenzdaten von 2019) umfasst 9,4 Millionen rRNA Sequenzen für die kleine Untereinheit (SSU) und 1,3 Millionen für die große Untereinheit (LSU) aus allen drei Domänen des Lebens (Bacteria, Archaea und Eukaryota).

Zum Erstellen eines SILVA-Release werden hunderte Millionen von Sequenzen aus dem European Nucleotide Archive heruntergeladen, nach rRNA-Sequenzen durchsucht, mit zusätzlichen Metadaten verknüpft und automatisch anhand eines manuell kurierten Referenzalignments aligniert. Zwischen den einzelnen Prozessierungsschritten sortieren automatisierte Qualitätsprüfungen auffällige Sequenzen aus. Anschließend werden die Sequenzen mit den höchsten Qualitätsbewertungen anhand ihrer Sequenzähnlichkeit zusammengefasst, um den nicht redundanten SILVA-Referenzdatensatz zu erstellen. Dieser Referenzdatensatz wird dann manuell geprüft sowie taxonomisch klassifiziert, um zur automatischen Klassifikation aller übrigen Sequenzen eines SILVA Datensatzes verwendet werden zu können.

Neben den Datensätzen wird über die SILVA-Webseite auch die Navigation und Suche in den Datensätzen, das Alignieren und Klassifizieren eigener rRNA-Sequenzen, das Testen von Gensonden und Primern sowie die Klassifikation von „next generation amplicon data“ ermöglicht. Zur Zeit arbeitet das SILVA-Team an einer Web-Anwendung, um externen/interessierten Nutzern die Mitarbeit an der Kuration der SILVA-Taxonomie zu ermöglichen.

Ein Vortrag von Dr. Jan Gerken, vom Max Planck Institute fürr Marine Mikrobiologie.

Die Veranstaltungen der Reihe Bits & Chips finden digital via BigBlueButton statt. Die jeweiligen Zugangsdaten erhalten Sie per Mail an <link mail internen link im aktuellen>bits-n-chips[at]th-bingen.de.

Zurück zur Übersicht